OpenRouter vừa đóng vòng Series B trị giá 113 triệu USD do CapitalG (quỹ đầu tư tăng trưởng của Alphabet) dẫn dắt, đẩy định giá lên 1,3 tỷ USD — gấp đôi so với vòng Series A năm ngoái. Con số đáng chú ý nhất không phải là số tiền, mà là khối lượng token xử lý: 25 nghìn tỷ token mỗi tuần, tăng 5 lần chỉ trong 6 tháng.
OpenRouter Là Gì Và Tại Sao Developer Đang Dòng Dạt Đến Nó?
OpenRouter là một lớp API trung gian giữa ứng dụng của bạn và hàng loạt nhà cung cấp AI. Thay vì phải đăng ký riêng biệt với Anthropic, Google, OpenAI, xAI, DeepSeek rồi tự quản lý billing, fallback, rate limit cho từng bên — bạn chỉ cần một API key duy nhất từ OpenRouter để truy cập hơn 400 model.
Mình dùng OpenRouter từ cuối 2024, ban đầu chỉ để test nhanh các model mới mà không cần tạo tài khoản từng nơi. Nhưng khoảng 6 tháng nay, nó đã trở thành API chính cho hầu hết project của mình. Lý do đơn giản: một endpoint duy nhất, compatible với format OpenAI, đổi model chỉ bằng cách sửa một dòng code.
Model Trung Quốc Chiếm 60% Lưu Lượng — Điều Này Nói Lên Điều Gì?
Theo dữ liệu từ chính OpenRouter, các model Trung Quốc (DeepSeek, Kimi, MiniMax, GLM) đã tăng từ khoảng 1-2% lưu lượng đầu 2025 lên hơn 60% vào tháng 5/2026. Mình không ngạc nhiên lắm — mình test DeepSeek V4 tuần trước, thấy coding quality gần ngang GPT-5.5 mà giá rẻ hơn 5-10 lần. Developer đang route task ít quan trọng sang model rẻ, giữ model đắt cho task cần capability cao. Đó chính là multi-model routing trong thực tế.
So Sánh OpenRouter Với AWS Bedrock, Azure AI Foundry, Google Vertex
Bảng so sánh nhanh 4 lựa chọn multi-model routing phổ biến nhất hiện nay:
| Tiêu chí | OpenRouter | AWS Bedrock | Azure AI Foundry | Google Vertex |
|---|---|---|---|---|
| Số lượng model | 400+ | ~50 | ~40 | ~60 |
| Model mới nhất | Có trong vài giờ | Vài tuần | Vài tuần | Nhanh (Google model) |
| Developer UX | Đơn giản nhất | Phức tạp | Trung bình | Trung bình |
| Enterprise SLA | Đang xây dựng | Mạnh | Mạnh | Mạnh |
| Provider-neutral | Hoàn toàn | Không (AWS ưu tiên) | Không (Azure ưu tiên) | Không (Google ưu tiên) |
| Chi phí | Tương đương gốc | Markup nhẹ | Markup nhẹ | Markup nhẹ |
Điểm mạnh lớn nhất của OpenRouter so với các hyperscaler là provider-neutral. AWS Bedrock ưu tiên model chạy trên AWS infrastructure, Azure ưu tiên model chạy trên Azure. OpenRouter không có incentive đẩy bạn về model nào — nó route dựa trên cost, latency, capability mà bạn chọn.
Danh Sách Nhà Đầu Tư Nói Lên Tầm Nhìn
Vòng này không chỉ có CapitalG. Cùng tham gia còn có NVIDIA Ventures, MongoDB Ventures, Snowflake Ventures, Databricks Ventures, ServiceNow Ventures, cùng các nhà đầu tư cũ Andreessen Horowitz và Menlo Ventures.
Mỗi nhà đầu tư chiến lược kể trên đều có sản phẩm tích hợp AI. MongoDB cần AI routing cho Atlas Vector Search. Snowflake và Databricks cần routing cho data pipeline AI. ServiceNow cần cho enterprise workflow. Họ đầu tư không chỉ vì lợi nhuận — mà vì muốn equity trong hạ tầng AI mà chính họ đang sử dụng.
5 Lý Do Mình Nghĩ Multi-Model Là Tương Lai Của AI Infrastructure
- Không một model nào thắng tuyệt đối. GPT-5.5 giỏi coding, Claude Opus 4.7 giỏi writing, Gemini 3.5 Flash nhanh nhất, DeepSeek V4 rẻ nhất. Mỗi task cần model khác nhau.
- Giá chênh lệch lớn. Giữa model đắt nhất và rẻ nhất có sự chênh lệch 10-50 lần. Routing thông minh tiết kiệm chi phí đáng kể.
- Model mới ra liên tục. Mỗi quý có thêm model credible, không phải bớt đi. Catalog value tăng theo thời gian.
- Dữ liệu benchmark thực tế. Nền tảng routing thu thập data performance trên production workload — data này không model provider nào có. Đây là moat thực sự.
- Enterprise cần governance. Audit trail, data residency, access control — các yêu cầu compliance đẩy enterprise về routing layer chuyên nghiệp.
Những Rủi Ro Cần Biết
Mình không viết bài quảng cáo, nên đây là phần mình muốn nói thẳng. OpenRouter có ba rủi ro chính:
Thứ nhất, biên lợi nhuận. Model đang rẻ đi 10 lần mỗi 18 tháng. Nếu giá model giảm mà OpenRouter markup theo tỷ lệ cố định, doanh thu tuyệt đối trên mỗi query sẽ teo lại. Họ phải chạy nhanh để bù bằng volume.
Thứ hai, cạnh tranh từ hyperscaler. AWS Bedrock, Azure AI Foundry, Google Vertex đều đang tung tính năng multi-model nhanh hơn. Lợi thế developer-first của OpenRouter có thể bị ăn theo.
Thứ ba, phụ thuộc vào model provider. Nếu Anthropic, Google, OpenAI thay đổi terms hoặc pull model, OpenRouter bị ảnh hưởng trực tiếp. Đây là rủi ro cấu trúc của bất kỳ middleman nào.
Developer Việt Nam Nên Dùng OpenRouter Như Thế Nào?
Mình có vài khuyến nghị thực tế sau khi dùng OpenRouter hơn 6 tháng:
Nếu bạn là freelancer hoặc indie developer, hãy dùng OpenRouter cho testing và prototyping. Một API key cho phép bạn thử 400+ model, so sánh output, chọn cái phù hợp nhất cho use case trước khi commit. Chi phí chỉ tính theo token dùng, không phí đăng ký.
Nếu bạn chạy sản phẩm production, kết hợp OpenRouter với fallback logic. Route task chính về model frontier (GPT-5.5, Claude Opus 4.7), task phụ về model rẻ (DeepSeek, Gemini Flash). Mình ước tính tiết kiệm khoảng 60-70% chi phí AI so với dùng单一 model đắt nhất cho mọi task.
Nếu bạn làm enterprise, cân nhắc governance features. OpenRouter đang xây dựng audit trail, data residency, team permission — những thứ compliance yêu cầu. Theo dõi roadmap của họ trước khi quyết định.
Quick Answer
OpenRouter vừa gọi vốn 113 triệu USD Series B do CapitalG dẫn dắt, định giá 1,3 tỷ USD. Nền tảng cung cấp API duy nhất truy cập hơn 400 AI model, xử lý 25 nghìn tỷ token mỗi tuần. Model Trung Quốc chiếm 60% lưu lượng nhờ giá rẻ. Multi-model routing đang trở thành tiêu chuẩn mới khi developer nhận ra không nên phụ thuộc một model duy nhất.
Tổng Kết
OpenRouter không phải model AI. Nó là hạ tầng routing — lớp trung gian quyết định request của bạn đi về model nào. Vòng gọi vốn 113 triệu USD chứng minh một điều: tương lai AI không thuộc về model mạnh nhất, mà thuộc về hạ tầng biết dùng model nào cho đúng task, đúng giá, đúng thời điểm.
Mình đã chuyển hầu hết project sang multi-model architecture từ đầu năm. Nếu bạn vẫn đang hardcode một API key duy nhất cho tất cả mọi thứ, đây là lúc nên thử OpenRouter. Cứ thử rồi biết — switching cost gần bằng không vì compatible hoàn toàn với format OpenAI API.