Microsoft và OpenAI vừa tái cấu trúc thỏa thuận đối tác độc quyền kéo dài nhiều năm. Thay đổi lớn nhất: OpenAI giờ có thể triển khai dịch vụ trên AWS, Google Cloud và các nhà cung cấp đám mây khác, không còn bị khóa chặt vào Azure. Đây là bước ngoặt thay đổi hoàn toàn cách doanh nghiệp tiếp cận AI API.
Đối Tác Microsoft OpenAI Trước Đây Hoạt Động Như Thế Nào?
Từ 2019, Microsoft rót hơn 13 tỷ USD vào OpenAI và nhận lại độc quyền cloud provider cho toàn bộ dịch vụ OpenAI. Nghĩa là muốn dùng GPT API trên infrastructure doanh nghiệp, bạn phải đi qua Azure. Mọi yêu cầu API, mọi token xử lý, mọi data pipeline đều chạy trên máy chủ Microsoft.
Mô hình này từng có lợi cho cả hai bên. OpenAI được nguồn compute khổng lồ mà không phải tự xây data center. Microsoft có sản phẩm AI hottest thị trường dành riêng cho khách hàng Azure. Nhưng đến 2026, tình hình đã khác hoàn toàn.
Tại Sao Đối Tác Độc Quyền Không Còn Phù Hợp?
Mình thấy ba yếu tố chính đẩy hai bên đến quyết định này.
Thứ nhất, OpenAI đang chuẩn bị IPO với mục tiêu định giá hơn 1 nghìn tỷ USD. Công ty khai báo confidential S-1 với Goldman Sachs và Morgan Stanley. Khi lên sàn, OpenAI cần tự do chọn infrastructure tối ưu, không thể bị ràng buộc bởi một cloud provider duy nhất. Các nhà đầu tư sẽ hỏi tại sao GPT API không available trên AWS, trong khi Claude đã có mặt trên cả ba nền tảng lớn nhất.
Thứ hai, Anthropic thay đổi cuộc chơi. Ngay sau khi gọi vốn 65 tỷ USD ở mức định giá 965 tỷ USD, Anthropic công bố Claude là frontier AI model đầu tiên available trên cả ba nền tảng đám mây lớn nhất: Amazon Web Services, Google Cloud và Microsoft Azure. Khách hàng enterprise giờ có thể chọn cloud họ đang dùng và vẫn tiếp cận được model mạnh nhất. OpenAI không thể để Claude giành lợi thế multi-cloud này quá lâu.
Thứ ba, Microsoft đang xây AI Super App riêng. Theo Fortune, Microsoft đang gộp GitHub Copilot, Copilot Chat, Cowork và Autopilot thành một super app thống nhất. Chỉ 4,5% trong 450 triệu user Microsoft 365 trả tiền cho Copilot. Microsoft cần product AI riêng mạnh hơn, giảm phụ thuộc vào OpenAI. Kết hợp với việc Microsoft vừa hủy licenses Claude Code cho bộ phận nội bộ do chi phí token quá cao, rõ ràng Microsoft đang điều chỉnh lại toàn bộ chiến lược AI.
Chi Tiết Tái Cấu Trúc: Điều Gì Thay Đổi Cho Developer?
Mình tóm tắt những thay đổi quan trọng nhất trong bảng dưới đây.
| Khía cạnh | Trước tái cấu trúc | Sau tái cấu trúc |
|---|---|---|
| Cloud provider cho GPT API | Chỉ Azure | Azure, AWS, Google Cloud và các provider khác |
| Data residency | Bị giới hạn theo region Azure | Linh hoạt theo region từng cloud provider |
| Pricing | Giá API đồng nhất qua Azure | Có thể cạnh tranh giữa các cloud provider |
| Enterprise contract | Phải qua Microsoft account team | Trực tiếp với OpenAI hoặc qua cloud partner |
| Microsoft investment | Độc quyền cloud + revenue share | Vẫn đầu tư nhưng không còn độc quyền |
Điểm đáng chú ý: thỏa thuận đầu tư tài chính từ Microsoft sang OpenAI không thay đổi. Microsoft vẫn là cổ đông lớn và tiếp tục tích hợp GPT vào sản phẩm Copilot. Nhưng độc quyền cloud kết thúc.
Tại Sao Điều Này Quan Trọng Với Người Dùng AI Tại Việt Nam?
Mình test qua tình hình thực tế và thấy ba tác động trực tiếp.
Giá API có thể giảm. Khi OpenAI không còn bị khóa vào Azure, các cloud provider sẽ cạnh tranh về giá. AWS có thể offer bundle discount cho khách hàng đang dùng EC2, Google Cloud có thể match giá với Gemini API. Cuộc đua giá giữa GPT, Claude và Gemini sẽ gay gắt hơn, và người dùng API được hưởng lợi.
Data residency linh hoạt hơn. Nhiều doanh nghiệp Việt Nam dùng AWS hoặc Google Cloud làm infrastructure chính. Trước đây, muốn dùng GPT API trong workflow phải thiết lập hybrid connection sang Azure, vừa phức tạp vừa tốn kém. Giờ có thể dùng GPT API trực tiếp trên cloud đang dùng, giảm latency và đơn giản hóa architecture.
Multi-model strategy dễ triển khai. Mình đang thấy xu hướng rõ ràng: doanh nghiệp không dùng một model duy nhất. GPT cho task A, Claude cho task B, Gemini cho task C. Khi cả ba đều available trên cùng một cloud provider, việc orchestrate multi-model pipeline đơn giản hơn rất nhiều. OpenRouter, công ty vừa gọi vốn 113 triệu USD ở mức định giá 1,3 tỷ, xây toàn bộ business model dựa trên nhu cầu multi-model routing này.
So Sánh: OpenAI Đa Nền Tảng vs Anthropic Đa Nền Tảng
Anthropic đi trước OpenAI về chiến lược multi-cloud. Mình so sánh trực tiếp hai cách tiếp cận.
| Đặc điểm | Anthropic (Claude) | OpenAI (GPT) |
|---|---|---|
| Multi-cloud available | AWS, Google Cloud, Azure | Trước: chỉ Azure. Sau: thêm AWS, Google Cloud |
| Thời điểm ra mắt multi-cloud | Tháng 5/2026 | Sau khi tái cấu trúc đối tác Microsoft |
| Định giá | 965 tỷ USD | 852 tỷ USD (March), nhắm 1 nghìn tỷ USD IPO |
| Lợi nhuận | Có lãi 559 triệu USD (Q2/2026) | Chưa có lãi, lỗ 14 tỷ USD/năm |
| Self-hosting | Claude Mythos giới hạn đối tác | Chưa available |
| Strongest use case | Enterprise reasoning, coding, policy-aware | Consumer, general-purpose, multimodal |
Cuộc Đua Multi-Cloud AI Sẽ Diễn Ra Như Thế Nào?
Mình dự đoán ba xu hướng trong 6-12 tháng tới.
Cloud provider sẽ bundle AI model vào ecosystem. Giống như Google đưa Gemini vào Workspace, AWS sẽ offer GPT và Claude như native service. Google Cloud sẽ tiếp tục đẩy mạnh Gemini nhưng cũng host GPT API cho khách hàng yêu cầu. Azure giữ ưu thế với integration sâu nhất do partnership lịch sử.
Giá inference sẽ tiếp tục giảm. DeepSeek V4 đã chứng minh frontier model không cần đắt. Gemini 3.5 Flash ra mắt với giá 1,50/9 USD per million token, rẻ hơn GPT-5.5 gấp 10 lần. Khi các model cạnh tranh trên cùng một cloud platform, áp lực giảm giá sẽ tăng. Đây là tin tốt cho startup và freelancer Việt Nam.
Enterprise sẽ yêu cầu cloud-agnostic AI strategy. Thay vì lock-in với một model trên một cloud, doanh nghiệp sẽ muốn portfolio: GPT trên AWS cho workload A, Claude trên Google Cloud cho workload B, Gemini native cho task C. Kiến trúc multi-cloud AI sẽ trở thành tiêu chuẩn, không còn là ngoại lệ.
Developer Việt Nam Nên Làm Gì Ngay?
Mình có ba khuyến nghị thực tế.
1. Không lock-in vào một provider duy nhất. Nếu bạn đang chỉ dùng GPT qua Azure, bắt đầu test Claude API trên AWS hoặc Gemini API trên Google Cloud. So sánh chất lượng, tốc độ và giá cho từng use case cụ thể. Mình test thấy Claude mạnh hơn cho coding và phân tích tài liệu, GPT tốt hơn cho creative writing và chatbot đa ngôn ngữ, Gemini nhanh nhất cho task đơn giản.
2. Thiết kế architecture sẵn sàng multi-model. Dùng abstraction layer như LiteLLM hoặc OpenRouter để dễ switch giữa các model mà không đổi code. Chi phí thiết lập ban đầu thêm khoảng 10-15% thời gian, nhưng tiết kiệm rất nhiều khi cần migrate hoặc thêm model mới.
3. Theo dõi giá API hàng tháng. Thị trường đang thay đổi nhanh. GPT-5.6 lộ diện trong Codex logs, Claude Opus 4.8 vừa ra mắt giữ nguyên giá, Gemini 3.5 Flash cắt giá mạnh. Kiểm tra pricing page mỗi tháng để đảm bảo bạn đang dùng model tốt nhất cho budget của mình.
Google Đang Ở Vị Trí Đặc Biệt Như Thế Nào?
Trong khi Microsoft và OpenAI tái cấu trúc, Google có lợi thế độc nhất: vừa là cloud provider (Google Cloud), vừa là AI lab (DeepMind/Gemini), vừa là nền tảng phân phối (Search, YouTube, Workspace, Android với 3 tỷ thiết bị).
Google I/O 2026 xác nhận chiến lược này: Gemini 3.5 Flash tung ra đồng loạt trên Search, Gemini app và API, tốc độ nhanh 4 lần, giá chỉ 1,50/9 USD per million token. Gemini Spark, personal agent 24/7, tung ra cho AI Ultra subscriber. Samsung XR glasses ra mắt mùa thu. Google không cần partner độc quyền vì họ sở hữu toàn bộ stack.
Điều này có nghĩa là trên Google Cloud, khách hàng sẽ vừa có Gemini native, vừa có GPT và Claude qua partnership. Mình thấy Google Cloud đang trở thành nền tảng AI rộng nhất về lựa chọn model.
Tóm Tắt: Kỷ Nguyên Mới Của AI API
Việc Microsoft và OpenAI chấm dứt độc quyền Azure đánh dấu kết thúc giai đoạn đầu của cuộc đua AI, nơi mỗi lab liên kết độc quyền với một cloud giant. Kỷ nguyên mới: multi-cloud, multi-model, giá cạnh tranh, và developer là người được lợi lớn nhất.
Cho người dùng và developer Việt Nam, đây là tin tốt. Nhiều lựa chọn hơn, giá rẻ hơn, và architecture linh hoạt hơn. Mình khuyến nghị bắt đầu thử multi-model ngay hôm nay, dù chỉ là test Claude song song với GPT trên project hiện tại. Cuộc đua AI không còn là chọn phe, mà là chọn đúng tool cho đúng việc.
