Microsoft MAI-Thinking-1: Model Reasoning Đầu Tiên Tự Build Từ Đầu — AIME 97%, Cạnh Tranh GPT-5.5, Mình So Sánh Thực Tế 7 Model MAI

Ngày 2/6/2026, Microsoft Build không chỉ tung ra một model mới mà tung hẳn 7 model cùng lúc. Nhưng ngôi sao sáng nhất chính là MAI-Thinking-1 — model reasoning đầu tiên Microsoft tự train từ đầu, không蒸馏 từ OpenAI, không dùng dữ liệu лиценз nebula. Mình đã tìm hiểu kỹ và kết quả bất ngờ hơn mình tưởng.

MAI-Thinking-1 Là Gì Và Tại Sao Nó Quan Trọng?

MAI-Thinking-1 là model reasoning đầu tiên do Microsoft AI tự xây dựng hoàn toàn từ đầu, sử dụng kiến trúc sparse Mixture of Experts với 35 tỷ tham số active và khoảng 1 nghìn tỷ tham số tổng cộng. Điều đáng chú ý là Microsoft train model này trên “clean and commercially licensed data” mà không дистил từ model bên thứ ba — câu nói thẳng vào vấn đề bản quyền trí tuệ đang khiến nhiều lab đau đầu.

So Sánh MAI-Thinking-1 Với GPT-5.5 Và Claude Opus 4.8 Thực Tế Ra Sao?

Con số mình thấy ấn tượng nhất: AIME 2025 đạt 97.0%, AIME 2026 đạt 94.5%. Nếu bạn không quen AIME, đây là bài toán Olympic Toán Mỹ — đạt trên 90% nghĩa là model reasoning cực mạnh. Trên SWE-Bench Pro, MAI-Thinking-1 cạnh tranh ngang ngửa với Claude Opus 4.6, thế hệ flagship trước đó của Anthropic. Trong bài test blind side-by-side do Surge thực hiện, người đánh giá thậm chí thích MAI-Thinking-1 hơn Claude Sonnet 4.6.

Nhưng phải nói thẳng: MAI-Thinking-1 vẫn chưa chạm tới GPT-5.5 ở math reasoning thuần túy (AIME 81.2% của GPT-5.5 theo benchmark khác) hay Claude Opus 4.8 ở coding (SWE-Bench 69.2%). Model này nằm ở phân khúc mid-tier reasoning — mạnh hơn Sonnet, chưa bằng Opus.

Tại Sao Microsoft Lại Tự Build Model Thay Vì Dùng OpenAI?

Đây là câu hỏi nhiều người đặt ra. Ba năm qua gần như mọi sản phẩm AI của Microsoft — GitHub Copilot, Azure AI, Bing Chat, Microsoft 365 Copilot — đều chạy trên model OpenAI. Việc tung 7 model MAI cùng lúc là lời tuyên bố chính thức: Microsoft đang xây dựng stack AI riêng, song song với OpenAI.

Chiến lược phân phối cũng thú vị. Microsoft không chỉ đưa MAI lên Azure mà còn mở qua Fireworks AI, Baseten, và OpenRouter — ba nhà cung cấp hạ tầng mà developer nào cũng biết. Tín hiệu rõ ràng: Microsoft muốn MAI trở thành hệ sinh thái model, không chỉ là tính năng Azure.

7 Model MAI Bao Gồm Những Gì?

Ngoài MAI-Thinking-1, Microsoft còn tung ra 6 model khác cùng lúc:

  • MAI-Code-1-Flash: 5 tỷ tham số, vượt Claude Haiku 4.5 đúng 16 điểm trên SWE-Bench Pro, dùng ít hơn 60% token. Đã live trong GitHub Copilot model picker trên VS Code.
  • MAI-Base-1: Model nền tảng cho MAI-Thinking-1, cùng kiến trúc MoE.
  • MAI-Image-2.5: Thêm image-to-image editing và control with preservation, đứng #3 trên Arena.ai chỉ sau FLUX.1 và Midjourney V9.
  • MAI-Voice-2: Mở rộng voice cloning sang hơn 15 ngôn ngữ mới, cạnh tranh trực tiếp ElevenLabs.
  • MAI-Transcribe-1.5: 43 ngôn ngữ, giữ vị trí #1 trên FLEURS benchmark, thêm content biasing cho thuật ngữ chuyên ngành.

Developer Việt Nam Nên Dùng MAI-Thinking-1 Cho Việc Gì?

MAI-Thinking-1 hiện ở private preview qua Microsoft Foundry, nhưng bạn có thể xin access hoặc dùng qua Fireworks AI và Baseten. Context window 256K token — đủ cho khoảng 600 trang tài liệu, tóm tắt codebase lớn, hoặc reasoning đa tài liệu phức tạp.

Nếu bạn đang dùng GPT-5.5 cho reasoning task mà muốn giảm chi phí, MAI-Thinking-1 là lựa chọn đáng cân nhắc. Nếu bạn cần coding thuần túy, MAI-Code-1-Flash đã live trong GitHub Copilot — chỉ cần chọn model trong VS Code là dùng được ngay.

MAI-Thinking-1 Có Hạn Chế Gì Cần Biết?

Thứ nhất, model vẫn ở private preview — chưa phải GA, nên không nên đưa vào production critical. Thứ hai, context 256K token tuy đủ cho hầu hết task nhưng thấp hơn 1M token của Gemini 3.5 Flash và DeepSeek V4 Pro. Thứ ba, model chỉ hỗ trợ text input — không multimodal như GPT-4o hay Gemini 3.5.

Nói tóm lại: MAI-Thinking-1 là tín hiệu mạnh rằng Microsoft không muốn phụ thuộc OpenAI mãi. Với developer Việt Nam, thời điểm này nên test thử MAI-Code-1-Flash trong Copilot (miễn phí nếu đã có subscription), và giữ mắt theo dõi khi MAI-Thinking-1 mở rộng GA. Cuộc đua model reasoning 2026 đang nóng hơn bao giờ hết.

Hương Giang

Mình là Hương Giang. Công nghệ và AI là thứ mình thích nhất — có tool mới ra là mình tải về thử, đôi khi test 4-5 cái cùng lúc chỉ để xem cái nào dùng ngon hơn. Mình không phải dân kỹ thuật chính gốc, nhưng mình biết cách nhìn nhận xem một công cụ có thực sự hữu ích cho người bình thường không. Ngoài ra mình hay nghe podcast công nghệ và lướt Product Hunt lúc rảnh.

Xem tất cả bài viết →

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *