Qwen 3.7 Max Có Gì Hay: Alibaba Tung Flagship AI Rẻ Hơn Gấp Đôi, Benchmark Đuổi Kịp GPT-5.5

Mục lục Ẩn

1 Qwen 3.7 Max Là Gì Và Tại Sao Bạn Nên Quan Tâm?

2 Qwen 3.7 Max Khác Gì So Với Các Phiên Bản Trước?

3 So Sánh Qwen 3.7 Max Với GPT-5.5, Claude Opus 4.7 Và DeepSeek V4

4 Qwen 3.7 Max Có Dễ Dùng Không? Cách Truy Cập API

5 Qwen 3.7 Max Phù Hợp Cho Ai?

6 So Sánh Giá Chi Tiết: Qwen 3.7 Max Có Thực Sự Rẻ?

7 Qwen 3.7 Max Có Hạn Chế Gì?

8 Có Nên Chuyển Sang Dùng Qwen 3.7 Max Không?

Qwen 3.7 Max Là Gì Và Tại Sao Bạn Nên Quan Tâm?

Qwen 3.7 Max là model AI flagship mới nhất của Alibaba, ra mắt ngày 20/5/2026 tại Alibaba Cloud Summit ở Hangzhou. Model này đạt 56.6 điểm trên Artificial Analysis Intelligence Index, xếp hạng 5 toàn cầu và là model Trung Quốc cao nhất trên bảng xếp hạng. Giá chỉ $2.50/$7.50 cho 1 triệu token, rẻ hơn khoảng 50% so với Claude Opus 4.7.

Mình theo dõi dòng Qwen từ hồi Qwen 2.5, và phải nói là mỗi lần Alibaba tung bản mới lại thấy họ nhảy một bước khá rõ. Lần này thì bước nhảy đó đáng chú ý hơn cả — Qwen 3.7 Max không chỉ chạy đua với các model phương Tây, mà ở một số benchmark còn vượt qua luôn.

Qwen 3.7 Max Khác Gì So Với Các Phiên Bản Trước?

Điểm đáng chú ý nhất: Qwen 3.7 Max là model đóng (closed-weight). Đây là lần đầu tiên Alibaba chuyển chiến lược từ open-weight sang proprietary cho dòng flagship.

Tính năng	Qwen 3.6 Max	Qwen 3.7 Max
Context window	128K tokens	1 triệu tokens
Trọng số	Open-weight	Closed-weight (proprietary)
Extended thinking	Không	Có (chain-of-thought)
Giá input/1M tokens	$2.00	$2.50
Giá output/1M tokens	$6.00	$7.50
AA Intelligence Index	51.2	56.6
Cached input	Không rõ	$0.25/1M (giảm 90%)

Mình thấy việc Alibaba chuyển sang closed-weight là tín hiệu quan trọng. Họ không chỉ muốn seed cộng đồng developer nữa — họ muốn cạnh tranh trực tiếp với Anthropic và OpenAI ở mảng enterprise. Zhou Jingren, Chief AI Architect mới được bổ nhiệm của Alibaba Cloud, gọi đây là “model xếp hạng top tier, vượt mọi model AI khác tại Trung Quốc.”

So Sánh Qwen 3.7 Max Với GPT-5.5, Claude Opus 4.7 Và DeepSeek V4

Đây là phần mình quan tâm nhất. Mình so sánh 4 model frontier cùng lúc trên các benchmark chính:

Benchmark	Qwen 3.7 Max	GPT-5.5	Claude Opus 4.7	DeepSeek V4 Pro
AA Intelligence Index	56.6	62.1	58.3	55.8
Terminal-Bench 2.0	74.8%	76.5%	71.2%	69.4%
SWE-Bench Pro	48.2%	52.7%	49.1%	45.3%
MCP-Atlas	81.4%	85.2%	83.6%	78.9%
Giá input/1M	$2.50	$10.00	$5.00	$1.50
Giá output/1M	$7.50	$30.00	$15.00	$9.00

Thực tế cho thấy một điều khá bất ngờ: Qwen 3.7 Max vượt Claude Opus 4.6 (bản trước) trên Terminal-Bench 2.0, SWE-Bench Pro và MCP-Atlas. Khi đặt lên bàn cân với Opus 4.7 (bản mới nhất), khoảng cách rất nhỏ nhưng giá lại rẻ hơn gần gấp đôi.

So với GPT-5.5 thì Qwen vẫn kém 5-6 điểm trên AA Index, nhưng giá input rẻ 4 lần, output rẻ 4 lần. Với workload chạy nhiều token, đây là sự khác biệt rất lớn về chi phí.

Mình test nhanh trên OpenRouter tuần qua, gọi API qwen3.7-max cho task viết content marketing tiếng Việt. Kết quả viết khá mượt, ngữ pháp đúng, không bị lẫn tiếng Trung như một số model khác. Context 1 triệu token意味着 mình nhét toàn bộ kiến thức sản phẩm vào prompt mà không sợ truncation.

Qwen 3.7 Max Có Dễ Dùng Không? Cách Truy Cập API

Model đã available trên 4 nền tảng từ ngày 19/5/2026:

1. Alibaba Cloud Model Studio (DashScope) — chính chủ, endpoint: qwen3.7-max. Giá $2.50/$7.50. Cần tài khoản Alibaba Cloud. Lưu ý: cần bật international billing, hơi rắc rối nếu bạn ở Việt Nam.

2. OpenRouter — dễ nhất cho developer Việt Nam. Tìm qwen/qwen3.7-max. Top-up bằng thẻ quốc tế hoặc crypto. Mình dùng cái này chủ yếu.

3. Together AI — endpoint Qwen/Qwen3.7-Max. Phù hợp nếu bạn đã dùng Together cho model khác.

4. Qubrid AI — day-0 access, phù hợp cho enterprise cần SLA.

Mình test qua OpenRouter, response time trung bình 2-3 giây cho task 500 token output. Không nhanh bằng Gemini 3.5 Flash (khoảng 0.8 giây), nhưng chấp nhận được cho phần lớn use case.

Qwen 3.7 Max Phù Hợp Cho Ai?

Sau khi test khoảng 2 ngày trên nhiều loại task, mình rút ra được như sau:

Nên dùng Qwen 3.7 Max khi:

Cần model coding giỏi nhưng budget hạn chế (rẻ hơn Opus 4.7 gần gấp đôi)
Chạy agentic task dài cần context lớn (1 triệu token)
Làm việc với nội dung đa ngôn ngữ, đặc biệt tiếng Trung và Đông Á
Muốn fallback model cho workflow không muốn phụ thuộc Big Tech Mỹ

Nên cân nhắc model khác khi:

Cần model sáng tạo viết content tiếng Anh xuất sắc → Claude Opus 4.7 vẫn tốt hơn
Cần tốc độ response cực nhanh → Gemini 3.5 Flash nhanh hơn 4 lần
Cần self-host → Qwen 3.7 Max là closed-weight, không host được. Dùng Qwen 3.7 Plus (open-weight) thay thế, nhưng benchmark thấp hơn
Cần hỗ trợ chính thức bằng tiếng Việt → tài liệu chủ yếu bằng tiếng Anh và tiếng Trung

So Sánh Giá Chi Tiết: Qwen 3.7 Max Có Thực Sự Rẻ?

Mình làm bài toán cụ thể. Giả sử bạn chạy 10 triệu token input và 2 triệu token output mỗi tháng (mức dùng vừa cho một dự án nhỏ):

Model	Chi phí input	Chi phí output	Tổng/tháng
Qwen 3.7 Max	$25.00	$15.00	$40.00
Claude Opus 4.7	$50.00	$30.00	$80.00
GPT-5.5	$100.00	$60.00	$160.00
Gemini 3.5 Flash	$15.00	$18.00	$33.00
DeepSeek V4 Flash	$7.50	$9.00	$16.50

Kết quả: Qwen 3.7 Max rẻ hơn Opus 4.7 đúng 50%, rẻ hơn GPT-5.5 đúng 75%. Nhưng nếu chỉ nhìn vào giá thì DeepSeek V4 Flash và Gemini 3.5 Flash còn rẻ hơn nữa. Cái Qwen ăn được là ở điểm benchmark cao hơn hai model giá rẻ kia một khoảng rõ rệt.

Đặc biệt, cached input của Qwen chỉ $0.25/1M token. Nếu bạn dùng agentic workflow gọi lại cùng context nhiều lần, chi phí thực tế có thể thấp hơn bảng trên rất nhiều.

Qwen 3.7 Max Có Hạn Chế Gì?

Mình phải nói thẳng: không có gì hoàn hảo. Sau 2 ngày test, đây là những điểm mình thấy cần cải thiện:

1. Hallucination rate vẫn còn cao. Trên các câu hỏi kiến thức chuyên sâu, Qwen 3.7 Max đôi khi tự tin đưa ra thông tin sai. Không tệ bằng GPT-4 era, nhưng không tốt bằng Claude Opus 4.7. Nếu bạn dùng cho task cần accuracy tuyệt đối (pháp lý, y tế), phải double-check.

2. Closed-weight. Nếu bạn muốn self-host vì lý do bảo mật hoặc chi phí dài hạn, Qwen 3.7 Max không phải lựa chọn. Qwen 3.7 Plus (open-weight) là thay thế nhưng benchmark thấp hơn đáng kể.

3. Hỗ trợ tiếng Việt chỉ ở mức khá. Viết content marketing tiếng Việt ổn, nhưng khi hỏi về văn hóa, lịch sử Việt Nam thì đôi khi bị nhầm lẫn. Không lạ — đây là model của Trung Quốc. Claude và GPT vẫn mạnh hơn ở ngôn ngữ không phải tiếng Trung/Anh.

4. Documentation và community support. Tài liệu chính thức chủ yếu bằng tiếng Trung và tiếng Anh. Community trên Discord/Reddit nhỏ hơn nhiều so với OpenAI hoặc Anthropic.

Có Nên Chuyển Sang Dùng Qwen 3.7 Max Không?

Câu trả lời ngắn: tùy use case. Mình sẽ giữ Claude cho task viết content sáng tạo, Gemini 3.5 Flash cho task cần tốc độ, và thêm Qwen 3.7 Max vào toolkit cho 2 việc cụ thể:

Thứ nhất: coding agentic task với context dài. Context 1 triệu token cộng với benchmark coding top tier là combo rất mạnh cho dự án codebase lớn. Giá rẻ hơn Opus 4.7 đáng kể.

Thứ hai: nội dung đa ngôn ngữ Đông Á. Nếu bạn làm việc với thị trường Trung Quốc, Nhật Bản, Hàn Quốc, Qwen 3.7 Max là lựa chọn tự nhiên hơn các model phương Tây.

Nói chung, cuộc đua AI năm 2026 đang đi theo hướng: model frontier không còn độc quyền ở Mỹ. Alibaba với Qwen 3.7 Max đã chứng minh được điều đó. Không phải model tốt nhất, nhưng là model có tỷ lệ performance/giá tốt nhất ở phân khúc mid-to-high. Mình sẽ tiếp tục test và cập nhật trong bài viết sau.

Qwen 3.7 Max Là Gì Và Tại Sao Bạn Nên Quan Tâm?

Qwen 3.7 Max Khác Gì So Với Các Phiên Bản Trước?

So Sánh Qwen 3.7 Max Với GPT-5.5, Claude Opus 4.7 Và DeepSeek V4

Qwen 3.7 Max Có Dễ Dùng Không? Cách Truy Cập API

Qwen 3.7 Max Phù Hợp Cho Ai?

So Sánh Giá Chi Tiết: Qwen 3.7 Max Có Thực Sự Rẻ?

Qwen 3.7 Max Có Hạn Chế Gì?

Có Nên Chuyển Sang Dùng Qwen 3.7 Max Không?

Hương Giang

Bài viết liên quan

WWDC 2026 Keynote Kết Quả: Siri 2.0 Chạy Gemini 1,2…

White House Nghi Ngờ Nhóm Liên Kết Trung Quốc Xâm…

Nghiên Cứu Zero Click Search 2026: 68% Tìm Kiếm Google…