Z.ai Là Gì? Tại Sao Mình Bị Thu Hút?
Nếu bạn theo dõi thị trường AI gần đây, hẳn đã nghe đến cái tên ZhiPu AI (hay còn gọi là BigModel) — một trong những công ty AI hàng đầu Trung Quốc, đứng cùng hàng với Baidu, Alibaba hay ByteDance trong cuộc đua AI. Z.ai chính là platform cung cấp API và dịch vụ AI của ZhiPu, tập trung vào dòng model GLM (General Language Model).
Điểm khiến mình chú ý Z.ai không phải vì model của họ mạnh nhất thế giới — thừa nhận luôn, GLM chưa sánh được GPT-4o hay Claude 3.5 Sonnet ở những task phức tạp. Điều khiến mình “wow” là cách họ định giá: 12 triệu tokens mỗi tháng chỉ với $18, hỗ trợ sẵn hơn 20 coding tools phổ biến. Con số này khiến ChatGPT Plus và Claude Pro trông đắt đỏ một cách không cần thiết.
Mình đã dùng thử gói GLM Coding Plan suốt 2 tuần qua, trên nhiều IDE khác nhau, nhiều dự án khác nhau. Bài viết này là review chân thực nhất từ trải nghiệm của mình — không nhận tài trợ, không bias, gì tốt khen tốt, gì dở nói thẳng dở.
GLM Coding Plan Là Gì? $18/Tháng Bạn Nhận Được Gì?
GLM Coding Plan là gói subscription của Z.ai dành riêng cho developer. Thay vì trả tiền theo usage như các API provider thông thường, bạn trả một khoản cố định hàng tháng và nhận được một pool token khổng lồ.
Chi tiết gói:
- Giá: $18/tháng (khoảng 460.000 VNĐ)
- Token allowance: 12 triệu tokens mỗi tháng (bao gồm cả input token và output token)
- Model chính: GLM-4 series (GLM-4, GLM-4-Plus, GLM-4-Air)
- Context window: lên đến 128K tokens — đủ cho hầu hết mọi file code bạn muốn phân tích
- Hỗ trợ 20+ coding tools: Cursor, VS Code (qua extension), Windsurf, Continue.dev, Cline, và nhiều hơn nữa
Để bạn hình dung, 12 triệu tokens là mức mà mình thường phải trả khoảng $60-80 nếu dùng OpenAI API trực tiếp. Với ChatGPT Plus ($20/tháng), bạn bị giới hạn usage không rõ ràng — OpenAI không bao giờ nói cụ thể bạn được bao nhiêu tokens, chỉ chung chung “unlimited” rồi cap tốc độ khi dùng nhiều. Với Z.ai, con số rõ ràng: 12 triệu. Bạn kiểm soát được chi phí của mình.
So Sánh Giá: Z.ai vs ChatGPT Plus vs Claude Pro
Mình lập bảng so sánh nhanh để bạn dễ nhìn:
- ChatGPT Plus: $20/tháng — dùng GPT-4o, giới hạn usage không công khai, bị throttle khi dùng nhiều. Coding support chỉ qua ChatGPT web hoặc API riêng. Không tích hợp sẵn với IDE nào.
- Claude Pro: $20/tháng — dùng Claude 3.5 Sonnet/Opus, giới hạn message 5x/ngày với model mạnh nhất. Tích hợp qua API hoặc extension riêng. Context window 200K nhưng bị giới hạn rate nghiêm ngặt.
- Z.ai GLM Coding Plan: $18/tháng — 12 triệu tokens rõ ràng, tích hợp sẵn với 20+ coding tools, context window 128K. Rẻ hơn $2 mà token allowance nhiều gấp nhiều lần.
Nếu bạn là developer và tiêu thụ nhiều token mỗi ngày — debug code, viết function mới, refactor, viết test — thì Z.ai về mặt giá là không đối thủ. $18 cho 12 triệu tokens là mức giá mà không ai trên thị trường hiện tại dám chào.
Nhưng giá rẻ chưa đủ. Chất lượng model mới là câu hỏi quan trọng. Mình sẽ đi vào chi tiết ở phần sau.
20+ Coding Tools: Tích Hợp Sẵn, Cài Đặt Nhanh
Đây là điểm mình đánh giá cao nhất ở Z.ai. Thay vì buộc bạn dùng web chat như ChatGPT, hay tự setup API key phức tạp, Z.ai tích hợp sẵn với hơn 20 coding tools mà developer đang dùng hàng ngày. Mình liệt kê những cái mình đã thử:
Editor & IDE chính:
- Cursor — AI-native code editor, hiện được cộng đồng developer đánh giá là coding tool tốt nhất. Z.ai hỗ trợ Cursor thông qua API key, bạn chỉ cần paste key vào Settings là xong. Mình test trên Cursor và tốc độ response rất ổn, gần như không khác gì dùng GPT-4 trên cùng editor.
- VS Code — qua extension như Continue.dev hoặc Cline, bạn kết nối Z.ai API key và dùng ngay. Không cần cài thêm gì phức tạp.
- Windsurf — editor mới từ Codeium, cũng hỗ trợ Z.ai API. Mình chưa test nhiều trên Windsurf nhưng setup tương tự Cursor.
Extension & Plugin:
- Continue.dev — open-source AI coding assistant, chạy trên VS Code và JetBrains. Hỗ trợ Z.ai rất tốt, mình dùng cái này nhiều nhất vì nó miễn phí, open-source, và cấu hình linh hoạt.
- Cline — autonomous coding agent cho VS Code. Cline có thể tự đọc file, tự viết code, tự chạy terminal. Khi kết hợp với Z.ai API, bạn có một coding agent chạy tự động với chi phí rất thấp.
- Aider — CLI-based AI coding tool, cực kỳ mạnh cho những ai thích terminal. Z.ai tương thích hoàn toàn.
- Copilot alternatives — nhiều tool khác như Tabby, Cody (Sourcegraph) đều có thể config để dùng Z.ai API.
Tổng cộng có hơn 20 tools được Z.ai support chính thức. Danh sách đầy đủ có trên trang chủ của họ. Cái mình thích là không bị lock-in vào một editor cụ thể — dùng cái nào cũng được, miễn là tool đó hỗ trợ custom API endpoint.
Test Thực Tế: Tốc Độ, Chất Lượng Code, Context Window
Review mà không test thực tế thì vô nghĩa. Mình đã chạy một số bài test trong 2 tuần dùng Z.ai. Đây là kết quả:
Tốc độ phản hồi
Mình test trên Cursor và Continue.dev, gửi cùng một prompt đến GLM-4-Plus và GPT-4o. Kết quả:
- GLM-4-Plus: Response trung bình 1.2-2 giây cho code completion, 3-5 giây cho chat completion. Tốc độ khá ổn, không chậm hơn GPT-4o là bao.
- GLM-4-Air: Nhanh hơn, khoảng 0.5-1 giây cho completion. Đây là model nhẹ hơn, phù hợp cho autocomplete và suggestion. Chất lượng thấp hơn GLM-4-Plus nhưng vẫn dùng được cho task đơn giản.
- GLM-4 (base): Vừa phải, khoảng 2-3 giây cho chat. Dùng khi không cần model mạnh nhất.
Nói chung, tốc độ của Z.ai nằm ở mức khá. Không nhanh nhất mình từng dùng (Anthropic Claude đôi khi nhanh hơn), nhưng hoàn toàn không phải là bottle-neck khi coding. Bạn sẽ không phải ngồi chờ 10 giây mỗi lần gõ.
Chất lượng code
Đây mới là phần quan trọng. Mình test trên 3 loại task:
Task 1: Viết function mới (mức độ dễ-trung bình)
Ví dụ: “Viết một function Node.js đọc CSV file, parse dữ liệu, và insert vào PostgreSQL database, có error handling.”
Kết quả: GLM-4-Plus viết ra code hoàn chỉnh, đúng logic, có error handling, import đúng library. Code chạy luôn không cần sửa. Gần như tương đương GPT-4o cho task này. Mình ấn tượng.
Task 2: Debug code phức tạp (mức độ trung bình-khó)
Mình đưa một đoạn React code có bug liên quan đến state management và async rendering. Yêu cầu tìm bug và sửa.
Kết quả: GLM-4-Plus tìm được bug chính xác trong 3/5 trường hợp. Trong 2 trường hợp còn lại, nó đưa ra hướng đúng nhưng fix chưa triệt để. GPT-4o làm tốt hơn, đúng 4/5. Claude 3.5 Sonnet cũng đúng 4/5 nhưng giải thích chi tiết hơn.
Task 3: Refactor và architecture (mức độ khó)
Yêu cầu refactor một module từ class-based sang functional, tối ưu performance, giữ nguyên behavior.
Kết quả: Đây là lúc GLM-4-Plus bắt đầu lộ giới hạn. Code refactor chạy được nhưng chưa optimal, một số edge case bị miss. GPT-4o và Claude đều làm tốt hơn rõ rệt ở task này. Nếu bạn cần AI cho architecture-level refactoring, GLM chưa phải lựa chọn tốt nhất.
Tóm lại về chất lượng: GLM đủ tốt cho 80% task coding hàng ngày — viết function mới, viết test, debug đơn giản, generate boilerplate, explain code. Nhưng cho 20% còn lại — refactoring phức tạp, architecture decision, codebase lớn với nhiều dependency — thì GPT-4o và Claude vẫn vượt trội.
Context window
Z.ai quảng cáo context window lên đến 128K tokens. Mình test bằng cách nạp một file JavaScript dài khoảng 3000 dòng (khoảng 15K tokens) và yêu cầu phân tích.
Kết quả: GLM-4-Plus xử lý tốt trong 128K context. Không bị “quên” context ở giữa file như một số model nhỏ hơn. Tuy nhiên, khi mình đẩy lên gần 100K tokens (nhiều file liên quan), chất lượng response bắt đầu giảm — model không nắm bắt đầy đủ relationship giữa các file. Đây là vấn đề chung của hầu hết model hiện tại, không riêng gì GLM.
So sánh: Claude 3.5 Sonnet xử lý context dài tốt hơn, nhưng bạn bị giới hạn message. GPT-4o cũng xử lý tốt nhưng giá cao hơn nhiều khi dùng API. Trong tầm giá $18, 128K context window của Z.ai là rất cạnh tranh.
Ưu Điểm Của Z.ai GLM Coding Plan
Sau 2 tuần sử dụng, mình tổng hợp những điểm mình thích:
- Giá cực kỳ cạnh tranh. $18/tháng cho 12 triệu tokens là mức giá tốt nhất thị trường hiện tại cho developer. Không ai khác chào mức giá tương tự với token allowance lớn như vậy. Nếu bạn code nhiều và tiêu tốn nhiều token, Z.ai tiết kiệm cho bạn một khoản đáng kể so với ChatGPT Plus hay Claude Pro.
- Token allowance rõ ràng. Bạn biết chính xác mình được bao nhiêu tokens. Không có giới hạn “ẩn” hay throttle không giải thích như ChatGPT Plus. Dashboard của Z.ai hiển thị usage rõ ràng — input token bao nhiêu, output token bao nhiêu, còn lại bao nhiêu.
- Hỗ trợ nhiều IDE và coding tools. 20+ tools tích hợp sẵn là một ecosystem đáng nể. Bạn không bị lock-in vào một editor. Dùng Cursor cũng được, VS Code cũng được, thậm chí terminal với Aider cũng được.
- Context window 128K đủ dùng. Cho hầu hết task coding hàng ngày, 128K là đủ. Bạn có thể nạp cả file dài, thậm chí nhiều file, và model vẫn hiểu context.
- Nhiều model để chọn. GLM-4-Plus cho task khó, GLM-4-Air cho task nhanh, GLM-4 base cho cân bằng. Bạn có thể chọn model phù hợp để tiết kiệm token.
- API tương thích OpenAI format. Nếu tool nào đã hỗ trợ OpenAI API, bạn chỉ cần đổi base URL và API key là chuyển sang Z.ai. Không cần refactor hay config phức tạp.
Nhược Điểm: Những Điểm Cần Cải Thiện
Review chân thực thì phải nói cả tốt lẫn xấu. Đây là những điểm mình chưa hài lòng:
- Chất lượng model chưa bằng GPT-4o/Claude cho code phức tạp. Như mình đã nói ở phần test, GLM-4-Plus đủ tốt cho 80% task, nhưng 20% task khó hơn — refactoring, architecture, edge case phức tạp — thì vẫn thua GPT-4o và Claude. Nếu công việc của bạn đòi hỏi AI xử lý code phức tạp thường xuyên, bạn vẫn cần một subscription khác song song.
- UI và documentation tiếng Anh chỉ ở mức vừa. Z.ai là platform Trung Quốc, và bản tiếng Anh của họ rõ ràng là bản dịch. Một số tài liệu vẫn bị lỗi dịch thuật, một số trang vẫn giữ nguyên tiếng Trung. Navigation trên dashboard đôi khi confusing. Không phải vấn đề lớn, nhưng nếu bạn không quen dùng sản phẩm của công ty Trung Quốc thì sẽ mất chút thời gian làm quen.
- Customer support chậm. Mình gửi một câu hỏi về billing và mất 3 ngày mới nhận được phản hồi. ChatGPT Plus và Claude Pro có support nhanh hơn. Có lẽ do team Z.ai nhỏ hơn và phải xử lý khách hàng ở nhiều thị trường.
- Một số model bị giới hạn region. Không phải model nào cũng available ở mọi region. Mình đôi khi gặp lỗi khi switch model, phải retry vài lần. Hy vọng Z.ai sẽ cải thiện infrastructure trong thời gian tới.
- Chưa có feature như ChatGPT Canvas hay Claude Artifacts. Z.ai là API provider, không có web interface mạnh như ChatGPT. Nếu bạn thích làm việc trực tiếp trên web chat, Z.ai không phải lựa chọn tốt. Bạn cần dùng qua IDE hoặc coding tool.
Token Billing: Hiểu Đúng Về 12 Triệu Tokens
Một điểm quan trọng cần hiểu: 12 triệu tokens bao gồm cả input token (token bạn gửi đi) và output token (token AI trả về). Input token thường tính giá rẻ hơn output token, nhưng Z.ai gộp chung vào một pool.
Để bạn hình dung mức tiêu thụ:
- Một lần hỏi “viết function sort array” kèm context 500 dòng code: khoảng 3.000-5.000 input tokens, 500-1.000 output tokens. Tổng khoảng 4.000-6.000 tokens.
- Một lần refactor file 1000 dòng: khoảng 15.000-20.000 input tokens, 2.000-5.000 output tokens. Tổng khoảng 20.000-25.000 tokens.
- Một ngày coding nặng (50-70 lần gọi AI): khoảng 200.000-500.000 tokens.
Như vậy, 12 triệu tokens đủ cho khoảng 24-60 ngày coding nặng liên tục trong một tháng. Đối với hầu hết developer, đây là dư sức. Ngay cả khi bạn code AI-intensive mỗi ngày, khó mà vượt qua 12 triệu tokens.
Hệ thống AI credits của Z.ai cũng rõ ràng — mỗi model có rate khác nhau. GLM-4-Air tốn ít credits hơn GLM-4-Plus. Bạn có thể optimize bằng cách dùng model phù hợp cho từng task, tương tự cách mình làm với các API provider khác.
Có Nên Mua Z.ai GLM Coding Plan?
Sau 2 tuần dùng, đây là kết luận của mình:
Nên mua nếu bạn:
- Là developer và dùng AI coding assistant hàng ngày
- Đang trả tiền cho ChatGPT Plus hoặc Claude Pro chủ yếu để code
- Muốn tiết kiệm chi phí mà không hy sinh quá nhiều chất lượng
- Dùng Cursor, VS Code, hoặc bất kỳ coding tool nào hỗ trợ custom API
- Code chủ yếu ở mức function/module — không quá nhiều architecture-level decision cần AI
- Muốn token allowance rõ ràng, không bị giới hạn “ẩn”
Không nên mua nếu bạn:
- Cần AI mạnh nhất cho code phức tạp, refactoring lớn, architecture decision
- Muốn dùng AI qua web chat, không quen với IDE integration
- Không thoải mái dùng sản phẩm của công ty Trung Quốc (vấn đề data privacy, region, v.v.)
- Đã hài lòng với ChatGPT Plus và không thấy cần tiết kiệm $2/tháng
Chiến lược tốt nhất (cá nhân mình): Dùng Z.ai làm primary coding assistant (cho 80% task hàng ngày), giữ ChatGPT Plus hoặc Claude Pro cho 20% task khó hơn. Tổng chi phí $38-40/tháng nhưng bạn có best of both worlds: token rẻ cho task thường, model mạnh cho task khó.
Hướng Dẫn Đăng Ký Nhanh
Nếu bạn quyết định thử, đây là các bước:
- Bước 1: Truy cập Z.ai và tạo tài khoản. Có thể đăng ký bằng email hoặc Google account.
- Bước 2: Chọn GLM Coding Plan ($18/tháng). Có trial miễn phí nếu bạn muốn thử trước.
- Bước 3: Lấy API key từ dashboard.
- Bước 4: Mở coding tool của bạn (Cursor, Continue.dev, Cline…), paste API key và đổi base URL thành endpoint của Z.ai. Hướng dẫn chi tiết cho từng tool có sẵn trên trang docs của Z.ai.
- Bước 5: Bắt đầu code.
Quá trình setup mất khoảng 5 phút. Mình test trên Cursor và Continue.dev, cả hai đều chạy ngay không cần debug.
Kết Luận
Z.ai GLM Coding Plan là một lựa chọn đáng cân nhắc cho developer trong năm 2025. Với $18/tháng cho 12 triệu tokens, hỗ trợ 20+ coding tools, context window 128K, đây là gói có giá trị tốt nhất thị trường hiện tại cho AI coding assistant.
Model GLM chưa mạnh bằng GPT-4o hay Claude 3.5 Sonnet — đó là sự thật. Nhưng đối với hầu hết task coding hàng ngày, GLM hoàn toàn đủ dùng. Và khi bạn xét đến giá — rẻ hơn $2 so với ChatGPT Plus mà token nhiều gấp nhiều lần — thì đây là một deal rất khó để bỏ qua.
Mình sẽ tiếp tục dùng Z.ai làm primary coding assistant và cập nhật review nếu có thay đổi đáng kể. Nếu bạn đang tìm cách giảm chi phí AI coding mà không hy sinh quá nhiều chất lượng, thử Z.ai — mình nghĩ bạn sẽ không thất vọng.
Bài viết chứa affiliate link. Nếu bạn đăng ký qua link, mình nhận được一小 phần commission mà không làm thay đổi giá của bạn. Cảm ơn bạn đã ủng hộ blog.


