Mình vừa test xong Kimi Work — ứng dụng desktop điều phối 300 AI agent chạy song song ngay trên máy tính của bạn, không cần cloud. Thật sự mình khá ấn tượng với hướng đi này vì suốt 2 năm nay toàn bộ AI agent đều chạy trên server nhà cung cấp. Moonshot AI (Trung Quốc) vừa quay ngược cuộc chơi bằng cách đưa agent về máy người dùng.
Trong bài này mình sẽ so sánh Kimi Work với các cloud agent đang dùng, phân tích xem hướng tiếp cận local-first có thực sự vượt trội hay chỉ là chiêu marketing.
Kimi Work Là Gì? 300 AI Agent Chạy Song Song Trên Desktop Của Bạn
Kimi Work là ứng dụng desktop (macOS và Windows) do Moonshot AI (Beijing) ra mắt ngày 9-10/6/2026. Ứng dụng này điều phối tới 300 sub-agent chạy song song trên máy tính của bạn, giám sát bởi model Kimi K2.6 — open-weight Mixture-of-Experts kích hoạt 32 tỷ tham số mỗi token, context window 256K.
Điều khác biệt lớn nhất: Kimi Work chạy local, không cloud. Nó đọc file trên ổ cứng của bạn, điều khiển trình duyệt thực tế của bạn, và chạy các tác vụ lên lịch với cron engine. Đây là bước chuyển từ “bạn gửi data lên cloud, cloud xử lý rồi trả về” sang “AI xuống máy bạn, làm việc trong môi trường của bạn”.
4 Thành Phần Cốt Lõi Của Kimi Work: Agent Swarm, WebBridge, Cron Và Local Files
Kimi Work được xây dựng trên 4 kỹ thuật, mình phân tích từng cái để bạn hiểu nó mạnh yếu ở đâu:
1. Agent Swarm — 300 sub-agent chạy song song. Bạn giao một tác vụ lớn, hệ thống tự chia nhỏ thành các phần, mỗi sub-agent phụ trách một phần, rồi tổng hợp kết quả. K2.6 được tài liệu hỗ trợ tới 4.000 bước phối hợp. So với bản trước (Kimi K2.5) chỉ có 100 agent, đây là bước nhảy 3 lần.
2. WebBridge — extension trình duyệt cho agent điều khiển browser của bạn như người thật: tìm kiếm, cuộn trang, trích dữ liệu, điền form. Vì nó dùng session thực, agent kế thừa luôn cookie và login của bạn. Mình thấy cái này rất tiện nhưng cũng rất nguy hiểm — agent có quyền truy cập phiên đăng nhập của bạn.
3. Cron Scheduling Engine — lên lịch nội bộ tạo. Bạn có thể đặt agent chạy hàng ngày, hàng giờ, hoặc theo điều kiện. Có cả “Keep Computer Awake” để agent chạy ban đêm không bị ngắt. Mình thấy dùng cron chuẩn (minute, hour, day-of-month, month, day-of-week) nên bất cứ dev nào cũng quen thuộc.
4. Local Files và Code — agent đọc folder bạn mount, chạy Python ở background. File gốc không bị thay đổi trừ khi bạn chấp thuận. Đây là điểm mình thích nhất vì nó giảm rủi ro mất dữ liệu.
Kimi Work Vs Cloud Agent: Local-First Có Thực Sự Hơn Cloud?
Mình đã làm bảng so sánh để bạn tự đánh giá:
- Nơi chạy: Kimi Work chạy ngay trên desktop của bạn. Cloud agent (như ChatGPT Agent, Claude Computer Use) chạy trên server nhà cung cấp.
- Truy cập file: Kimi Work đọc trực tiếp folder trên ổ cứng. Cloud agent chỉ làm việc với file bạn upload lên hoặc trong sandbox.
- Trình duyệt: Kimi Work dùng browser thực tế của bạn (có login, cookie). Cloud agent dùng virtual browser riêng biệt.
- Lên lịch: Kimi Work có cron engine tốc định. Cloud agent thường phải dùng external tool hoặc API.
- Bảo mật: Kimi Work — bạn tự chịu trách nhiệm. Cloud agent — nhà cung cấp chịu trách nhiệm.
- Cài đặt: Kimi Work cần cài app và cấp quyền folder. Cloud agent chỉ cần mở tab trình duyệt.
Không có cách nào thắng hoàn toàn. Local execution giữ dữ liệu ở lại máy bạn và truy cập được file thực. Cloud execution đổi sự quan độ lấy lại sự tiện lợi và bảo mật quản lý.
Công Cụ Này Phù Hợp Với Ai? Mình Đánh Giá Thực Tế
Sau khi test, mình thấy Kimi Work phù hợp nhất với 3 nhóm:
Nhóm 1 — Nhà phân tích tài chính: Kimi Work tích hợp sẵn dữ liệu thị trường cổ phiếu A-shares (Trung Quốc), Hong Kong stocks, và US equities. Bạn chỉ việc hỏi “phân tích báo cáo tài chính Q1 của Apple và Microsoft” agent sẽ làm hết: đọc file, trích dữ liệu, viết báo cáo, xuất ra PowerPoint hoặc Excel.
Nhóm 2 — Knowledge worker xử lý tài liệu lớn: Nếu bạn phải đọc hàng trăm PDF báo cáo mỗi tuần, Agent Swarm sẽ chia mỗi sub-agent đọc một file rồi tổng hợp. Giảm nhân lực bất cứ kỳ.
Nhóm 3 — Developer cần automation: Cron engine kết hợp Python và shell script chạy ban đêm. Bạn có thể đặt agent thu thập dữ liệu website, phân tích, và gửi báo cáo vào 7 giờ sáng mai.
Nhóm không nên dùng: nếu bạn cần AI trả lời nhanh đơn giản, Kimi Work là overkill. ChatGPT hay Claude bình thường còn nhanh và tiện hơn.
WebBridge Là Tính Năng Mạnh Nhưng Cũng Rủi Ro Nhất
Mình cảnh báo điều này riêng vì nhiều bạn sẽ bỏ qua. WebBridge cho agent điều khiển trình duyệt của bạn với đầy đủ quyền: cookie, session login, history. Nếu agent bị hướng sai (qua prompt injection từ website), nó có thể thực hiện hành động trên các tài khoản đang đăng nhập của bạn.
May mắn là Kimi Work có “Ask before acting” gate — hỏi trước khi ghi file hoặc thực hiện hành động trên web. Bạn nên bật nó lên, và chỉ tắt (YOLO mode) khi bạn thật sự hiểu rủi ro.
So Sánh Kimi K2.6 Với Các Model Khác: Có Cần 300 Agent Không?
Mình nghĩ câu hỏi đúng hơn là: 300 agent làm được những gì mà 1 model mạnh không làm được?
K2.6 (32B active params, 256K context) không phải model mạnh nhất. Claude Opus 4.8, GPT-5.5, Gemini 3.5 Pro đều mạnh hơn ở reasoning đơn lẻ. Nhưng lượng công việc mà 300 agent làm song song thì không model nào theo kịp. Đây là logic “divide and conquer” — không cần mỗi agent giỏi, cần tổng số công việc hoàn thành lớn.
Mình test sớm thấy: 1 agent đọc 1 PDF báo cáo 50 trang mất ~2 phút. 300 agent đọc 300 PDF cùng lúc mất cũng ~2 phút. Đây là speedup mà không model nào đạt được bất kể reasoning của nó mạnh đến đâu.
Ý Nghĩa Cho Developer Việt Nam: Có Nên Dùng Kimi Work?
Mình đánh giá thực tế cho developer và knowledge worker tại Việt Nam:
Thưởng: K2.6 là open-weight model. Bạn có thể download và chạy local hoàn toàn, không gửi data đi đâu hết. Nếu bạn xử lý dữ liệu nhạy cảm (báo cáo tài chính, dữ liệu khách hàng), đây là advantage lớn so với ChatGPT hay Claude phải gửi data lên cloud Mỹ.
Nhược: Kimi Work hiện chưa hỗ trợ tiếng Việt tốt. Giao diện chính bằng tiếng Anh và tiếng Trung. Các template finance chỉ dành cho thị trường Trung Quốc, Hong Kong, Mỹ — chưa có Việt Nam. Bạn cần customize khá nhiều.
Mình nghĩ: Nếu bạn làm SEO, content marketing, hoặc phân tích dữ liệu thì có thể dùng thử. Developer nên theo dõi K2.6 open-weight để chạy local server làm RAG cho công ty. Còn nếu bạn chỉ cần chat AI bình thường thì không cần chuyển qua Kimi Work.
AI Agent Đang Chuyển Từ Cloud Về Local: Đây Mới Là Xu Hướng Thật
Kimi Work không phải bông đèn cuộc đời. Nhưng nó đại diện cho một xu hướng lớn hơn: AI agent đang chuyển từ cloud-first sang local-first. Apple làm tương tự với Siri AI (on-device processing). Google làm với Gemini Nano 4 (local inference). Moonshot AI làm với Kimi Work.
Lý do đơn giản: cloud AI phục vụ 1 tỷ người dùng hết bandwidth và compute. Local AI giảm tải cloud, bảo vệ privacy, và hoạt động được khi mất kết nối. Sự cân bằng đang dịch chuyển về phía local.
Mình dự đoán nửa sau 2026 sẽ có nhiều tool theo hướng này hơn. Developer Việt Nam nên chuẩn bị: học agent orchestration, hiểu multi-agent system, và xem xét chạy open-weight model local để giảm phụ thuộc cloud.
Bạn nghĩ sao về Kimi Work? Có ai đã thử chưa, chia sẻ kinh nghiệm nhé. Mình sẽ cập nhật thêm sau khi dùng lâu hơn.
