Google Open Knowledge Format (OKF): Tiêu Chuẩn Moi Cho AI Agent Doc Kien Thuc Noi Bo — Minh Phan Tich Thuc Te

Câu trả lời nhanh
Google Cloud ra mắt Open Knowledge Format (OKF) — spec mở biến kiến thức tổ chức thành markdown files có cấu trúc chuẩn, giúp AI agent và con người cùng đọc được. Mỗi concept (dataset, metric, API) là một file với YAML frontmatter. Độc lập platform, không cần SDK, available trên GitHub.

Google Cloud vừa công bố Open Knowledge Format (OKF) — một spec mở giúp tổ chức kiến thức nội bộ thành định dạng mà cả AI agent lẫn con người đều đọc được. Mình nghĩ đây là một trong những tin quan trọng nhất tuần này, nhưng đang bị ngủ quên giữa biển tin tức AI.

Vấn đề mà OKF giải quyết không mới, nhưng cách Google tiếp cận thì rất đáng chú ý. Thay vì tạo thêm một nền tảng knowledge management nữa, họ chỉ tạo ra một format — markdown files với YAML frontmatter. Đơn giản đến mức mình đọc spec xong mất 5 phút.

Open Knowledge Format (OKF) là gì?

OKF là một specification mở do Google Cloud phát triển, biến kiến thức tổ chức (database schema, metric definitions, API docs, runbooks) thành markdown files có cấu trúc chuẩn. Mỗi concept (table, metric, API) là một file, với YAML frontmatter chứa các field như type, title, description, tags. Format này độc lập với platform, không cần SDK, không cần account — chỉ là files thuần.

Tại sao Google lại tạo ra OKF vào lúc này?

Trong blog post chính thức, Google giải thích rõ: foundation model ngày càng mạnh, nhưng thứ giới hạn chúng chính là thiếu context. Một AI agent có thể viết code giỏi, nhưng nếu không biết schema database hay định nghĩa metric nội bộ của công ty bạn thì vẫn vô dụng. Kiến thức này đang scattered Across metadata catalogs, wikis, code comments, shared drives, và “trong đầu mấy anh senior” — câu mình thích nhất trong bài.

Mỗi vendor lại có catalog riêng, SDK riêng, schema riêng. Kết quả: ai build agent cũng giải quyết cùng một bài toán context-assembly từ đầu. Google gọi đây là “fragmented context landscape” và mình thấy mô tả chính xác đến đau.

OKF hoạt động như thế nào?

Một OKF bundle là một thư mục chứa markdown files. Mỗi file đại diện cho một concept — có thể là dataset, metric, API endpoint, hay runbook. File path chính là identity của concept. Các concepts link với nhau bằng markdown links thông thường, tạo thành graph. Bundle có thể chứa index.md (progressive disclosure) và log.md (history). Spec v0.1 fit trên một trang giấy.

Ba nguyên tắc thiết kế cốt lõi: minimally opinionated (chỉ require field “type”), producer/consumer independence (ai viết độc lập với ai đọc), format not platform (không lock-in bất kỳ cloud hay framework nào).

OKF so với AGENTS.md, CLAUDE.md hay Obsidian Vault thì sao?

Đây là phần mình thấy hay nhất. Google thừa nhận rằng pattern “LLM Wiki” đã xuất hiện từ lâu — Andrej Karpathy đã viết về nó trong gist nổi tiếng. Các team everywhere đã tự build version riêng: AGENTS.md, CLAUDE.md, Obsidian vaults wired vào coding agents, folders của index.md và log.md.

Nhưng vấn đề là mỗi instance đều bespoke. Karpathy’s wiki, wiki của team bạn, catalog export của vendor — tất trông giống nhau (markdown, frontmatter, cross-links) nhưng không designed để cooperate. Không có câu trả lời chung cho “field nào mỗi document phải có”. OKF chính là layer tiêu chuẩn hóa mà cộng đồng đang cần.

Mình test khá nhiều AI coding tools năm nay, và pattern AGENTS.md/CLAUDE.md thực sự work. Nhưng mỗi team implement khác nhau, mỗi agent framework đọc khác nhau. Nếu OKF được chấp nhận rộng rãi, đây sẽ là giải pháp cho bài toán mà Karpathy nói: “LLMs don’t get bored, don’t forget to update a cross-reference, and can touch 15 files in one pass.”

Google ship gì cùng với spec OKF?

Google không chỉ published spec mà còn ship reference implementations: một enrichment agent tự walk qua BigQuery dataset, draft OKF concept document cho mỗi table, rồi chạy LLM pass thứ hai để enrich với citations, schemas, join paths. Cùng với đó là static HTML visualizer biến OKF bundle thành interactive graph view — no backend, no install. Ba sample bundles sẵn sàng: GA4 e-commerce, Stack Overflow, Bitcoin public datasets.

Mình xem qua GitHub repo và thực sự ấn tượng với độ clean. Đây không phải proof-of-concept half-baked — Google muốn cộng đồng contribute producers và consumers từ day one.

OKF có ý nghĩa gì cho developer và doanh nghiệp Việt Nam?

If bạn đang build AI agent nội bộ, OKF giải quyết bài toán lớn nhất: làm sao agent hiểu context công ty bạn. Thay vì nhét tất cả vào system prompt (đắt tiền và giới hạn context window), bạn tạo OKF bundle rồi để agent read-on-demand. Format markdown nghĩa là team non-technical cũng contribute được.

Cho team data: thay vì giải thích “metric X tính như nào” qua Slack 50 lần, bạn viết một OKF concept document. Agent nào cần đều đọc được. Cho team dev: AGENTS.md và CLAUDE.md hiện tại đúng là OKF chưa chuẩn hóa — nếu migrate sang OKF, knowledge base của bạn portable giữa các agent framework.

Nhưng mình cũng phải thẳng thắn: OKF v0.1 là starting point, không phải finished standard. Spec sẽ evolve. Đầu tư vào nó ngay có rủi ro — nhưng không đầu tư thì bạn vẫn đang giải quyết context-assembly từ đầu mỗi lần build agent.

Kết nối OKF với xu hướng Agentic Web

OKF không tồn tại độc lập. Nó fit vào bức tranh agentic web mà Google đang xây: Chrome auto-browse cần context để navigate, Information Agents cần knowledge để monitor, WebMCP cần structured data để interact. Tất cả đều cần chung một thứ: kiến thức tổ chức ở định dạng máy đọc được.

Google đang tạo ra một layer hạ tầng mà nếu thành công, sẽ trở thành standard như JSON cho API hay YAML cho Kubernetes config. Mình nghĩ mức độ ảnh hưởng của OKF sẽ phụ thuộc vào adoption — nếu cộng đồng pick up nhanh, 6 tháng tới chúng ta sẽ thấy OKF producers cho mọi hệ thống phổ biến.

Mình đánh giá OKF thế nào sau khi đọc kỹ?

Điểm mình thích: Google chọn format thay vì platform — đúng cách thinking. Markdown + YAML là stack quen thuộc, barrier to entry thấp. Producer/consumer separation clean. Ba sample bundles giúp ai cũng test được ngay.

Điểm mình lo: v0.1 nghĩa là spec sẽ change. Chưa có ecosystem đủ lớn. Karpathy’s LLM Wiki gist thì nổi tiếng, nhưng việc Google formalize nó không guarantee adoption — nhớ lại schema.org hay Knowledge Graph API, Google đã propose nhiều standard không đều được pick up.

Nếu mình build AI agent cho công ty ngày mai, mình sẽ dùng OKF cho knowledge base nội bộ. Rủi ro thấp (chỉ là markdown files), benefit cao (portable, standardized). Và mình sẽ combine với REST API để agent có thể query real-time khi cần data dynamic.

OKF available trên GitHub ngay bây giờ. Spec ngắn, sample rõ ràng. Nếu bạn đang làm gì liên quan đến AI agent, mình suggest dành 30 phút đọc qua — đây là loại infrastructure decision mà ảnh hưởng lâu dài.

Hương Giang

Mình là Hương Giang. Công nghệ và AI là thứ mình thích nhất — có tool mới ra là mình tải về thử, đôi khi test 4-5 cái cùng lúc chỉ để xem cái nào dùng ngon hơn. Mình không phải dân kỹ thuật chính gốc, nhưng mình biết cách nhìn nhận xem một công cụ có thực sự hữu ích cho người bình thường không. Ngoài ra mình hay nghe podcast công nghệ và lướt Product Hunt lúc rảnh.

Xem tất cả bài viết →

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *