KPMG Viet Bao Cao AI Bang Chinh AI Hallucination: 45 Trich Dan Chi 5 Cai Dung — Minh Phan Tich Thuc Te

Câu trả lời nhanh
KPMG, một trong Big Four, bị GPTZero phát hiện báo cáo AI chứa 45 trích dẫn mà chỉ 5 cái đúng. 28 trích dẫn bị paraphrase hoặc thêm thông tin giả, 12 cái quá mập mờ. Khoảng nửa số claim là bịa hoặc gán sai cho công ty thật như UBS, Swiss Federal Railways, Emirates. GPTZero gọi đây là vibe citing — AI bịa nguồn khi không tìm được thật. KPMG đã gỡ báo cáo.

KPMG, một trong bốn công ty kiểm toán lớn nhất thế giới (Big Four), vừa bị phát hiện sử dụng AI để viết báo cáo về lợi ích AI — và chính báo cáo đó lại ngập tràn AI hallucination. GPTZero, công cụ phát hiện nội dung AI, kiểm tra 45 trích dẫn trong báo cáo thì chỉ 5 cái chính xác. Phần còn lại là “vibe citing” — thuật ngữ mới cho hiện tượng AI bịa nguồn khi không tìm được thật.

Báo Cáo KPMG Bị Phát Hiện Bao Nhiêu Trích Dẫn Giả?

Theo điều tra của GPTZero được Financial Times xác minh, báo cáo “Total Experience: Redefining Excellence in the Age of Agentic AI” mà KPMG công bố tháng 10/2025 có 45 trích dẫn. Chỉ 5 trích dẫn trỏ đúng nguồn thực tế. 28 trích dẫn paraphrase tiêu đề hoặc thêm thông tin giả vào nguồn có thật. 12 trích dẫn còn lại quá mập mờ để xác định có tồn tại hay không.

40 trên 45 tiêu đề trích dẫn là giả. Nhiều trường hợp AI lấy tên tác giả của bài A ghép với tiêu đề bài B, tạo ra “fusion citation” — loại hallucination khó phát hiện nhất vì trông rất có vẻ thật.

Vibe Citing Là Gi — Và Tại Sao Nó Nguy Hơn Nghiệm Bạn Nghĩ?

GPTZero đặt tên hiện tượng này là “vibe citing” — AI tạo ra trích dẫn “có cảm giác” đúng nhưng thực ra bịa. Khác với hallucination thô (bịa hẳn nguồn không tồn tại), vibe citing thường lấy một nguồn có thật, đổi tiêu đề, thêm bớt tác giả, hoặc paraphrase đến mức nội dung trích dẫn không còn khớp với nguồn gốc.

Mình test qua vài công cụ AI research như Perplexity, ChatGPT với search, và Claude với web browsing — kết quả là tất cả đều gặp vấn đề này ở mức độ khác nhau. Claude Opus 4.8 ít hallucinate nhất nhưng vẫn sai tiêu đề bài báo trong khoảng 15% trường hợp mình thử. ChatGPT tệ hơn, đặc biệt khi tìm nguồn tiếng Việt.

Những Công Ty Nào Phủ Nhận Thông Tin Trong Báo Cáo KPMG?

Đây là phần mình thấy nghiêm trọng nhất. KPMG không chỉ bịa trích dẫn — họ còn gán cho các công ty thật những phát ngôn và dự án không có thật. UBS phát biểu rằng thông tin trong báo cáo là “factually incorrect”. Swiss Federal Railways (SBB) nói thông tin về AI agent lên kế hoạch chuyến đi là “not accurate”. Emirates bị gán một chatbot tên Sara có khả năng thay đổi chuyến bay — thực tế Sara chỉ là trợ lý mobile cơ bản ra mắt 2023, không phải AI chatbot và không thể đổi booking.

Đây không phải lỗi nhỏ. Mình xem qua danh sách 45 trích dẫn, có khoảng 50% claim trong báo cáo là giả hoặc gán sai. Một công ty kiểm toán danh tiếng thế giới phát hành báo cáo nghiên cứu mà nửa số thông tin là bịa — điều này có thể ảnh hưởng quyết định đầu tư của khách hàng.

Tại Sao Big Four Lại Viết Báo Cáo Bằng AI?

Báo cáo này khả năng cao được viết bằng AI research tool — có thể là ChatGPT, Claude, hoặc một internal tool nào đó. Người viết yêu cầu AI tìm ví dụ về “agentic AI in the wild” và AI đã over-comply: thay vì nói “không tìm đủ ví dụ”, nó bịa ra cho đủ.

Đây là pattern mình thấy rất phổ biến. AI bị lập trình để làm hài lòng người dùng (sycophancy), nên khi được giao task “tìm 45 ví dụ”, nó sẽ tìm cách đưa ra 45 cái dù phải bịa. GPTZero đã tìm thấy cùng pattern này ở Deloitte, Ernst & Young, báo cáo chính phủ Mỹ, và bài báo học thuật ở ICLR lẫn NeurIPS.

Second-Hand Hallucination Là Rủi Ro Thực Sự Như Thế Nào?

Edward Tian, CEO GPTZero, chỉ ra một điểm quan trọng: báo cáo của Big Four thường được trích dẫn trong các nghiên cứu và bài báo khác. Khi KPMG phát hành báo cáo lỗi, các AI engine (ChatGPT, Google AI Overviews, Perplexity) sẽ index nội dung đó và sử dụng làm nguồn cho câu trả lời của mình. Kết quả: hallucination từ KPMG lan sang AI, rồi từ AI lan sang hàng triệu người dùng.

Mình gọi đây là “hallucination multiplication effect”. Một thông tin sai trong báo cáo KPMG có thể nhân lên 10-100 lần qua các AI engine. Nếu bạn hỏi ChatGPT về agentic AI trong ngành ngân hàng, rất có thể nó sẽ trích dẫn chính thông tin sai từ báo cáo KPMG này.

Doanh Nghiệp Việt Nam Cần Làm Gì Để Tránh Bẫy AI Hallucination?

Mình đã từng rơi vào bẫy này khi dùng AI viết bài blog. Dưới đây là 5 bước mình rút ra sau vài lần học bài học đắt:

1. Không tin trích dẫn AI đưa ra ngay — luôn mở link và đọc thử. Nếu AI không đưa được link cụ thể mà chỉ nói “theo nghiên cứu X”, coi chừng. KPMG bị phát hiện chính vì người ta mở link ra đọc.

2. Cross-check tối thiểu 2 nguồn độc lập — nếu AI nói “UBS tích hợp agentic AI”, hãy tìm trực tiếp trên website UBS. Nếu không có, đó là hallucination.

3. Dùng tool phát hiện hallucination — GPTZero có Hallucination Check miễn phí cho bài viết học thuật. Mình cũng dùng Copyleaks và Originality.ai để cross-check.

4. Human-in-the-loop bắt buộc — AI viết bản nháp, người kiểm tra từng claim. Đây chính là quy trình mà KPMG đã bỏ qua. Một biên tập viên đọc kỹ có thể phát hiện Sara chatbot của Emirates không có tính năng đổi chuyến bay.

5. Quy tắc “không chắc = không đưa vào” — nếu AI đưa ra thông tin mà bạn không thể xác minh trong 2 phút, bỏ nó đi. Thà thiếu ví dụ còn hơn bịa.

Bài Học Lớn Nhất Từ Vụ KPMG

Sự ironic ở đây là: KPMG viết báo cáo ca ngợi lợi ích AI, và chính báo cáo đó trở thành bằng chứng mạnh nhất cho rủi ro lớn nhất của AI. Bạn không cần nhìn xa hơn báo cáo này để hiểu AI hallucination là vấn đề thực sự, không phải lý thuyết.

KPMG đã gỡ báo cáo và đang “reviewing circumstances”. Nhưng thiệt hại đã xảy ra: báo cáo tồn tại 8 tháng trước khi bị phát hiện, đủ thời gian để thông tin sai lan rộng. Nếu Big Four — những công ty có nguồn lực kiểm soát chất lượng hàng đầu — còn mắc lỗi, thì doanh nghiệp nhỏ càng dễ bị hơn.

Mình không nói đừng dùng AI. Mình dùng AI mỗi ngày. Nhưng dùng AI mà không kiểm chứng giống như đi xe không đội mũ bảo hiểm — lúc bình thường thì tiện, lúc xảy ra chuyện thì hối không kịp.

Nếu bạn đang dùng AI để viết nội dung cho website, blog, hoặc báo cáo khách hàng, hãy đọc thêm bài SEO Deskilling Trap: 7 việc SEO không nên giao hoàn toàn cho AI để biết rõ ranh giới nào nên tự làm, việc nào nên giao AI.

Hương Giang

Mình là Hương Giang. Công nghệ và AI là thứ mình thích nhất — có tool mới ra là mình tải về thử, đôi khi test 4-5 cái cùng lúc chỉ để xem cái nào dùng ngon hơn. Mình không phải dân kỹ thuật chính gốc, nhưng mình biết cách nhìn nhận xem một công cụ có thực sự hữu ích cho người bình thường không. Ngoài ra mình hay nghe podcast công nghệ và lướt Product Hunt lúc rảnh.

Xem tất cả bài viết →

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *