AI Citation Đang Quyết Định Thương Hiệu Của Bạn Như Thế Nào?
Khi ai đó hỏi ChatGPT hoặc Perplexity về thương hiệu của bạn, câu trả lời không đến từ website của bạn. Đó là phát hiện đáng sợ mà tôi rút ra sau khi phân tích dữ liệu từ nghiên cứu lớn nhất tính đến nay về LLM citation patterns.
Omniscient Digital vừa công bố nghiên cứu phân tích 23.387 citations từ 240 branded queries chạy qua 5 AI engines (ChatGPT, Perplexity, Gemini, AI Mode, AI Overviews). Kết quả phá vỡ mọi giả định mà tôi và nhiều SEOer vẫn tin về cách AI chọn nguồn trích dẫn.
Trong bài này, tôi sẽ bóc tách từng lớp dữ liệu để chỉ ra chính xác nội dung nào được LLM trích dẫn nhiều nhất, tại sao, và SEOer Việt Nam cần thay đổi chiến lược GEO như thế nào ngay quý 3/2026.
Nghiên Cứu Này Được Thực Hiện Như Thế Nào?
Để bạn hiểu độ tin cậy trước khi đi vào số liệu, đây là methodology mà tôi đánh giá khá kỹ:
Nghiên cứu dùng Peec AI — nền tảng AI visibility tracking — chạy 240 prompts chứa tên thương hiệu cụ thể qua 5 AI engines. Mỗi prompt trả về nhiều citations, tạo ra dataset 23.387 nguồn duy nhất.
Prompts được phân bổ đều across 4 ngành: B2B SaaS, Consumer Products, Professional Services, Finance. Và 6 loại search intent: Competitor Comparison, Customer Reviews, Direct Evaluation, Functionality/Integrations, Proof/Evidence, Purchasing/Pricing.
Điều quan trọng: đây là branded queries — query có nhắc tên thương hiệu. Tức là user đã biết brand và đang tìm thông tin để đánh giá. Khác với discovery queries (user chưa biết brand).
Off-Page Content Chiếm Bao Nhiêu Phần Trăm Trong AI Citations?
47%. Đó là tỷ lệ citations đến từ earned media — nội dung do bên thứ ba tạo, không phải brand tự viết. Phân tích chi tiết:
| Loại nguồn | Tỷ lệ citations | Ví dụ |
|---|---|---|
| Earned Media (tổng) | 48% | Editorial, forums, review sites, directories |
| Commercial Brand Content | 30% | Blog competitor, case study công ty khác |
| Owned Brand Content | 23% | Website chính thức của brand |
Con số gây sốc nhất: thương hiệu được nhắc tên trực tiếp trong query, nhưng website của chính thương hiệu đó chỉ được trích dẫn 23%. 77% thông tin mà AI dùng đến từ nguồn bên ngoài.
Điều này có nghĩa là truyền thông thương hiệu trên AI không còn nằm trong tầm kiểm soát của website bạn. E-E-A-T truyền thống (tối ưu trên site) là cần thiết nhưng không đủ. Bạn cần brand gravity — sức hấp dẫn thương hiệu lan tỏa khắp hệ sinh thái nội dung web.
Nội Dung Type Nào Được LLM Trích Dẫn Nhiều Nhất?
Đây là phần mà tôi thấy thú vị nhất. Khi phân tích theo content type (không phải nguồn), thứ tự ưu tiên của LLM rất rõ ràng:
| Content type | % Citations | Vai trò |
|---|---|---|
| Reviews & Social Proof | 57% | Trust layer — validation từ bên thứ 3 |
| Directory & Reference Sites | 17% | Wikipedia, Product Hunt, brand profiles |
| Product Pages & Commercial | 12% | Product info, pricing, features |
| Thought Leadership | 5,4% | Blog, research, how-to guides |
| Brand Foundation | ~4,5% | About, Home, FAQ, Contact |
| News & Press | Thấp nhất | Press releases, funding news |
| Video | Thấp nhất | YouTube, video reviews |
57% citations đổ về reviews và social proof. Tôi không ngạc nhiên lắm — các nghiên cứu trước đây đã cho thấy LLM ưu tiên third-party validation. Nhưng mức độ áp đảo thì đáng chú ý: gấp 3,4 lần so với content type xếp thứ hai.
Một phát hiện counter-intuitive: thought leadership (blog, research, hướng dẫn) chỉ chiếm 5,4%. Rất nhiều SEOer (tôi từng nằm trong số đó) đầu tư mạnh vào content marketing với hy vọng được AI cite. Nhưng cho branded queries, nó không hiệu quả bằng reviews và directory listings.
Search Intent Thay Đổi Citation Pattern Như Thế Nào?
Đây là phần có giá trị thực chiến nhất. Citation pattern thay đổi đột ngột theo intent:
Customer Review queries (“What do customers say about Hoka?”): Earned media chiếm 82% citations. AI gần như bỏ qua website brand, ưu tiên TrustPilot, Reddit, social platforms.
Functionality queries (“Does Rare Beauty include liquid blush?”): Owned content lên ngôi với 50% citations. AI về website brand để lấy product specs chính xác.
Competitor Comparison (“HubSpot vs Salesforce?”): Commercial brand content xuất hiện nhiều — competitor publish comparison blog để cạnh tranh.
Bảng tóm tắc chiến lược theo intent:
| Intent | Nguồn được cite nhiều nhất | Chiến lược GEO |
|---|---|---|
| Customer Reviews | Earned media (82%) | Quản lý review trên G2, TrustRadius, Reddit |
| Functionality | Owned content (50%) | Tối ưu product page, documentation |
| Competitor Comparison | Commercial + Earned | Xuất hiện trong listicle, comparison posts |
| Purchasing/Pricing | Mixed | Pricing page rõ ràng + review sites |
Tại Sao Owned Content Chỉ Chiếm 23% Dù Là Branded Query?
Câu hỏi này làm tôi phân vân lúc đầu. Nếu user nhắc tên brand, tại sao AI không vào thẳng website brand đó?
Sau khi đối chiếu với dữ liệu từ các nghiên cứu khác, tôi thấy có 3 lý do chính:
Thứ nhất, LLM được train để avoid self-promotion bias. Brand website có xu hướng highlight điểm mạnh, giấu điểm yếu. AI biết điều đó và ưu tiên nguồn độc lập để câu trả lời cân bằng hơn.
Thứ hai, earned media thường tốt hơn về structured data. Wikipedia, G2, Product Hunt có schema markup chuẩn, nội dung được tổ chức theo format mà LLM dễ trích xuất. Trang About Us của đa số website thì… không.
Thứ ba, topical coverage. Khi user hỏi “HubSpot vs Salesforce”, không một trang nào của HubSpot hay Salesforce trả lời trực tiếp. Reddit thread hoặc G2 comparison mới có thông tin cân bằng.
FAQ Page Có Thực Sự Giúp AI Visibility Không?
Nhiều SEOer (và tôi từng đồng tình) tin rằng FAQ page là vũ khí GEO mạnh. Dữ liệu này nói ngược lại: FAQ pages chỉ chiếm 0,41% tổng citations. About Us (1,92%) và Home page (1,82%) còn cao hơn.
Nhưng đừng vội gỡ FAQ page. Có sự khác biệt quan trọng: FAQPage schema vẫn cực kỳ giá trị cho AI Overviews visibility (3,2x khả năng được cite theo dữ liệu Seer). Nhưng chính FAQ page thì hiếm khi được cite trực tiếp trong LLM responses.
Sự phân biệt này rất quan trọng: schema markup giúp AI hiểu và trích xuất nội dung, nhưng AI chọn cite trang nào còn phụ thuộc vào loại nội dung và nguồn. FAQ schema trên product page hoặc comparison page hiệu quả hơn FAQ page riêng biệt.
Video Và Press Release: Đầu Tư Lãng Phí Cho AI Search?
Theo dataset này, video và press releases có citation rate thấp nhất. Tôi cần cảnh báo trước khi bạn cắt budget:
Video citation thấp có thể do technical limitation — LLM khó trích xuất nội dung từ video hơn là text. Nhưng video review trên YouTube vẫn là brand signal mạnh gián tiếp. Video tạo ra discussions, comments, và Reddit threads — chính những thứ này mới được cite.
Press release thấp vì recency decay. Tin tức cũ nhanh chóng mất giá trị. Nhưng press release tạo được editorial coverage (reporter viết bài dựa trên release), và chính editorial mới là nguồn được cite.
Vậy đừng cắt video hay PR. Hãy hiểu rằng chúng đóng vai trò indirect — tạo ra earned media và social proof, chứ không trực tiếp được LLM cite.
SEOer Việt Nam Cần Làm Gì Với Dữ Liệu Này?
Sau khi phân tích kỹ, tôi rút ra 5 hành động cụ thể cho SEOer Việt Nam, sắp xếp theo ROI:
1. Quản lý review ecosystem tích cực. 57% citations đến từ reviews và social proof. Nếu bạn là B2B SaaS, ưu tiên G2, Capterra, TrustRadius. Nếu là consumer product, tập trung Google Reviews, Shopee/Lazada reviews, TikTok UGC. Đừng chỉ đợi khách tự review — chủ động hỏi, tạo incentive, respond_to mỗi review.
2. Claim và tối ưu directory listings. 17% citations đến từ directory sites. Tối thiểu: Wikipedia (nếu notable), Wikidata entity (luôn làm được), Product Hunt, Built In, Crunchbase. Đảm bảo thông tin brand nhất quán across tất cả platforms.
3. Own comparison conversation. 30% citations đến từ competitor content. Bạn cần publish các “Brand A vs Brand B” trên website mình, nhưng quan trọng hơn — đảm bảo brand bạn xuất hiện trong listicles và comparison posts của bên thứ ba. Pitch guest posts, collaborate với industry bloggers.
4. Tối ưu product page cho functionality queries. Khi user hỏi về feature cụ thể, owned content chiếm 50% citations. Product page cần có: clear feature descriptions, specs trong bảng, FAQPage schema cho common questions, documentation accessible.
5. Đo lường AI visibility định kỳ. Dùng Presenc, Otterly, hoặc Peec AI để track citation rate across AI engines. Benchmark theo competitor. Nếu citation rate thấp hơn competitor 2 lần, vấn đề nằm ở earned media ecosystem, không phải on-page SEO.
Dữ Liệu Này Thay Đổi Tư Duy GEO Như Thế Nào?
Trước nghiên cứu này, nhiều SEOer (bao gồm tôi) tiếp tục GEO như SEO truyền thống plus: tối ưu content cho AI extraction, thêm schema, viết direct answers. Những việc đó vẫn đúng, nhưng dữ liệu 23.000 citations cho thấy 80% kết quả GEO nằm ngoài website bạn.
Đây là sự khác biệt căn bản giữa SEO và GEO:
- SEO: tối ưu trên website để rank cao trên SERP
- GEO: tối ưu hệ sinh thái để AI chọn brand bạn khi trả lời
Bạn không thể control 77% nội dung mà AI dùng để nói về bạn. Nhưng bạn có thể influence — bằng cách xây dựng brand gravity qua reviews, directory presence, comparison visibility, và thought leadership (dù thought leadership chỉ 5,4% trực tiếp, nó shape perception của AI về brand).
Nghiên cứu cũng cho thấy spam policy mà Google áp dụng cho AI search có cơ sở. Khi 48% citations đến từ earned media, việc thao túng citation bằng hidden prompts hay mua citation gần như vô dụng — AI sẽ lấy thông tin từ earned media ecosystem dù bạn có cố.
Kết Luận
Dữ liệu 23.387 citations từ Omniscient Digital xác nhận một điều mà tôi đã nghi ngờ từ lâu: GEO không phải là SEO mở rộng. Nó là một discipline khác hẳn, nơi brand reputation quan trọng hơn keyword optimization.
Nếu bạn chỉ có 10 giờ/tuần cho GEO, tôi khuyên phân bổ thế này: 4 giờ quản lý reviews và directory listings, 3 giờ tạo comparison và decision content, 2 giờ tối ưu product page/schema, 1 giờ đo lường và benchmark.
Đừng dành toàn bộ thời gian tối ưu on-page mà quên rằng 77% thông tin AI dùng về brand bạn đến từ người khác nói về bạn. Brand gravity mới là ranking factor thực sự trong kỷ nguyên AI search.
