Kể từ đầu tháng 4/2026, hàng trăm SEOer trên toàn cầu đang báo cáo cùng một hiện tượng: trang đang index ngon lành bỗng nhiên biến mất khỏi Google mà không có manual action, không có cảnh báo, không có thông báo nào trong Search Console. Pedro Dias — cựu nhân viên Google Search — đã đặt câu hỏi trên X và nhận được hàng trăm phản hồi đồng tình. John Mueller đáp lại bằng câu nói giờ đã thành meme: “Tôi không thấy gì bất thường cả.”
Nhưng dữ liệu nói khác. Sau khi test và theo dõi trên nhiều website trong 2 tháng qua, tôi quyết định viết bài phân tích này để SEOer Việt Nam hiểu chính xác chuyện gì đang xảy ra, 5 loại nội dung nào đang bị nhắm đến, và cần làm gì ngay tuần này.
Google Đang Xóa Trang Khỏi Index Ở Tốc Độ Nào?
Theo dữ liệu từ Indexing Insight công bố tháng 5/2025 (đợt purge trước đó), trên 2 triệu URL được theo dõi, hơn 25% bị xóa khỏi index trong cửa sổ 30 ngày. Các site trong nghiên cứu mất từ 15% đến 75% số trang được index. Đợt đó xảy ra ngay trước core update tháng 6/2025.
Đợt hiện tại bắt đầu từ tháng 4/2026, ngay sau khi March 2026 spam update và core update hoàn tất. Pattern giống hệt — Google nâng ngưỡng chất lượng rồi purge hàng loạt. Một site mid-size mà tôi theo dõi có graph Search Console giảm từ 225.000 trang index xuống 155.000 trang trong 12 tuần. Không có manual action nào.
5 Loại Nội Dung Đang Nằm Trong Tầm Ngắm Của Google
Sau khi cross-reference báo cáo từ Search Engine Roundtable, Cicero Studio, Digital Applied và hàng chục thread trên LinkedIn/X, tôi nhận ra 5 loại nội dung bị deindex nhiều nhất:
- Nội dung AI chưa qua chỉnh sửa: Bài viết sản xuất hàng loạt bằng LLM không có review, không có dữ liệu độc quyền, không có góc nhìn chuyên môn. Google ngày càng giỏi nhận diện chúng dưới dạng duplicate tại quy mô lớn.
- Nội dung mỏng (thin content): Trang dưới 400 từ, không thêm giá trị, biến thể internal gần giống nhau, category page không có nội dung editorial.
- Nội dung cũ không bao giờ refresh: Bài từ 2020-2023, số liệu hết hạn, khuyến nghị không còn đúng với query hiện tại.
- Trang engagement thấp: Trang có impression trong GSC nhưng CTR gần 0 và session time gần 0. Google đọc điều này như “nội dung không thoã mãn search intent.”
- Bulk publishing không có quality control: Site đăng hàng trăm đến hàng nghìn trang trong vài tuần, đặc biệt qua programmatic SEO với dưới 50% nội dung unique mỗi trang.
Điều quan trọng cần hiểu: Google không nhắm vào “AI content” nói chung. Một bài viết có sự hỗ trợ của AI nhưng được edit kỹ, có dữ liệu độc quyền, có góc nhìn riêng — vẫn an toàn. Một bài viết do người viết nhưng generic, không có expertise — cũng gặp rủi ro tương tự.
Thread r/SEO Vụ 1.800 Bài/Tháng: Ngưỡng An Toàn Là Bao Nhiêu?
Một thread trên r/SEO với tiêu đề “Is there any way to make 1,800 posts per month work” thu hút 101 bình luận vào giữa tháng 5/2026. Gần như không ai bênh vực ý tưởng đó. Điều thú vị là các practitioner đã ngừng tranh luận “AI content có sống sót không” và chuyển sang trao đổi ngưỡng volume thực tế.
Số mà cộng đồng đồng tình: 10-15 bài chất lượng/tuần cho team 5 người. Tức là khoảng 40-60 bài/tháng. So với 1.800 bài/tháng — gap là 30 lần. Digital Applied phân tích sau March 2026 update: niche info site với 500+ AI page mất 50-80% traffic trong 2 tuần. Affiliate site mất 40-70%. Ngưỡng rủi ro bắt đầu từ 10+ bài/ngày duy trì liên tục nhiều tháng.
Một chi tiết ít người để ý: crawl budget. Site đăng 60 URL/ngày nhưng Google chỉ allocated crawl 8 URL/ngày thì 87% sản xuất sẽ ngồi ngoài index bất kể chất lượng.
John Mueller Nói “Không Có Gì Bất Thường” — Đúng Hay Sai?
Cả hai. Từ bên trong Google, hệ thống đang chạy bình thường — index được purge định kỳ là behavior có từ lâu. Từ bên ngoài, nhìn indexed page count giảm 30% trong 12 tuần thì không “bình thường” chút nào.
Sự bất đối xứng thông tin chính là câu chuyện ở đây. Google không có nghĩa vụ công bố ngưỡng deindexing. Bạn biết mình vượt ngưỡng khi graph trong Search Console flatline. Stefano Galloni từ K-Hub tóm gọn: “Bây giờ tốn nhiều giá trị hơn nhiều để được ở lại trong index.”
3 Nguyên Nhân Khả Dĩ — Không Loại Trừ Nhau
Sau khi phân tích tất cả bằng chứng, tôi thấy 3 nguyên nhân đều đóng góp:
1. Ngưỡng chất lượng tăng sau March 2026 updates. Spam update tháng 3 nhắm vào bulk AI content, expired domain manipulation, site reputation abuse. Core update nâng composite scoring. Trang marginal trước đó trở thành unindexable.
2. AI content saturation buộc Google chọn lọc gắt hơn. Lượng nội dung đăng mỗi ngày tăng vọt kể từ khi AI writing tool phổ biến. Selective indexing là phản ứng hạ tầng tất yếu — không phải bug, là design decision.
3. Search Console reporting artifact. Valentin Pletner đặt nghi vấn này từ đầu. GSC index coverage report được sampled, batched và lagged. Một phần “deindexing” có thể là report đang cập nhật trạng thái đã thật từ trước. Điều này giải thích vì sao một số site thấy indexed count giảm mạnh nhưng traffic không giảm tương ứng.
Tại Sao Deindexing Còn Là Vấn Đề Của AI Search?
Đây là điểm nhiều SEOer bỏ qua. Zander Chrystall đã chỉ ra điều quan trọng nhất trong thread Pedro Dias: trang bị out khỏi Google index cũng out khỏi AI Overviews pool. Index health và AI visibility đang converge thành cùng một vấn đề.
Nghĩa là nếu bạn đang tối ưu cho AI Search, kiểm tra index status là bước số 0. Không index = không xuất hiện trong organic, không xuất hiện trong AI Overviews, không xuất hiện trong ChatGPT citations thu thập từ web. Một trang bị drop, bạn mất visibility trên 4-5 surface cùng lúc.
Search Console 50 Tuần Data Bug: Phức Tạp Hơn Cần Thiết
Đúng lúc cộng đồng cần data chính xác nhất thì Google xác nhận bug kéo dài gần 1 năm: lỗi logging từ 13/5/2025 đến 27/4/2026 (50 tuần) gây over-reporting impressions trong Search Console. Dữ liệu không thể recover. Cùng lúc, Links report cũng bị broken, Discover report có 2 bug trong tháng.
Điều này có nghĩa là nếu bạn so sánh impression data tháng 5/2026 với tháng 5/2025, số liệu bị nhiễu. Phải dùng data sau 27/4/2026 làm baseline mới. Don’t trust impression trends spanning pre/post April 2026.
SEOer Cần Làm Gì Ngay Tuần Này?
Sau khi test trên nhiều site và theo dõi pattern 2 tháng, đây là checklist tôi đang chạy cho tất cả khách hàng:
1. Audit GSC Coverage. Vào Search Console, Coverage report, so sánh “Valid” page count tuần này vs 30 ngày trước. Drop quá 10% là cần investigate ngay. Focus vào “Crawled — currently not indexed” và “Discovered — currently not indexed” đang tăng hay không.
2. Identify zombie pages. Export toàn bộ indexed URL, cross-reference với performance data. Page có 0 click trong 90 ngày và dưới 100 impression là ứng viên revise hoặc consolidate (301 redirect về page mạnh hơn). Đừng giữ trang không phục vụ ai.
3. Audit AI content ratio. Nếu bạn publish bằng AI tool, đếm tỷ lệ bài chưa qua human edit. Nếu trên 50%, bạn đang ở zone rủi ro cao. Rút xuống dưới 30%, ưu tiên bài có first-party data hoặc case study riêng.
4. Refresh nội dung cũ. Bài từ 2021-2023 có traffic giảm, update số liệu, thêm section mới, đổi title nếu cần. Freshness signal đang được weighted nặng hơn sau May 2026 core update.
5. Theo dõi crawl budget. Nếu Google crawl 8 URL/ngày trên site bạn, đừng đăng 60. Tăng chất lượng, giảm frequency. Submit sitemap sạch, xóa redirect chain, block low-value page trong robots.txt.
Đừng Hoảng, Nhưng Đừng Bỏ Qua
Google nói “không có gì bất thường” vì từ góc nhìn hệ thống, đây là routine calibration. Nhưng routine calibration ở quy mô Google = hàng triệu trang bị ảnh hưởng. Nếu site bạn đang bị, không phải do Google bắt bài bạn — mà là ngưỡng chất lượng đã tăng và nội dung của bạn chưa theo kịp.
Sites đầu tư vào nội dung có nguồn rõ ràng, tác giả được identify, expertise có thể verify — không bị động. Sites publish at scale không có quality control trong 12 tháng qua — window để fix đang đóng lại.
Tôi sẽ tiếp tục theo dõi pattern này qua Q3/2026 và cập nhật khi có core update mới. Nếu bạn muốn audit nhanh index health, bắt đầu từ GSC Coverage report ngay hôm nay.