Gần hai tháng nay, cộng đồng SEO toàn cầu đang chứng kiến một hiện tượng đáng lo ngại: Google gỡ bỏ URL khỏi chỉ mục với tốc độ cao bất thường. Pedro Dias, cựu nhân viên Google, là người đầu tiên đặt câu hỏi trên X vào đầu tháng 4, và hàng trăm SEOer đã xác nhận cùng một pattern. John Mueller thì nói “không thấy gì đặc biệt”. Cả hai đều có thể đúng cùng lúc.
Google đang deindex URL nhiều hơn từ tháng 4/2026?
Có. Từ đầu tháng 4/2026, nhiều SEOer báo cáo số trang được index giảm 15-30% chỉ trong vài tuần. Pedro Dias đăng trên X hỏi liệu ai khác cũng thấy pattern này, nhận hàng trăm phản hồi đồng tình. Screenshots Google Search Console cho thấy đồ thị indexed pages trượt dốc liên tục, đặc biệt sau March 2026 Core Update.
John Mueller nói gì về hiện tượng deindex này?
John Mueller trả lời trực tiếp trên Bluesky: “Some sites go up, some sites go down — I don’t see anything exceptional there.” Đây không phải phủ nhận việc Google đang gỡ URL. Mueller nói rằng tốc độ gỡ không đáng kể so với bình thường. Từ bên trong Google, đây là hệ thống hoạt động đúng thiết kế. Từ bên ngoài, nhìn indexed pages giảm 30% trong 12 tuần thì không ai gọi là “bình thường”.
Nguyên nhân nào khiến Google deindex hàng loạt?
Sau khi tôi phân tích dữ liệu từ nhiều nguồn, có ba lý do chính phù hợp với bằng chứng hiện có.
Thứ nhất: ngưỡng chất lượng tăng sau March 2026 Core Update. Core update tháng 3 và spam update hoàn tất cuối tháng 3. Pages nằm ở ranh giới chất lượng trước đó giờ trở thành mục tiêu gỡ index. Đã từng xảy ra y hệt vào tháng 5/2025 — Indexing Insight ghi nhận hơn 25% trong 2 triệu URL bị gỡ trong khoảng 30 ngày.
Thứ hai: bão AI content buộc Google chọn lọc khắt khe hơn. Nội dung do AI tạo đang tràn ngập web nhanh hơn khả năng xử lý của hệ thống chất lượng Google. Phản hồi cơ sở hạ tầng tất yếu: selective indexing thay vì index mọi thứ mặc định. Đây không phải nguyên nhân mà là hệ quả tất yếu.
Thứ ba: artifact từ báo cáo Search Console. Valentin Pletzer đưa ra giả thuyết reporting bug, và tôi thấy không nên loại trừ. Báo cáo index coverage của Search Console được sample, batch và lag. Phần deindex có thể là thật, phần còn lại là reporting đang bắt kịp trạng thái thực tế.
Trang nào đang bị deindex nhiều nhất?
Theo dữ liệu từ lần purge tương tự năm 2025, các trang bị nhắm tới có đặc điểm chung: nội dung mỏng (thin content), trùng lặp (duplicate), không có tương tác (zero clicks, impressions gần 0), hoặc đã cũ không cập nhật. Stefano Galloni của K-Hub tóm gọn: “It takes much more value to stay in.” Tức là giờ bạn phải chứng minh mình xứng đáng được index, thay vì Google index trước rồi mới hỏi sau.
Deindex ảnh hưởng thế nào đến AI Overviews và AI Mode?
Zander Chrystall đưa ra điểm quan trọng nhất mà nhiều SEOer chưa nhận ra: trang rơi khỏi Google index cũng đồng thời rơi khỏi pool mà AI Overviews, AI Mode và các AI engine khác sử dụng để tạo câu trả lời. Nói cách khác, index health và AI visibility đang hội tụ thành cùng một vấn đề. Nếu trang bạn bị deindex, bạn mất cả traffic organic lẫn cơ hội xuất hiện trong AI answers.
Tôi nên kiểm tra website mình như thế nào?
Mở Google Search Console, vào mục Index > Pages. Kiểm tra hai trạng thái “Crawled — currently not indexed” và “Discovered — currently not indexed”. Nếu số lượng đang tăng, đó là dấu hiệu website bạn đang bị ảnh hưởng. Xuất danh sách URL, phân loại theo loại nội dung, ngày publish và traffic để xác định pattern cụ thể.
SEOer Việt Nam cần làm gì ngay để bảo vệ index?
Tôi khuyến nghị sáu hành động cụ thể, thực hiện ngay trong tuần này.
1. Audit toàn bộ trang bị deindex. Xuất danh sách từ Search Console, so sánh với URL thực tế trên website. Xác định trang nào thực sự đáng giữ, trang nào nên loại bỏ chủ động.
2. Redirect trang bị deindex có giá trị. Nếu trang cũ bị gỡ nhưng vẫn có backlink, redirect 301 đến trang liên quan gần nhất. Đừng để backlink rơi vào 404.
3. Cập nhật nội dung cũ. Thêm data mới, refresh số liệu, mở rộng nội dung mỏng. Google đang ưu tiên freshness — nội dung cập nhật gần đây có khả năng được index lại cao hơn.
4. Thêm structured data. Schema markup là một tín hiệu Google dùng để quyết định trang nào đáng index. Đảm bảo Article, Product, Breadcrumb schema được triển khai đúng trên mọi trang quan trọng.
5. Dọn dẹp thin content. Trang không mang giá trị thật sự nên tự noindex hoặc gỡ bỏ. Tốt hơn là chủ động loại bỏ trước khi Google quyết định giúp bạn.
6. Theo dõi đều đặn trước quarterly core update. Pattern 2025-2026 cho thấy core update mỗi quý là baseline mới. Website có nội dung chất lượng, cấu trúc tốt, schema đầy đủ sẽ vượt qua các đợt purge. Website mỏng, thiếu structured data, nhiều 404 sẽ mất trang mà không hề hay biết.
Google đã từng làm điều này trước đây chưa?
Có. Vào tháng 5/2025, Indexing Insight công bố nghiên cứu theo dõi 2 triệu URL: hơn 25% bị gỡ khỏi index Google trong khoảng 30 ngày. Các site mất từ 15% đến 75% indexed pages. Pattern: trang có tương tác thấp hoặc gần bằng không là mục tiêu chính. Đợt đó xảy ra ngay trước June 2025 Core Update. Đợt năm nay xảy ra ngay sau March 2026 Core Update. Google đã làm trước, đang làm, và sẽ làm lại.
Quick Answer
Từ tháng 4/2026, nhiều SEOer báo cáo Google deindex URL với tốc độ cao bất thường. Cựu Googler Pedro Dias khởi xướng cuộc thảo luận trên X, John Mueller nói “không thấy gì đặc biệt”. Ba nguyên nhân chính: ngưỡng chất lượng tăng sau core update, bão AI content buộc selective indexing, và reporting artifact từ Search Console. Trang bị ảnh hưởng nhiều nhất: thin content, zero engagement, nội dung cũ. Quan trọng nhất: trang rơi khỏi index cũng mất cơ hội xuất hiện trong AI Overviews. SEOer cần audit index ngay, redirect trang có giá trị, cập nhật nội dung cũ, và thêm structured data.