Vì sao sitemap.xml trong Google Webmaster không lập chỉ mục cho bạn?
Bất kỳ một người làm SEO nào cũng phải nắm vứng công cụ Google Webmaster Tools . Trong đó việc gửi sitemap.xml cho Google qua đây là bắt buộc với bất kỳ dự án SEO nào, nhưng có một vấn đề là số lượng gửi và được lập chỉ mục một số website thường rất thấp, trong bài viết này Tú sẽ giải thích cho các bạn vì sao lại như vậy.
Tú có tham gia tư vấn cho một số Website và xử lý cho họ về việc số lượng index của sitemap quá thấp, sau khi xử lý thì số lượng gửi và lập chỉ mục luôn đạt > 95%.
Những lý do Sitemap.xml của bạn không được lập chỉ mục đầy đủ.
1 .Bạn đang gửi các liên kết không tồn tại 404.
Một số Website không được tạo sitemap tự động mà ở dạng thủ công. Hoặc một số Website sử dụng các bộ code tự lập trình và lập trình viên không kiểm soát kỹ, có thể họ không tạo sitemap định kỳ hoặc họ bao gồm cả các liên kết đã bị xóa khỏi trang (VD chỉ thêm các url mới mà ko xóa các url cũ khỏi sitemap).
Đây là lỗi phổ biến nhất, dấu hiệu nhận biệt là bạn kiểm tra phần lỗi thu thập dữ liệu, lỗi 404 và nhấp chuột vào các link bị báo sau đó bạn nhấp tiếp vào được liên kết từ. Nếu bên trong danh sách này của bạn có chứa liên kết từ sitemap.xml thì chắc chắn bạn đã gặp lỗi ngày.
Để xử lý hết lỗi 404 chính xác thì bạn làm theo hướng dẫn tại đây: xử lý lỗi 404 cho website.
2. Bạn đang gửi các nội dung mỏng, giá trị thấp.
Phần này thì khó phát hiện hơn vì không có dấu hiệu, thông thường nếu không phải vấn đề trên thì sẽ là vấn đề này. Dấu hiệu thì bạn phải xem lại cấu trúc các link được gửi cho sitemap và kiểm tra thử một số nội dung của trang. Lưu ý không phải xem từng bài 1, mà bạn phải xem các trang đại diện trong 1 website.
VD:
- 01 bài tranh danh mục
- 01 bài trang bài viết
- 01 bài trang thương hiệu
Thường thì một số trang khi người làm web làm, họ không hiểu nên cứ gặp link nào cũng đưa hết vào sitemap.xml . Cách fix bây giờ là liên hệ với người làm website nhắn họ gỡ giúp các liên kết này ra khỏi website của bạn. Sau đó bạn có thể gửi lại sitemap cho Google xem xét.
3. Bạn đang chạy index một số nội dung mà bạn đã gửi.
Có 2 cách để chặn Google index một nội dung nào đó trên Website của bạn đó là sử dụng robots.txt file và robots tag (Tú có viết 1 bài rất chi tiết, chưa hiểu rõ 2 cái này là gì thì bạn nên coi lại). Cách nhận biện cái này thì khá đơn giản, bạn cũng dựa vào phần lỗi trang web của Google. Để ý có 1 tab tên là bị chặn.
Cái này thì đơn giản rồi nhé. Ta lại tiếp tục click vào link bên dưới và chọn phần được liên kết. Nếu thấy có link của sitemap như ở phần 1 thì đó chính là vấn đề. Bây giờ bạn phải lựa chọn, nếu đã chặn thì gỡ nó khỏi sitemap, hoặc bỏ chặn.
Trên đây là 03 lý do phổ biến nhất và cách xử lý cho từng trường hợp. Việc xử lý tương đối đơn giản nếu bạn hiểu và nắm được các kiến thức cơ bản về cách Google lập chỉ mục và xếp hạng Website (xem lại tại đây). Mọi thứ đều đến từ những kiến thức cơ bản. Muốn giỏi phải nắm được các kiến thức cơ bản, quanh đi quẩn lại cũng chỉ có như vậy thôi.
Nhờ nắm vững các kiến thức này mà Tú đã hỗ trợ được rất nhiều công ty. Và nói chung mình có thể tự tư duy và phán đoán được khi có cập nhật mới.
Chúc bạn thành công!
32 Bình luận
Chào anh, em có một thắc mắc, mong anh xem giúp. Em tạo sitemap bằng YoastSEO, nhưng không hiểu tại sao nó tự động tạo sitemap http, chứ không tạo https. Đây là link >>> https://zenszens.com/sitemap_index.xml Cám ơn anh.
Chào bạn, Xin chỉ giúp mình vấn đề này với. Mình có các URL đã được lập chỉ mục , nhưng phần Sơ đồ sitemap bị ghi là Không có, Vậy mình phải khắc phục từ chỗ nào được bạn . Mong bạn chỉ giúp, Trân trọng.
Chào bạn mình thường zô web bạn đọc. Cảm ơn bạn đã chia sẽ thông tin tuy nhiều cái ngắn nhưng súc tích đọc ngẫm 1 lúc mới hiểu a .:) Bạn cho mình ??? Lỗi máy chủ (5xx) + Lỗi 404 thì làm sao giải quyết vậy bạn Mong sớm ngày phản hồi từ bạn
Anh ơi a check hộ e sitemap này với ạ, e bị lỗi "đã lập chỉ mục, chưa có sơ đồ trang web ạ": https://phandanganh.com/sitemap_index.xml
Mình không được google quét url. Tổng số quét url sitemap chính là bằng 0. Mình đã gửi sitemap 6 tháng nay rồi. Giờ gửi lại nhưng vẫn thês. Giờ có 70 url hợp lệ nhưng không được đưa vào sitemap. Trang của mình thì đc bing index rất nhiều nhưng google gần như không có. Mình dùng rankmath dể lập sitemap, robots. Không biết là lỗi ở đâu. Xem giúp mình với. sitemap: https://thebestsolution4u.com/sitemap_index.xml ảnh chụp: https://www.dropbox.com/s/ub77uou6qpjzbpz/sitemap%20khong%20tim%20thay%20url.png?dl=0