Vì sao sitemap.xml trong Google Webmaster không lập chỉ mục cho bạn?

Bất kỳ một người làm SEO nào cũng phải nắm vứng công cụ Google Webmaster Tools . Trong đó việc gửi sitemap.xml cho Google qua đây là bắt buộc với bất kỳ dự án SEO nào, nhưng có một vấn đề là số lượng gửi và được lập chỉ mục một số website thường rất thấp, trong bài viết này Tú sẽ giải thích cho các bạn vì sao lại như vậy.

Sơ đồ trang web (sitemap) không được lập chỉ mục

Sơ đồ trang web (sitemap) không được lập chỉ mục

Tú có tham gia tư vấn cho một số Website và xử lý cho họ về việc số lượng index của sitemap quá thấp, sau khi xử lý thì số lượng gửi và lập chỉ mục luôn đạt > 95%.

Những lý do Sitemap.xml của bạn không được lập chỉ mục đầy đủ.

1 .Bạn đang gửi các liên kết không tồn tại 404.

Một số Website không được tạo sitemap tự động mà ở dạng thủ công. Hoặc một số Website sử dụng các bộ code tự lập trình và lập trình viên không kiểm soát kỹ, có thể họ không tạo sitemap định kỳ hoặc họ bao gồm cả các liên kết đã bị xóa khỏi trang (VD chỉ thêm các url mới mà ko xóa các url cũ khỏi sitemap).

Đây là lỗi phổ biến nhất, dấu hiệu nhận biệt là bạn kiểm tra phần lỗi thu thập dữ liệu, lỗi 404 và nhấp chuột vào các link bị báo sau đó bạn nhấp tiếp vào được liên kết từ. Nếu bên trong danh sách này của bạn có chứa liên kết từ sitemap.xml thì chắc chắn bạn đã gặp lỗi ngày.

VD về lỗi 404 với 1 website

VD về lỗi 404 với 1 website

Để xử lý hết lỗi 404 chính xác thì bạn làm theo hướng dẫn tại đây: xử lý lỗi 404 cho website.

2. Bạn đang gửi các nội dung mỏng, giá trị thấp.

Phần này thì khó phát hiện hơn vì không có dấu hiệu, thông thường nếu không phải vấn đề trên thì sẽ là vấn đề này. Dấu hiệu thì bạn phải xem lại cấu trúc các link được gửi cho sitemap và kiểm tra thử một số nội dung của trang. Lưu ý không phải xem từng bài 1, mà bạn phải xem các trang đại diện trong 1 website.

VD:

  • 01 bài tranh danh mục
  • 01 bài trang bài viết
  • 01 bài trang thương hiệu

Thường thì một số trang khi người làm web làm, họ không hiểu nên cứ gặp link nào cũng đưa hết vào sitemap.xml . Cách fix bây giờ là liên hệ với người làm website nhắn họ gỡ giúp các liên kết này ra khỏi website của bạn. Sau đó bạn có thể gửi lại sitemap cho Google xem xét.

3. Bạn đang chạy index một số nội dung mà bạn đã gửi.

Có 2 cách để chặn Google index một nội dung nào đó trên Website của bạn đó là sử dụng robots.txt file và robots tag (Tú có viết 1 bài rất chi tiết, chưa hiểu rõ 2 cái này là gì thì bạn nên coi lại). Cách nhận biện cái này thì khá đơn giản, bạn cũng dựa vào phần lỗi trang web của Google. Để ý có 1 tab tên là bị chặn.

Nội dung bị chặn không cho Google lập chỉ mục

Nội dung bị chặn không cho Google lập chỉ mục.

Cái này thì đơn giản rồi nhé. Ta lại tiếp tục click vào link bên dưới và chọn phần được liên kết. Nếu thấy có link của sitemap như ở phần 1 thì đó chính là vấn đề. Bây giờ bạn phải lựa chọn, nếu đã chặn thì gỡ nó khỏi sitemap, hoặc bỏ chặn.

Trên đây là 03 lý do phổ biến nhất và cách xử lý cho từng trường hợp. Việc xử lý tương đối đơn giản nếu bạn hiểu và nắm được các kiến thức cơ bản về cách Google lập chỉ mục và xếp hạng Website (xem lại tại đây). Mọi thứ đều đến từ những kiến thức cơ bản. Muốn giỏi phải nắm được các kiến thức cơ bản, quanh đi quẩn lại cũng chỉ có như vậy thôi.

Nhờ nắm vững các kiến thức này mà Tú đã hỗ trợ được rất nhiều công ty. Và nói chung mình có thể tự tư duy và phán đoán được khi có cập nhật mới.

Chúc bạn thành công!

Leave a Reply