Bất kỳ một người làm SEO nào cũng phải nắm vứng công cụ Google Webmaster Tools . Trong đó việc gửi sitemap.xml cho Google qua đây là bắt buộc với bất kỳ dự án SEO nào, nhưng có một vấn đề là số lượng gửi và được lập chỉ mục một số website thường rất thấp, trong bài viết này Tú sẽ giải thích cho các bạn vì sao lại như vậy.

Tú có tham gia tư vấn cho một số Website và xử lý cho họ về việc số lượng index của sitemap quá thấp, sau khi xử lý thì số lượng gửi và lập chỉ mục luôn đạt > 95%.
Những lý do Sitemap.xml của bạn không được lập chỉ mục đầy đủ.
1 .Bạn đang gửi các liên kết không tồn tại 404.
Một số Website không được tạo sitemap tự động mà ở dạng thủ công. Hoặc một số Website sử dụng các bộ code tự lập trình và lập trình viên không kiểm soát kỹ, có thể họ không tạo sitemap định kỳ hoặc họ bao gồm cả các liên kết đã bị xóa khỏi trang (VD chỉ thêm các url mới mà ko xóa các url cũ khỏi sitemap).
Đây là lỗi phổ biến nhất, dấu hiệu nhận biệt là bạn kiểm tra phần lỗi thu thập dữ liệu, lỗi 404 và nhấp chuột vào các link bị báo sau đó bạn nhấp tiếp vào được liên kết từ. Nếu bên trong danh sách này của bạn có chứa liên kết từ sitemap.xml thì chắc chắn bạn đã gặp lỗi ngày.

Để xử lý hết lỗi 404 chính xác thì bạn làm theo hướng dẫn tại đây: xử lý lỗi 404 cho website.
2. Bạn đang gửi các nội dung mỏng, giá trị thấp.
Phần này thì khó phát hiện hơn vì không có dấu hiệu, thông thường nếu không phải vấn đề trên thì sẽ là vấn đề này. Dấu hiệu thì bạn phải xem lại cấu trúc các link được gửi cho sitemap và kiểm tra thử một số nội dung của trang. Lưu ý không phải xem từng bài 1, mà bạn phải xem các trang đại diện trong 1 website.
VD:
- 01 bài tranh danh mục
- 01 bài trang bài viết
- 01 bài trang thương hiệu
Thường thì một số trang khi người làm web làm, họ không hiểu nên cứ gặp link nào cũng đưa hết vào sitemap.xml . Cách fix bây giờ là liên hệ với người làm website nhắn họ gỡ giúp các liên kết này ra khỏi website của bạn. Sau đó bạn có thể gửi lại sitemap cho Google xem xét.
3. Bạn đang chạy index một số nội dung mà bạn đã gửi.
Có 2 cách để chặn Google index một nội dung nào đó trên Website của bạn đó là sử dụng robots.txt file và robots tag (Tú có viết 1 bài rất chi tiết, chưa hiểu rõ 2 cái này là gì thì bạn nên coi lại). Cách nhận biện cái này thì khá đơn giản, bạn cũng dựa vào phần lỗi trang web của Google. Để ý có 1 tab tên là bị chặn.

Cái này thì đơn giản rồi nhé. Ta lại tiếp tục click vào link bên dưới và chọn phần được liên kết. Nếu thấy có link của sitemap như ở phần 1 thì đó chính là vấn đề. Bây giờ bạn phải lựa chọn, nếu đã chặn thì gỡ nó khỏi sitemap, hoặc bỏ chặn.
Trên đây là 03 lý do phổ biến nhất và cách xử lý cho từng trường hợp. Việc xử lý tương đối đơn giản nếu bạn hiểu và nắm được các kiến thức cơ bản về cách Google lập chỉ mục và xếp hạng Website (xem lại tại đây). Mọi thứ đều đến từ những kiến thức cơ bản. Muốn giỏi phải nắm được các kiến thức cơ bản, quanh đi quẩn lại cũng chỉ có như vậy thôi.
Nhờ nắm vững các kiến thức này mà Tú đã hỗ trợ được rất nhiều công ty. Và nói chung mình có thể tự tư duy và phán đoán được khi có cập nhật mới.
Chúc bạn thành công!
Chào anh, em có một thắc mắc, mong anh xem giúp. Em tạo sitemap bằng YoastSEO, nhưng không hiểu tại sao nó tự động tạo sitemap http, chứ không tạo https. Đây là link >>> https://zenszens.com/sitemap_index.xml
Cám ơn anh.
Do nó chưa được config đúng, em cài thêm cái này vào và kích hoạt là được. https://vi.wordpress.org/plugins/really-simple-ssl/
Em làm được rồi, cảm ơn anh nhiều!
Chào bạn,
Xin chỉ giúp mình vấn đề này với. Mình có các URL đã được lập chỉ mục , nhưng phần Sơ đồ sitemap bị ghi là Không có, Vậy mình phải khắc phục từ chỗ nào được bạn . Mong bạn chỉ giúp, Trân trọng.
Chào Huy,
1. Đầu tiên bạn kiểm tra xem sitemap đó đã đúng cấu trúc như trong bài hay chưa?
2. File đó bạn có truy cập được bình thường hay không?
Vấn đề của bạn do 1 trong 2 cái kể trên
Mình cảm ơn bạn . Về file thì mình đã thử kiểm tra copy/paste qua google nó hiện lên bình thường. Còn cấu trúc của sitemap đúng như trong bài thì mình không hiểu điều này. Mình nên nhờ bên thiết kế web họ kiểm tra hay mình có thể tự kiểm tra được. vậy Bạn
Bạn có thể kiểm tra hoặc nhờ họ kiểm tra, về nguyên tắc thì có những thẻ kia. Ngoài ra bạn có thể tìm trên google một số web cho bạn kiểm tra cấu trúc. https://www.xml-sitemaps.com/validate-xml-sitemap.html
Chào bạn mình thường zô web bạn đọc. Cảm ơn bạn đã chia sẽ thông tin tuy nhiều cái ngắn nhưng súc tích đọc ngẫm 1 lúc mới hiểu a .:)
Bạn cho mình ??? Lỗi máy chủ (5xx) + Lỗi 404 thì làm sao giải quyết vậy bạn
Mong sớm ngày phản hồi từ bạn
Chào bạn,
– Lỗi 5xx là lỗi máy chủ: Tức là về phần máy chủ có vấn đề, có thể là máy chủ lỗi, máy chủ đọc code nhưng quá thời gian không hiểu, không xử lý nổi lỗi. Phần này bạn liên hệ với bên cung cấp máy chủ để họ đọc log trong hệ thống mới biết vì sao.
– Lỗi 404 là lỗi trang ko tồn tại, thuộc về chủ website, ví dụ bạn xóa 1 bài viết làm mất dường dẫn thì người dùng sau sẽ không xem được và nó trả về lỗi 404. (https://nguyencaotu.com/loi-404-la-gi.html)
Không hiểu sao mình add sitemap vào mà nó cứ báo là “không tìm nạp được” https://www.thanbinh.com/sitemap.xml
Chào bạn,
Khi mới thêm siteamp vào gpppgle, thì hãy chờ khoảng 30 phút đến 24h. Sau đó google mới nạp đc hết và đổi trạng thái.
Mình không được google quét url. Tổng số quét url sitemap chính là bằng 0. Mình đã gửi sitemap 6 tháng nay rồi. Giờ gửi lại nhưng vẫn thês. Giờ có 70 url hợp lệ nhưng không được đưa vào sitemap. Trang của mình thì đc bing index rất nhiều nhưng google gần như không có. Mình dùng rankmath dể lập sitemap, robots. Không biết là lỗi ở đâu. Xem giúp mình với.
sitemap: https://thebestsolution4u.com/sitemap_index.xml
ảnh chụp: https://www.dropbox.com/s/ub77uou6qpjzbpz/sitemap%20khong%20tim%20thay%20url.png?dl=0
Chào bạn,
Bên ngoài thì không xem được, về cấu trúc thì các plugin seo bây giờ họ đều đã làm đúng. Bạn nên click vào từng phần lập chỉ mục của google nó báo, các link nào bị từ chối và check theo từng link đó. Như vậy mới ra được vấn đề.
Lưu ý: Trong khoảng 02 năm trở lại đây, google bắt đầu loại bỏ tag và các trang có nội dung thấp.
Anh ơi a check hộ e sitemap này với ạ, e bị lỗi “đã lập chỉ mục, chưa có sơ đồ trang web ạ”: https://phandanganh.com/sitemap_index.xml
Chào bạn,
Sitemap của bạn chuẩn rồi, cứ kệ nó thôi. Mấy hôm nữa vào là thấy nó lập chỉ mục tốt.
Có cách nào để “ép” GG index nhanh không bác Tú?
Chào bạn,
Bạn dùng Google Webmaster Tools có phần submit url từ trong url, index chắc khoảng 5 phút là thấy trên google. Một số thời điểm sẽ lâu hơn nhưng không quá 24h.
xin chào !
hiện tại web mình bị lỗi google ko add được site map vô.
báo lỗi :
Sơ đồ trang web có thể đọc được, nhưng có lỗi
Định dạng tệp không được hỗ trợ
bạn có thể hướng dẫn mình xử lý lỗi này đc không, tình trạng mới bị hôm nay thôi.
web mình chạy đc 7 năm rồi, không thấy lỗi này, tự dưng hôm nay báo lỗi.
cảm ơn bạn !
web của mình: http://www.congnghemay.info/
Chào bạn,
https://www.congnghemay.info/sitemap_index.xml
Mình check thì đây là sơ đồ web của bạn, mọi thứ đúng. Bạn cứ gửi lại nhé. Nhớ là nó chỉ cho bạn điền hậu tố sitemap_index.xml trong cái khung khai báo sitemaps thôi.
Các anh chị cho e hỏi. Web e bị lỗi google seach console không thể tìm nạp sitemap ạ. Bác nào biết cách khắc phục chỉ e với ạ. e cám ơn ạ. Web e đây ạ: https://2event.vn/
Chào Việt,
Sitemap của bạn hiện tại mình check đúng, bạn cứ khai báo và chờ vài ngày là nó cập nhật.
https://2event.vn/sitemap_index.xml
Các anh chị cho e hỏi. Web e bị lỗi google seach console không thể tìm nạp sitemap ạ. Bác nào biết cách khắc phục chỉ e với ạ. e cám ơn ạ.
Chào Tú. Tú có thể kiểm tra giúp mình website nhagiatot.net được không ạ. Mình đã tạo sitemap và lập chỉ mục. Nhưng index khá kém và duyệt link ít. Và khi vào link nhagiatot.net/sitemaps.xml lại bị lỗi 404.
Chào bạn,
Vụ index chậm thì có nhiều nguyên nhân, bạn đọc lại bài và phần comment trên mình có nói. Còn về cái link sitemap của bạn thì vẫn bình thường, nhưng do người code đặt link ko có chữ s ở cuối, cái này ko sao cả. Link của bạn http://nhagiatot.net/sitemap.xml
Nhờ a Tú xem giúp e trang daisan.vn chút ạ.
E tạo sitemap theo từng danh mục cho vào console master tool. Nhưng số lượng link được duyệt rất ít ạ. Khoảng 25link/ 12.000link a ạ. A có thể cho e giải pháp khắc phục được không ạ
Chào em,
Không có thủ thuật nào để Google index cả. Chỉ có cách duy nhất là fix các vấn đề như trong bài viết để cập, loại bỏ hết các trang kém chất lượng không cần thiết đi mà thôi.
Nhờ ad xem hộ trang web của mình với. Không hiểu sao yêu cầu lập chỉ mục hoài không được: mangcapquangviettel.com
Chào bạn,
Nếu yêu cầu lập chỉ mục không được, bạn kiểm tra lỗi mà Google họ báo. Trong một số trường hợp hệ thống có thể không nhận và bạn cần thử lại sau đó.
Chào bạn. Hiện blog của tôi đang không lập được chỉ mục nhờ bạn hướng dẫn cách khắc phục và có ví dụ cụ thể được không ạ. Cảm ơn bạn rất nhiều
Chào bạn,
Có 5 lý do website không lập chỉ mục.
1- Robots.txt chặn
2- Có khai báo thẻ meta robots chặn
3- Canonial khai báo sai
4- Server chặn ip google
5- Web quá mới, chưa gửi sitemap hay chưa có liên kết.
Bạn theo 5 hướng đó để xử lý vấn đề của mình nhé.
mình cũng bị cái này mà chưa khắc phục được 🙁
Mình khắc phục bằng cách trên, thấy ko có vấn đề gì cả. Tỷ lệ lập chỉ mục lúc nào cũng trên 90% là tối thiểu.