File Sitemap.xml là gì? Làm sao để sitemap hoạt động hiệu quả nhất

Tú Cao Tác giả Tú Cao 19/05/2017 7 phút đọc

Sitemap (sitemaps) có nghĩa là sơ đồ. Với Website thì sitemap là sơ đồ website của bạn. Trong bài viết này Tú sẽ giải thích cho bạn kỹ hơn về sitemap và cách kiểm tra cấu trúc sitemaps của bạn đã tốt nhất hay chưa.

Sitemap.xml là gì?
Sitemap.xml là gì?

File Sitemap.xml là gì?

Là file chứa sơ đồ Website của bạn. Đây là file thứ 2 (sau file robots.txt) mà robots sẽ đọc khi nó lập chỉ mục Website của bạn. Khi nắm sơ đồ Website, robots sẽ dễ dàng lập chỉ mục, cập nhật nội dung website của bạn tốt hơn.

Kiểm tra website có sitemaps hay chưa?

File sitemap.xml nằm ở thư mục gốc của tên miền. Cách kiểm tra website của bạn có sitemaps hay chưa bạn chỉ cần gõ domain.com/sitemap.xml (VD: /sitemap.xml) nếu có thể truy cập được và bạn nhìn thấy nội dung, có nghĩa website của bạn đã có sitemap.xml . Có 1 cách nữa là kiểm tra bằng công cụ SEO Quake (xem hướng dẫn)

Cấu trúc của file sitemap.xml

Đây là cấu trúc chuẩn của một file sitemap.xml (tài liệu mô tả đầy đủ ở đây)

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url> </urlset>

Theo ví dụ trên thì File Sitemap.xml này chỉ có duy nhất 1 url là http://www.example.com/ , nếu Website có 2 bài (url mới là http://www.example.com/bai-moi-2.html thì cấu trúc nó sẽ là

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://www.example.com/</loc> <lastmod>2005-01-01</lastmod> <changefreq>monthly</changefreq> <priority>0.8</priority> </url>
  http://www.example.com/bai-moi-2.htm 2005-01-01 monthly 0.8 
 

Mỗi khi có 1 url mới được xuất bản trên website của bạn (có thể là viết 1 bài mới, tạo 1 category mới, thêm 1 tag mới...) thì sẽ lặp lại đoạn trong như ví dụ trên. Khi bạn xem 1 sitemap.xml mà nó không hiển thị code như bên trên, hãy nhấn CTRL + U để xem mã nguồn.

Một file sitemap cần được cấu hình đúng và bao gồm cả 4 thành phần trên

  • loc : chưa url của bài viết, nó phải chính xác giống url mà người dùng đọc
  • lastmod : thời gian cuối cùng bài viết được cập nhật (giúp robots biết bài viết nào được bổ xung nội dung để lập chỉ mục lại)
  • changefreq : là tần suất thay đổi nội dung. Nó có các giá trị (always, hourly, daily, weekly, monthly, yearly, never) với always là thay đổi theo giây, còn never là không bao giờ. Thông thường mình sẽ cấu hình trang chủ là daily, trang category là daily và bài viết là weekly.
  • priority : độ quan trọng (giá trị từ 0.0 đến 1.0) nó chỉ cho robots biết độ quan trọng trong nội dung của bạn, không có tác dụng trong việc xếp hạng. (thông thường mình để trang chủ là 1.0, danh mục và bài viết là 0.5, còn lại là 0.3)

Nội dung của File Sitemap.xml phải được cập nhật tự động mỗi khi quản trị viên thêm một bài viết mới (tạo ra 1 url mới) nó cần phải được thêm vào sitemap.xml. Bạn có thể tạo sitemap.xml thủ công thông qua một số công cụ online (VD: https://www.xml-sitemaps.com/ ), nhưng phải nhớ tải file này lên thư mục gốc để có thể kiểm tra như hướng dẫn bên trên.

Làm sao để sitemap.xml hoạt động hiệu quả nhất.

Đây là các tiêu chuẩn để sitemap.xml phát huy tác dụng cao nhất trong bất kỳ website nào.

  • Sitemap.xml cần được liên kết từ robots.txt - xem ví dụ.
  • Sitemap.xml cần được gửi cho Google thông qua Google Webmaster Tools - xem hướng dẫn
  • Sitemap.xml cần phải được cấu hình đúng và đủ 4 thành phần trên

Ngoài ra còn một mẹo nữa các bạn nên làm là khai báo sitemap.xml trong Google CSE (tìm kiếm tùy chỉnh của Google cho Website).

Bước 1: Truy cập https://cse.google.com

Bước 2: Thêm Website của bạn vào Google CSE

Bước 3: Vào thiết lập => chọn tab nâng cao => Phần Nguồn cấp dữ liệu chú thích => Nhấn nút Thêm và điền sitemap.xml của bạn vào đây.

Khai báo sitemap.xml trong phần cấp dữ liệu của Google CSE
Khai báo sitemap.xml trong phần cấp dữ liệu của Google CSE

Việc sử dụng Google CSE thay cho phần tìm kiếm trên website cũng sẽ góp phần tăng thời gian lập chỉ mục Website của bạn.

Chúc bạn thành công!

Tú Cao
Tác giả Tú Cao Admin

"Hạnh phúc không phải là nhận, hạnh phúc chính là sự cho đi" - đây là lý do Tú xây dựng Blog này. Bài viết trên dự dựa trên quan điểm, hiểu biết của cá nhân. Nó có thể đúng, cũng có thể sai tùy thời điểm, vì vậy bạn phải tự cân nhắc và chịu trách nhiệm khi làm theo. Nếu bạn thấy nội hữu ích với bạn, hãy Mời Tú Cao một tách CÀ PHÊ.

Bài viết trước Tự học và làm chủ BMW 320i E90

Tự học và làm chủ BMW 320i E90

Bài viết tiếp theo

Hướng dẫn cập nhật extension trên Chrome của Google

Hướng dẫn cập nhật extension trên Chrome của Google
Viết bình luận
Thêm bình luận

2 Bình luận

P
Nam Phong

Mình đã làm thành công các bước như bạn hướng dẫn kể cả khai báo thành công với Google. Nhưng vấn đề phát sinh sau đó là sitemap thủ công không tự động cập nhật được URL mới. Liệu có giải pháp nào khả thi cho vấn đề này không nhỉ?

Trả lời
15:01 06/09/2019
Popup image default

Bài viết liên quan

Thông báo

Zalo