File Sitemap.xml là gì? Làm sao để sitemap hoạt động hiệu quả nhất

 

Sitemap (sitemaps) có nghĩa là sơ đồ. Với Website thì sitemap là sơ đồ website của bạn. Trong bài viết này Tú sẽ giải thích cho bạn kỹ hơn về sitemap và cách kiểm tra cấu trúc sitemaps của bạn đã tốt nhất hay chưa.

Sitemap.xml là gì?

Sitemap.xml là gì?

File Sitemap.xml là gì?

Là file chứa sơ đồ Website của bạn. Đây là file thứ 2 (sau file robots.txt) mà robots sẽ đọc khi nó lập chỉ mục Website của bạn. Khi nắm sơ đồ Website, robots sẽ dễ dàng lập chỉ mục, cập nhật nội dung website của bạn tốt hơn.

Kiểm tra website có sitemaps hay chưa?

File sitemap.xml nằm ở thư mục gốc của tên miền. Cách kiểm tra website của bạn có sitemaps hay chưa bạn chỉ cần gõ domain.com/sitemap.xml (VD: https://nguyencaotu.com/sitemap.xml) nếu có thể truy cập được và bạn nhìn thấy nội dung, có nghĩa website của bạn đã có sitemap.xml . Có 1 cách nữa là kiểm tra bằng công cụ SEO Quake (xem hướng dẫn)

Cấu trúc của file sitemap.xml

Đây là cấu trúc chuẩn của một file sitemap.xml (tài liệu mô tả đầy đủ ở đây)

Source code    
<?xml version="1.0" encoding="UTF-8"?>
 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 
   <url>
 
      <loc>http://www.example.com/</loc>
 
      <lastmod>2005-01-01</lastmod>
 
      <changefreq>monthly</changefreq>
 
      <priority>0.8</priority>
 
   </url>
 
</urlset>

 

Theo ví dụ trên thì File Sitemap.xml này chỉ có duy nhất 1 url là http://www.example.com/ , nếu Website có 2 bài (url mới là http://www.example.com/bai-moi-2.html thì cấu trúc nó sẽ là

Source code    
<?xml version="1.0" encoding="UTF-8"?>
 
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 
   <url>
 
      <loc>http://www.example.com/</loc>
 
      <lastmod>2005-01-01</lastmod>
 
      <changefreq>monthly</changefreq>
 
      <priority>0.8</priority>
 
   </url>
   <url>
 
      <loc>http://www.example.com/bai-moi-2.htm</loc>
 
      <lastmod>2005-01-01</lastmod>
 
      <changefreq>monthly</changefreq>
 
      <priority>0.8</priority>
 
   </url>
</urlset>

Mỗi khi có 1 url mới được xuất bản trên website của bạn (có thể là viết 1 bài mới, tạo 1 category mới, thêm 1 tag mới…) thì sẽ lặp lại đoạn trong <url></url> như ví dụ trên. Khi bạn xem 1 sitemap.xml mà nó không hiển thị code như bên trên, hãy nhấn CTRL + U để xem mã nguồn.

Một file sitemap cần được cấu hình đúng và bao gồm cả 4 thành phần trên

  • loc : chưa url của bài viết, nó phải chính xác giống url mà người dùng đọc
  • lastmod : thời gian cuối cùng bài viết được cập nhật (giúp robots biết bài viết nào được bổ xung nội dung để lập chỉ mục lại)
  • changefreq : là tần suất thay đổi nội dung. Nó có các giá trị (always, hourly, daily, weekly, monthly, yearly, never) với always là thay đổi theo giây, còn never là không bao giờ. Thông thường mình sẽ cấu hình trang chủ là daily, trang category là daily và bài viết là weekly.
  • priority : độ quan trọng (giá trị từ 0.0 đến 1.0) nó chỉ cho robots biết độ quan trọng trong nội dung của bạn, không có tác dụng trong việc xếp hạng. (thông thường mình để trang chủ là 1.0, danh mục và bài viết là 0.5, còn lại là 0.3)

Nội dung của File Sitemap.xml phải được cập nhật tự động mỗi khi quản trị viên thêm một bài viết mới (tạo ra 1 url mới) nó cần phải được thêm vào sitemap.xml. Bạn có thể tạo sitemap.xml thủ công thông qua một số công cụ online (VD: https://www.xml-sitemaps.com/ ), nhưng phải nhớ tải file này lên thư mục gốc để có thể kiểm tra như hướng dẫn bên trên.

Làm sao để sitemap.xml hoạt động hiệu quả nhất.

Đây là các tiêu chuẩn để sitemap.xml phát huy tác dụng cao nhất trong bất kỳ website nào.

  • Sitemap.xml cần được liên kết từ robots.txt – xem ví dụ.
  • Sitemap.xml cần được gửi cho Google thông qua Google Webmaster Tools – xem hướng dẫn
  • Sitemap.xml cần phải được cấu hình đúng và đủ 4 thành phần trên

Ngoài ra còn một mẹo nữa các bạn nên làm là khai báo sitemap.xml trong Google CSE (tìm kiếm tùy chỉnh của Google cho Website).

Bước 1: Truy cập https://cse.google.com

Bước 2: Thêm Website của bạn vào Google CSE

Bước 3: Vào thiết lập => chọn tab nâng cao => Phần Nguồn cấp dữ liệu chú thích => Nhấn nút Thêm và điền sitemap.xml của bạn vào đây.

Khai báo sitemap.xml trong phần cấp dữ liệu của Google CSE

Khai báo sitemap.xml trong phần cấp dữ liệu của Google CSE

Việc sử dụng Google CSE thay cho phần tìm kiếm trên website cũng sẽ góp phần tăng thời gian lập chỉ mục Website của bạn.

Chúc bạn thành công!

Nhận tuyệt chiêu Marketing

Tài liệu, bí quyết, case study... giúp bạn gia tăng 200% doanh số Online.

Chúng ta luôn giống nhau ở những thứ lớn lao và chỉ khác nhau ở chi tiết.

Xin hãy kiểm tra email để hoàn tất

Leave a Reply

Nhận tuyệt chiêu Marketing

Nhận tuyệt chiêu Marketing

Đừng bao giờ để đối thủ của bạn biết điều này.

 

Hãy là những người đi đầu và cập nhật xu hướng, cách làm hiệu quả nhất.

Xin hãy kiểm tra email để hoàn tất