File Sitemap.xml là gì? Làm sao để sitemap hoạt động hiệu quả nhất
Sitemap (sitemaps) có nghĩa là sơ đồ. Với Website thì sitemap là sơ đồ website của bạn. Trong bài viết này Tú sẽ giải thích cho bạn kỹ hơn về sitemap và cách kiểm tra cấu trúc sitemaps của bạn đã tốt nhất hay chưa.
File Sitemap.xml là gì?
Là file chứa sơ đồ Website của bạn. Đây là file thứ 2 (sau file robots.txt) mà robots sẽ đọc khi nó lập chỉ mục Website của bạn. Khi nắm sơ đồ Website, robots sẽ dễ dàng lập chỉ mục, cập nhật nội dung website của bạn tốt hơn.
Kiểm tra website có sitemaps hay chưa?
File sitemap.xml nằm ở thư mục gốc của tên miền. Cách kiểm tra website của bạn có sitemaps hay chưa bạn chỉ cần gõ domain.com/sitemap.xml (VD: /sitemap.xml) nếu có thể truy cập được và bạn nhìn thấy nội dung, có nghĩa website của bạn đã có sitemap.xml . Có 1 cách nữa là kiểm tra bằng công cụ SEO Quake (xem hướng dẫn)
Cấu trúc của file sitemap.xml
Đây là cấu trúc chuẩn của một file sitemap.xml (tài liệu mô tả đầy đủ ở đây)
http://www.example.com/ 2005-01-01 monthly 0.8
Theo ví dụ trên thì File Sitemap.xml này chỉ có duy nhất 1 url là http://www.example.com/ , nếu Website có 2 bài (url mới là http://www.example.com/bai-moi-2.html thì cấu trúc nó sẽ là
http://www.example.com/ 2005-01-01 monthly 0.8
http://www.example.com/bai-moi-2.htm 2005-01-01 monthly 0.8
Mỗi khi có 1 url mới được xuất bản trên website của bạn (có thể là viết 1 bài mới, tạo 1 category mới, thêm 1 tag mới...) thì sẽ lặp lại đoạn trong
Một file sitemap cần được cấu hình đúng và bao gồm cả 4 thành phần trên
- loc : chưa url của bài viết, nó phải chính xác giống url mà người dùng đọc
- lastmod : thời gian cuối cùng bài viết được cập nhật (giúp robots biết bài viết nào được bổ xung nội dung để lập chỉ mục lại)
- changefreq : là tần suất thay đổi nội dung. Nó có các giá trị (always, hourly, daily, weekly, monthly, yearly, never) với always là thay đổi theo giây, còn never là không bao giờ. Thông thường mình sẽ cấu hình trang chủ là daily, trang category là daily và bài viết là weekly.
- priority : độ quan trọng (giá trị từ 0.0 đến 1.0) nó chỉ cho robots biết độ quan trọng trong nội dung của bạn, không có tác dụng trong việc xếp hạng. (thông thường mình để trang chủ là 1.0, danh mục và bài viết là 0.5, còn lại là 0.3)
Nội dung của File Sitemap.xml phải được cập nhật tự động mỗi khi quản trị viên thêm một bài viết mới (tạo ra 1 url mới) nó cần phải được thêm vào sitemap.xml. Bạn có thể tạo sitemap.xml thủ công thông qua một số công cụ online (VD: https://www.xml-sitemaps.com/ ), nhưng phải nhớ tải file này lên thư mục gốc để có thể kiểm tra như hướng dẫn bên trên.
Làm sao để sitemap.xml hoạt động hiệu quả nhất.
Đây là các tiêu chuẩn để sitemap.xml phát huy tác dụng cao nhất trong bất kỳ website nào.
- Sitemap.xml cần được liên kết từ robots.txt - xem ví dụ.
- Sitemap.xml cần được gửi cho Google thông qua Google Webmaster Tools - xem hướng dẫn
- Sitemap.xml cần phải được cấu hình đúng và đủ 4 thành phần trên
Ngoài ra còn một mẹo nữa các bạn nên làm là khai báo sitemap.xml trong Google CSE (tìm kiếm tùy chỉnh của Google cho Website).
Bước 1: Truy cập https://cse.google.com
Bước 2: Thêm Website của bạn vào Google CSE
Bước 3: Vào thiết lập => chọn tab nâng cao => Phần Nguồn cấp dữ liệu chú thích => Nhấn nút Thêm và điền sitemap.xml của bạn vào đây.
Việc sử dụng Google CSE thay cho phần tìm kiếm trên website cũng sẽ góp phần tăng thời gian lập chỉ mục Website của bạn.
Chúc bạn thành công!
2 Bình luận
Mình đã làm thành công các bước như bạn hướng dẫn kể cả khai báo thành công với Google. Nhưng vấn đề phát sinh sau đó là sitemap thủ công không tự động cập nhật được URL mới. Liệu có giải pháp nào khả thi cho vấn đề này không nhỉ?