Tạo danh sách URL

Để các hệ thống của chúng tôi tìm thấy nội dung của bạn, chúng tôi cần URL của nội dung đó. Như đã nêu trong phần Giới thiệu về lập chỉ mục, các hệ thống của Google có thể thu thập dữ liệu nội dung trang web của bạn thông qua quy trình tự nhiên được xác định bởi các thuật toán của chúng tôi mà không cần bạn phải làm thêm bất cứ điều gì. Điều này có thể đủ để đạt được mục tiêu của bạn.

Tuy nhiên, khi bạn có nội dung chưa được liên kết bởi các trang khác, chẳng hạn như các trang mới hoặc thông tin tối nghĩa, bạn có thể giúp hệ thống của chúng tôi biết về URL của bạn bằng cách cung cấp chúng trong một danh sách gọi là sơ đồ trang web. Trong nhiều trường hợp, đây là tất cả những gì bạn cần để giúp hệ thống của chúng tôi dễ dàng tìm thấy đánh dấu mới nhất của bạn và cung cấp bản xem trước về nội dung của bạn dưới dạng kết quả nhiều định dạng trong kết quả Tìm kiếm.

Các loại URL bạn cung cấp

Các URL mà bạn cung cấp cho Google sẽ thuộc 2 loại chung:

  • URL chính tắc—các URL chính cho nội dung của bạn.

    Trong hầu hết các trường hợp, URL chính tắc là URL thường dùng để truy cập vào một phần nội dung cụ thể trên trang web. Ví dụ: nếu nội dung hiển thị trên các URL riêng cho HTML và AMP HTML và bạn ưu tiên phiên bản HTML hơn, thì bạn sẽ đặt URL của phiên bản HTML làm URL chính tắc. Ngược lại, nếu trang web được tạo hoàn toàn bằng HTML AMP và không có nội dung HTML tương ứng, thì URL AMP sẽ là URL chính tắc vì không có URL nào khác. Hãy tìm hiểu thêm về URL chính tắc trong Trung tâm trợ giúp của chúng tôi.

  • URL thay thế—URL của nội dung thay thế cho tài nguyên nội dung chính.

    Thông thường, bạn sẽ chỉ định các URL thay thế khi bạn có nhiều dạng thức URL cho cùng một nội dung, chẳng hạn như các trang AMP hoặc nội dung được dịch từ bản gốc. Khi các URL này được liên kết với nhau, hệ thống của chúng tôi có thể dễ dàng xác định thứ hạng tổng hợp cho nội dung đó và hiển thị tài nguyên thích hợp cho người dùng, chẳng hạn như trang AMP cho người dùng trên thiết bị di động.

Để biết thêm thông tin, hãy tìm hiểu cách Liên kết tài nguyên trực tuyến của bạn.

Tạo một sơ đồ trang web đơn giản

Sơ đồ trang web cơ bản nhất là danh sách các URL chính tắc của bạn dưới dạng một tệp văn bản. Bạn có thể tạo danh sách và lưu trữ sơ đồ này trên trang web của mình. Bạn đặt một URL trên mỗi dòng; ví dụ:

http://www.example.com/dogs/poodles/poodle1.html
http://www.example.com/dogs/poodles/poodle2.html

Nhiều hệ thống quản lý nội dung, chẳng hạn như WordPress và Drupal, cung cấp một trình tạo sơ đồ trang web giúp đơn giản hóa việc tạo tệp cho trang web của bạn. Trình tạo sơ đồ trang web thường tạo các tệp XML mà chúng tôi cũng hỗ trợ.

Sơ đồ trang web dựa trên văn bản chỉ giúp ích cho việc khám phá nội dung. Sơ đồ trang web dựa trên văn bản không giúp hệ thống của chúng tôi biết khi nội dung của bạn được cập nhật vì sơ đồ đó không chứa dữ liệu meta bổ sung như ngày thực hiện thay đổi hoặc danh sách các URL thay thế. Hãy xác định mọi nội dung thay thế bằng cách liên kết đến nội dung đó từ trang chính tắc và đảm bảo rằng các trang thay thế liên kết ngược lại đến URL chính tắc, như đã mô tả trong phân Liên kết tài nguyên trực tuyến của bạn.

Tìm hiểu về sơ đồ trang web trong Trung tâm trợ giúp của Search Console.

Tạo sơ đồ trang web XML

Nếu muốn cung cấp thông tin cập nhật về các URL của mình và thiết lập mối quan hệ giữa chúng và các URL thay thế, thì bạn có thể sử dụng sơ đồ trang web XML. Sơ đồ này có thể liệt kê cả URL chính tắc và URL thay thế trong một tệp và cung cấp ngày thực hiện sửa đổi.

Ví dụ sau đây cho thấy một sơ đồ trang web XML đơn giản, trong đó có một mục liệt kê cả URL chính tắc và URL AMP, đồng thời cung cấp ngày thực hiện sửa đổi.

<?xml version="1.0" encoding="utf-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <url>
    <loc>http://example.com/dogs/poodles/poodle1.html</loc>
    <xhtml:link rel="amphtml" href="http://example.com/dogs/poodles/poodle1.amp.html"/>
    <lastmod>2016-01-13T18:30:02Z</lastmod>
  </url>
</urlset>

Dấu thời gian cho ngày của bạn phải ở định dạng W3C Datetime. Định dạng này cho phép bạn bỏ qua phần thời gian, nếu bạn muốn, và sử dụng định dạng YYYY-MM-DD.

Nguyên tắc dành cho sơ đồ trang web

Chúng tôi khuyên bạn nên sử dụng văn bản thuần túy hoặc XML làm định dạng cho sơ đồ trang web của mình. Ngoài ra, một tệp sơ đồ trang web không được chứa hơn 50.000 URL và không được lớn hơn 50 MB không nén. Vì thế, nếu có số lượng URL lớn, bạn nên tách thành nhiều tệp.

Hãy xem danh sách đầy đủ các nguyên tắc về sơ đồ trang web trong phần Tạo và gửi sơ đồ trang web trong Trung tâm trợ giúp của Search Console.

Gửi phản hồi về...