Chia nhỏ các sơ đồ trang web lớn

Nếu kích thước sơ đồ trang web lớn hơn 50 MB, bạn cần chia sơ đồ trang web lớn này thành nhiều sơ đồ trang web nhỏ hơn. Bạn có thể dùng một tệp chỉ mục sơ đồ trang web để gửi nhiều sơ đồ trang web cùng một lúc. Định dạng XML của tệp chỉ mục sơ đồ trang web rất giống với định dạng XML của tệp sơ đồ trang web. Tệp chỉ mục sơ đồ trang web sử dụng những thẻ XML sau:

  • sitemapindex – thẻ mẹ xung quanh tệp đó.
  • sitemap – thẻ mẹ cho mỗi sơ đồ trang web được liệt kê trong tệp (thẻ con của thẻ sitemapindex)
  • loc – vị trí của sơ đồ trang web (thẻ con của thẻ sitemap)

Bạn có thể xem trang Giao thức sơ đồ trang web để tìm hiểu thêm thông tin về cú pháp.

Ví dụ sau đây minh họa một tệp chỉ mục sơ đồ trang web ở định dạng XML, trong đó có liệt kê hai sơ đồ trang web:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>http://www.example.com/sitemap1.xml.gz</loc>
  </sitemap>
  <sitemap>
    <loc>http://www.example.com/sitemap2.xml.gz</loc>
  </sitemap>
</sitemapindex>

Cũng giống như các tệp sơ đồ trang web, tệp chỉ mục sơ đồ trang web phải có kích thước từ 50 MB trở xuống (không nén) và có thể chứa tối đa 50.000 URL của sơ đồ trang web. Tệp chỉ mục sơ đồ trang web phải được mã hoá bằng phương thức UTF-8 và có các URL được thoát thích hợp.

Sau khi tạo và lưu tệp chỉ mục sơ đồ trang web, bạn có thể gửi tệp chỉ mục đó cho Google. Hãy đảm bảo bạn tải lên và lưu tất cả sơ đồ trang web được tham chiếu vào cùng trang web chứa tệp chỉ mục sơ đồ trang web của bạn. Sơ đồ trang web được tham chiếu trong tệp chỉ mục sơ đồ trang web phải nằm cùng thư mục với tệp chỉ mục sơ đồ trang web hoặc trong một thư mục cấp thấp hơn trên sơ đồ phân cấp trang web. Ví dụ: Nếu tệp chỉ mục sơ đồ trang web nằm tại https://example.com/public/sitemap_index.xml, thì tệp đó chỉ có thể chứa sơ đồ trang web trong cùng thư mục hoặc trong thư mục cấp thấp hơn, chẳng hạn như https://example.com/public/shared/.... Bạn có thể gửi tối đa 500 tệp chỉ mục sơ đồ trang web cho mỗi trang web trong tài khoản Search Console của mình.

Quản lý sơ đồ trang web cho nhiều trang web

Nếu có nhiều trang web, bạn có thể đơn giản hóa quá trình tạo và gửi sơ đồ trang web bằng cách tạo một hoặc nhiều sơ đồ trang web chứa các URL cho mọi trang web đã xác minh và lưu (những) sơ đồ trang web đó tại một vị trí duy nhất. Mọi trang web đều phải được xác minh trong Search Console. Bạn có thể chọn sử dụng:

  • Một sơ đồ trang web chứa URL của nhiều trang web, trong đó có những trang web thuộc các miền khác nhau. Ví dụ: sơ đồ trang web tại http://host1.example.com/sitemap.xml có thể chứa những URL sau.
    • http://host1.example.com
    • http://host2.example.com
    • http://host3.example.com
    • http://host1.example1.com
    • http://host1.example.ch
  • Nhiều sơ đồ trang web đơn lẻ (một sơ đồ cho mỗi trang web) nằm tại cùng một vị trí.
    • http://host1.example.com/host1-example-sitemap.xml
    • http://host1.example.com/host2-example-sitemap.xml
    • http://host1.example.com/host3-example-sitemap.xml
    • http://host1.example.com/host1-example1-sitemap.xml
    • http://host1.example.com/host1-example-ch-sitemap.xml

Để lưu trữ sơ đồ của nhiều trang web tại một vị trí duy nhất, bạn có thể xác minh tất cả những trang web này trong Search Console để chứng minh quyền sở hữu đối với mỗi trang web được tham chiếu trong các sơ đồ đó hoặc chỉ định từng sơ đồ trong tệp robots.txt của trang web tương ứng:

Cách gửi sơ đồ trang web qua Search Console:

  1. Đảm bảo rằng bạn đã xác minh quyền sở hữu đối với tất cả các trang web.
  2. Tạo một sơ đồ trang web chứa URL thuộc tất cả những trang web mà bạn muốn đưa vào. Bạn có thể tạo một sơ đồ trang web duy nhất chứa URL thuộc tất cả các trang web, hoặc tạo một hoặc nhiều sơ đồ riêng cho từng trang web.
  3. Dùng Google Search Console để gửi sơ đồ trang web.

Cách chỉ định sơ đồ trang web trong tệp robots.txt của mỗi trang web:

  1. Tạo sơ đồ trang web chứa các URL của một trang web cụ thể.
  2. Tải tất cả sơ đồ trang web lên một trang web mà bạn có quyền kiểm soát, ví dụ như https://sitemaps.example.com.
  3. Tham chiếu sơ đồ của từng trang web từ tệp robots.txt tương ứng. Ví dụ: nếu bạn đã tạo một sơ đồ trang web cho https://example.com/ và đang lưu trữ sơ đồ đó tại https://sitemaps.example.com/sitemap-example-com.xml, hãy tham chiếu sơ đồ trang web trong tệp robots.txt tại https://example.com/robots.txt với sitemap: https://sitemaps.example.com/sitemap-example-com.xml.