Sơ đồ trang web Google Tin tức

Khi tạo một sơ đồ trang web Google Tin tức, bạn hãy tuân thủ những yêu cầu sau:

  • Cung cấp URL của những bài viết bạn đã phát hành trong 2 ngày qua. Sau 2 ngày, bạn có thể xóa các bài viết khỏi sơ đồ trang web Tin tức, nhưng thông thường, những bài viết đó sẽ vẫn nằm trong chỉ mục trong vòng 30 ngày.
  • Cập nhật các bài viết mới vào sơ đồ trang web Tin tức của bạn khi phát hành những bài viết đó. Google Tin tức thu thập dữ liệu trên sơ đồ trang web Tin tức và các dữ liệu khác trên trang web với tần suất như nhau.
  • Bạn có thể đưa tối đa 1.000 URL vào một sơ đồ trang web. Nếu có hơn 1.000 URL trong một sơ đồ trang web, hãy chia sơ đồ trang web đó thành nhiều sơ đồ trang web nhỏ hơn và dùng một tệp chỉ mục sơ đồ trang web để quản lý các sơ đồ đó. Hãy dùng định dạng XML có trong giao thức sơ đồ trang web. Đừng đưa quá 50.000 sơ đồ trang web vào một tệp sơ đồ trang web duy nhất. Những giới hạn này giúp đảm bảo máy chủ web của bạn không dùng các tệp có kích thước lớn.
  • Cập nhật URL của các bài viết mới vào sơ đồ trang web hiện tại của bạn. Đừng tạo sơ đồ trang web mới cho mỗi lần cập nhật.
  • Không dùng trình tạo sơ đồ trang web của Google để tạo sơ đồ trang web Tin tức. Trình tạo này sẽ đưa vào sơ đồ những URL không tương ứng với các tin bài cụ thể.

Ví dụ về một mục trong sơ đồ trang web

Sơ đồ trang web Tin Tức sử dụng giao thức sơ đồ trang web. Sau đây là ví dụ về một mục trong sơ đồ trang web Tin Tức:

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
        xmlns:news="http://www.google.com/schemas/sitemap-news/0.9">
  <url>
   <loc>http://www.example.org/business/article55.html</loc>
   <news:news>
   <news:publication>
     <news:name>The Example Times</news:name>
     <news:language>en</news:language>
   </news:publication>
   <news:publication_date>2008-12-23</news:publication_date>
     <news:title>Companies A, B in Merger Talks</news:title>
    </news:news>
  </url>
</urlset>

Các trang web có sơ đồ trang web Tin tức không được ưu tiên trong kết quả xếp hạng. Google Tin tức sử dụng các phương thức thu thập dữ liệu thông thường để tìm kiếm và gắn nhãn cho trang chủ và các mục trong mọi trang web tin tức, bất kể các trang đó có sơ đồ trang web Tin tức hay không.

Gửi sơ đồ trang web

Sau khi tạo sơ đồ trang web Tin tức, hãy gửi sơ đồ đó qua Search Console. Bạn nên tải sơ đồ trang web lên thư mục cấp cao nhất có chứa tin bài của bạn. Để biết thêm thông tin, hãy tìm hiểu cách quản lý sơ đồ trang web.

Định nghĩa các thẻ dành riêng cho Tin tức

Hãy tham khảo các thẻ Google Tin tức cho sơ đồ trang web trong phần dưới đây:

Thẻ Bắt buộc? Mô tả
<publication>

Ấn bản chứa bài viết. Thẻ này có 2 thẻ con bắt buộc: <name><language>.
Thẻ <name> là tên của ấn bản tin tức. Tên này phải hoàn toàn trùng khớp với tên xuất hiện trong các bài viết của bạn trên news.google.com, trừ những nội dung trong dấu ngoặc đơn.

<language> là ngôn ngữ của ấn bản. Hãy dùng mã ngôn ngữ ISO 639 (hai hoặc ba chữ cái).

Trường hợp ngoại lệ: Đối với tiếng Trung giản thể, hãy dùng zh-cn còn đối với tiếng Trung phồn thể, hãy dùng zh-tw.

<publication_date> Ngày phát hành bài viết ở định dạng W3C. Hãy dùng định dạng "ngày đầy đủ" (YYYY-MM-DD) hoặc định dạng "ngày đầy đủ cùng với giờ, phút và giây" kèm theo định dạng của mã chỉ định múi giờ (YYYY-MM-DDThh:mm:ssTZD). Hãy chỉ định ngày và giờ ban đầu khi bạn phát hành bài viết trên trang web của mình. Đừng chỉ định thời gian mà bạn thêm bài viết vào sơ đồ trang web.

Trình thu thập dữ liệu của Google Tin tức chấp nhận tất cả những định dạng sau đây:

  • Ngày đầy đủ: YYYY-MM-DD (1997-07-16)
  • Ngày đầy đủ cùng với giờ và phút: YYYY-MM-DDThh:mmTZD (1997-07-16T19:20+01:00)
  • Ngày đầy đủ cùng với giờ, phút và giây: YYYY-MM-DDThh:mm:ssTZD (1997-07-16T19:20:30+01:00)
  • Ngày đầy đủ cùng với giờ, phút, giây và phần thập phân của giây: YYYY-MM-DDThh:mm:ss.sTZD (1997-07-16T19:20:30.45+01:00)
<title>

Tiêu đề của tin bài.