- Bạn phải tự lưu trữ nguồn cấp dữ liệu XML của mình và nguồn cấp dữ liệu đó phải truy cập được thông qua HTTP hoặc HTTPS.
- Bạn có thể cung cấp một tệp XML duy nhất hoặc nhiều tệp XML được nhóm lại trong một tệp .zip duy nhất.
- Trong bất kỳ trường hợp nào thì kích thước của một tệp cũng không được vượt quá 100 MB, ngay cả khi đó là tệp .zip.
- Nếu cung cấp một tệp XML duy nhất, bạn có thể cung cấp một tệp văn bản thuần tuý hoặc một tệp văn bản nén ở định dạng zip.
- Để đảm bảo rằng Google truy xuất được ảnh chụp nhanh đầy đủ của dữ liệu và không cố gắng tải xuống các tệp không hoàn chỉnh, hãy tuân thủ các nguyên tắc sau khi đăng tệp lên máy chủ HTTP:
- Tạo nguồn cấp dữ liệu của bạn trong một thư mục mà từ đó Google không tìm nạp nội dung.
- Sau khi nguồn cấp dữ liệu của bạn hoàn tất, hãy tạo một đường liên kết tượng trưng trong thư mục mà Google tìm nạp nội dung. Đường liên kết tượng trưng sẽ dẫn đến nguồn cấp dữ liệu mới được tạo.
- Bạn có thể bảo mật các tệp của mình bằng tên người dùng và mật khẩu bằng cách sử dụng phương thức xác thực BASIC hoặc DIGEST. (NTLM hiện không được hỗ trợ.)
Xác thực XML
Để đảm bảo rằng Google có thể xử lý nguồn cấp dữ liệu của bạn, vui lòng sử dụng trình kiểm tra lược đồ XML để đảm bảo rằng nguồn cấp dữ liệu của bạn tuân thủ các yêu cầu của lược đồ trước khi gửi nguồn cấp dữ liệu cho Google. Google cũng sẽ xác minh rằng nguồn cấp dữ liệu của bạn tuân thủ lược đồ trước khi chấp nhận nguồn cấp dữ liệu đó.
Có một số công cụ giúp bạn xác thực cấu trúc của nguồn cấp dữ liệu XML. Bạn có thể tìm thấy các công cụ liên quan đến XML tại những trang web sau:
Bạn có thể dùng xmllint
để xác thực nguồn cấp dữ liệu bằng dòng lệnh sau:
xmllint --schema http://www.google.com/shopping/reviews/schema/merchant/4.0/merchant_reviews.xsd --noout file.xml
Nguyên tắc bổ sung
Bạn có thể chỉ định các giá trị dữ liệu trong nguồn cấp dữ liệu bằng phần CDATA. Nếu dùng các phần CDATA, bạn không được dùng mã thoát để biểu thị các ký tự đặc biệt.
Nguồn cấp dữ liệu của bạn phải sử dụng phương thức mã hoá UTF-8. Vui lòng chỉ định chế độ mã hoá này trong phần khai báo XML ở đầu nguồn cấp dữ liệu:
<?xml version="1.0" encoding="UTF-8"?>