Importazione in batch

I feed di dati ti consentono di rendere disponibili il tuo ristorante, i tuoi servizi e il tuo menu in Ordina con Google.

Questo documento spiega come ospitare la tua sandbox e gli inventari di produzione e utilizzare l'importazione in batch per aggiornare il tuo inventario in Ordina con Google.

Ambienti del feed di dati

Sono disponibili tre ambienti di feed di dati per lo sviluppo dell'integrazione:

Ambiente del feed Descrizione Importazione in batch
Sandbox L'ambiente di test per lo sviluppo del feed. Obbligatorio
Production L'ambiente di produzione dell'inventario che vuoi lanciare. Obbligatorio

Hosting di dati

Per consentire a Ordina con Google di elaborare i feed di dati Sandbox e Produzione mediante importazione in batch, devi ospitare i file del feed di dati in Google Cloud Storage, Amazon S3 o HTTPS con una Sitemap.

Ti consigliamo di ospitare separatamente i feed di dati per la sandbox e gli ambienti di produzione. Questo approccio ti consente di eseguire attività di sviluppo e test nell'ambiente dei feed sandbox prima di eseguire il deployment delle modifiche in produzione.

Ad esempio, se utilizzi Google Cloud Storage come opzione di hosting, avrai i seguenti percorsi:

  • Feed Sandbox: gs://foorestaurant-google-feed-sandbox/
  • Feed di produzione: gs://foorestaurant-google-feed-prod/

Per ospitare l'inventario, procedi nel seguente modo:

  1. Genera i file del feed di dati.
  2. Scegli una soluzione di hosting.
  3. Ospita i tuoi feed di dati.
  4. Assicurati che i file del feed di dati siano aggiornati regolarmente. I feed di dati di produzione devono essere aggiornati quotidianamente.

Per i dettagli su come creare un feed di inventario, consulta la documentazione per le entità Restaurant, Service e Menu e la sezione Creare un feed di dati.

Linee guida sui file del feed di dati

Ogni file, che può contenere più entità, non deve superare 200 MB. Le entità di primo livello Restaurant, Service e Menu, insieme alle relative entità secondarie, non devono superare tutti i 4 MB in totale.

Scegli una soluzione di hosting

Nella tabella seguente sono elencate le opzioni per l'hosting dei tuoi feed di dati e il modo in cui questi host funzionano con Ordina con Google:

Amazon S3 Google Cloud Storage HTTPS con una Sitemap
Credenziali e accesso

Fornisci a Google le seguenti informazioni:

  • ID chiave di accesso
  • Chiave di accesso segreta
  • I percorsi verso le directory S3 di produzione e sandbox e il file marker.txt. Il percorso deve iniziare con s3://.

Il bucket S3 deve includere le seguenti informazioni:

  • I file del feed per il tuo inventario.
  • marker.txt, che contiene un timestamp utilizzato per il recupero.

File marker.txt di esempio: 2018-12-03T08:30:42.694Z

Fornisci a Google i percorsi delle directory dei bucket di produzione e sandbox e del file marker.txt. I percorsi devono iniziare con gs://.

Aggiungi l'account di servizio fornito dal tuo consulente Google come lettore del bucket Google Cloud Storage.

Per scoprire di più su come controllare l'accesso per Google Cloud Storage (GCS), consulta Google Cloud Platform Console: impostazione delle autorizzazioni dei bucket.

Il bucket GCS deve includere le seguenti informazioni:

  • I file del feed per il tuo inventario.
  • marker.txt, che contiene un timestamp utilizzato per il recupero.

File marker.txt di esempio: 2018-12-03T08:30:42.694Z

Fornisci a Google le seguenti informazioni:

  • Credenziali dell'autenticazione di base.
  • Il percorso dei percorsi di Sitemap per la produzione e sandbox. Il percorso deve iniziare con https://.
  • Protocollo: devi rendere i file del feed disponibili tramite HTTPS, non tramite HTTP.
  • Sicurezza: Google consiglia vivamente di proteggere i file del feed ospitati con l'Autenticazione di base.
In che modo Google sa quali file devono essere recuperati Elenco di directory di tutti i file nel bucket. Elenco di directory di tutti i file nel bucket. I singoli URL dei file elencati nella Sitemap.
In che modo Google sa che i file sono pronti per il recupero Dopo aver generato i feed di dati, aggiorna il file marker.txt con il timestamp più recente. Dopo aver generato i feed di dati, aggiorna il file marker.txt con il timestamp più recente. Dopo aver generato i feed di dati, aggiorna l'intestazione della risposta last-modified di sitemap.xml con il timestamp più recente.
Limiti dei file

Numero massimo di file: 100.000.

Devi avere meno di 100.000 file in totale nel tuo bucket Amazon S3.

Numero massimo di file: 100.000.

Il tuo bucket Google Cloud Storage deve contenere in totale meno di 100.000 file.

Numero massimo di file: 100.000.

Il numero di percorsi file all'interno del file XML della Sitemap deve essere inferiore a 100.000.

Collega i tuoi feed di dati per l'importazione in batch

Dopo aver ospitato i feed, devi collegarli al progetto sul portale partner. La configurazione iniziale dei feed di produzione viene eseguita nella pagina Attività di onboarding. Successivamente, la configurazione dei feed di produzione e della sandbox può essere aggiornata in qualsiasi momento dalla pagina Feed di configurazione &gt da qualsiasi utente del portale con un ruolo amministrativo. L'ambiente sandbox viene utilizzato per scopi di sviluppo e test, mentre i feed di produzione vengono mostrati agli utenti.

Se ospiti i tuoi feed di dati con Amazon S3

  1. Nel portale partner, vai a Feed >.
  2. Fai clic su Modifica e compila il modulo Aggiorna feed:

    • Metodo di consegna del feed: impostato su Amazon S3.
    • File marcatore: fornisci l'URL del file marker.txt.
    • File di dati: fornisci l'URL al bucket S3 che contiene i feed di dati.
    • ID accesso: inserisci l'ID chiave di accesso IAM con le autorizzazioni di lettura dalle risorse S3.
    • Chiave di accesso: inserisci la chiave di accesso segreta IAM con le autorizzazioni da leggere dalle risorse S3.
  3. Fai clic su Invia.
  4. Dopo una o due ore, controlla se l'importazione in batch recupera i file del feed.

Se ospiti i tuoi feed di dati con Google Cloud Storage

  1. Nel portale partner, vai a Feed >.
  2. Fai clic su Modifica e compila il modulo Aggiorna feed:

    • Metodo di consegna dei feed: imposta su Google Cloud Storage.
    • File marcatore: fornisci l'URL del file marker.txt.
    • File di dati: fornisci l'URL al bucket GCS che contiene i feed di dati.
  3. Fai clic su Invia.
  4. Viene creato un account di servizio per accedere al tuo bucket GCS. Il nome dell'account si trova nei Feed > di configurazione dopo aver completato le attività di onboarding. Questo account di servizio deve avere il ruolo "Lettore oggetti legacy di Storage". Questo ruolo può essere concesso all'account di servizio nella pagina IAM di Google Cloud Console.
  5. Dopo una o due ore, controlla se l'importazione in batch recupera i file del feed.

Se ospiti i feed di dati con HTTPS

  1. Nel portale partner, vai a Feed >.
  2. Fai clic su Modifica e compila il modulo Aggiorna feed:

    • Metodo di consegna dei feed: imposta su HTTPS.
    • File Sitemap: fornisci l'URL del file sitemap.xml.
    • Nome utente: inserisci le credenziali del nome utente per accedere al server HTTPS.
    • Password: inserisci la password per accedere al server HTTPS.
  3. Fai clic su Invia.
  4. Dopo una o due ore, controlla se l'importazione in batch recupera i file del feed.

Percorsi di esempio

La tabella seguente contiene percorsi di esempio per ciascuna opzione di hosting:

Amazon S3 Google Cloud Storage HTTPS con una Sitemap
Percorso s3://foorestaurant-google-feed-sandbox/ gs://foorestaurant-google-feed-sandbox/ https://sandbox-foorestaurant.com/sitemap.xml
File indicatore s3://foorestaurant-google-feed-sandbox/marker.txt gs://foorestaurant-google-feed-sandbox/marker.txt Non applicabile

Sitemap per l'hosting HTTPS

Per definire le Sitemap, attieniti alle linee guida che seguono:

  • I link nella Sitemap devono indirizzare ai file stessi.
  • Se la tua Sitemap include riferimenti a un cloud provider invece del tuo nome di dominio, assicurati che l'inizio degli URL, ad esempio https://www.yourcloudprovider.com/your_id, sia stabile e univoco per il tuo job batch.
  • Fai attenzione a non caricare Sitemap parziali (ad esempio in caso di caricamento parziale di dati). In questo modo Google importerà solo i file della Sitemap, il che comporterà la diminuzione dei livelli di inventario e potrebbe essere bloccata l'importazione del feed.
  • Assicurati che i percorsi dei file a cui viene fatto riferimento nella Sitemap non cambino. Ad esempio, non avere il riferimento Sitemap https://www.yourcloudprovider.com/your_id/10000.json oggi, poi domani https://www.yourcloudprovider.com/your_id/20000.json.
Esempio di Sitemap

Ecco un file sitemap.xml di esempio che pubblica file del feed di dati:

Esempio 1: entità raggruppate per commercianti (opzione consigliata).

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_1.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_2.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/restaurant_3.ndjson</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Esempio 2: entità raggruppate per tipo.

XML

<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
 <url>
   <loc>https://your_fulfillment_url.com/restaurant.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/menu.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
 <url>
   <loc>https://your_fulfillment_url.com/service.json</loc>
   <lastmod>2018-06-11T10:46:43+05:30</lastmod>
 </url>
</urlset>

Aggiornare i feed di dati

Dopo aver collegato i feed di dati, Google verifica la disponibilità di aggiornamenti una volta all'ora, ma importa tutti i feed di dati solo quando i file marker.txt o sitemap.xml sono stati modificati. Prevediamo di aggiornare i feed di dati una volta al giorno per evitare inventari inattivi.

Per specificare che i feed di dati sono stati modificati e sono pronti per l'importazione in batch, aggiorna il campo last-modified dei metadati dell'oggetto del file marker.txt (per GCP e S3) o l'intestazione della risposta last-modified del file sitemap.xml. Google utilizza questi valori per determinare la frequenza di aggiornamento di un feed di dati.

Durante l'importazione del feed batch,

  • Nuove entità che non esistono nel tuo inventario OwG attuale e che non presentano errori potrebbero essere inserite.
  • Le entità già presenti nell'inventario che non presentano errori nell'importazione e hanno un dateModified più recente della voce attuale o, nel caso in cui non abbiano un dateModified, l'ora di inizio dell'importazione del feed è più recente della voce attuale che verrà aggiornata, altrimenti verrebbero contrassegnati come inattivi.
  • Le entità che facevano parte di un feed precedente che non sono più incluse nel feed in batch verranno eliminate, a condizione che non siano presenti errori a livello di file nel feed.

Il timestamp o l'intestazione della risposta last-modified deve essere aggiornato solo dopo che tutti i file del feed di dati sono stati generati e aggiornati. Limita i job batch che aggiornano i tuoi feed di dati a essere eseguiti solo una volta al giorno. In alternativa, lascia un intervallo di almeno tre ore tra ogni job batch. Se non esegui questa operazione, Google potrebbe recuperare i file inattivi.