Questo documento ha lo scopo di descrivere il traffico dei crawler di accuratezza dei prezzi di Google Transport.
Nota sul numero di query
Ad esempio, se abbiamo concordato di inviare 5000 query al giorno, significa che 5000 volte al giorno (distribuite uniformemente durante la giornata, ovvero circa una ogni 17 secondi), il nostro crawler esegue tutte le seguenti azioni che un utente normale eseguirebbe:
Inizia dalla Ricerca Google e fai clic sul link del partner
Seleziona l'itinerario di viaggio previsto (se non è già selezionato)
Fai clic su "Continua" finché non raggiungi la pagina in cui l'utente dovrebbe inserire i dati personali / di pagamento
Leggi i dettagli del prezzo finale dalla pagina
Il crawler filtra le risorse recuperate
Il crawler recupera solo le risorse necessarie per ottenere le informazioni che ci interessano: dettagli su prezzo e disponibilità. In particolare, di solito recupera solo le risorse dal sito web del partner (ovvero autorizziamo solo gli URL dello stesso dominio). Inoltre, evitiamo di recuperare risorse non necessarie per leggere i dati di prezzo corretti, ad esempio le immagini.
In particolare, il crawler non carica ed esegue script di terze parti (Google Analytics, Facebook, Criteo e così via), pertanto il traffico del crawler deve essere escluso da queste analisi.
Memorizzazione nella cache
Per ridurre il carico sul sito web del partner, i nostri crawler sono in genere configurati per rispettare tutte le intestazioni di memorizzazione nella cache HTTP standard presenti nella risposta. Ciò significa che per i siti web configurati correttamente evitiamo di recuperare ripetutamente contenuti che cambiano raramente (ad es. librerie JavaScript).
Risoluzione dei problemi
I controlli di qualità della nostra rete di crawler dipendono dall'accesso al sito web del partner. Le informazioni per farlo sono disponibili in questo articolo del Centro assistenza.