Monitoraggio

L'ottimizzazione delle prestazioni inizia con l'identificazione delle metriche chiave, in genere relative a latenza e velocità effettiva. L'aggiunta del monitoraggio per acquisire e tenere traccia di queste metriche espone i punti deboli dell'applicazione. Con le metriche, è possibile eseguire l'ottimizzazione per migliorare le metriche sul rendimento.

Inoltre, molti strumenti di monitoraggio consentono di impostare avvisi per le metriche, in modo da ricevere una notifica quando viene raggiunta una determinata soglia. Ad esempio, potresti configurare un avviso per ricevere una notifica quando la percentuale di richieste non riuscite aumenta di oltre il x% rispetto ai livelli normali. Gli strumenti di monitoraggio possono aiutarti a identificare le normali prestazioni e a identificare picchi insoliti di latenza, quantità di errore e altre metriche chiave. La capacità di monitorare queste metriche è particolarmente importante durante periodi di tempo critici per l'attività o dopo che il nuovo codice è stato messo in produzione.

Identificare le metriche di latenza

Assicurati di mantenere la tua UI il più reattiva possibile, tenendo presente che gli utenti si aspettano standard ancora più elevati dalle app mobile. La latenza dovrebbe anche essere misurata e monitorata per i servizi di backend, in particolare perché, se non selezionata, può causare problemi di velocità effettiva.

Di seguito sono riportate le metriche suggerite da monitorare:

  • Durata richiesta
  • Durata delle richieste con granularità del sottosistema (ad esempio le chiamate API)
  • Durata job

Identificare le metriche di velocità effettiva

La velocità effettiva è una misura del numero totale di richieste gestite in un determinato periodo di tempo. La velocità effettiva può essere influenzata dalla latenza dei sottosistemi, pertanto potrebbe essere necessario ottimizzare la latenza per migliorare la velocità effettiva.

Ecco alcune metriche suggerite da monitorare:

  • Query al secondo
  • Dimensione dei dati trasferiti al secondo
  • Numero di operazioni di I/O al secondo
  • Utilizzo delle risorse, ad esempio utilizzo di CPU o memoria
  • Dimensioni del backlog dell'elaborazione, ad esempio Pub/Sub o il numero di thread

Non solo la media

Un errore comune nella misurazione del rendimento è considerare solo il caso medio (medio). Sebbene sia utile, non fornisce insight sulla distribuzione della latenza. Una metrica migliore da monitorare sono i percentili di prestazioni, ad esempio il 50°/75°/90°/99° percentile per una metrica.

In genere, l'ottimizzazione può essere eseguita in due passaggi. Primo, ottimizza per la latenza del 90° percentile. Quindi, considera il 99° percentile, noto anche come latenza di coda, la piccola parte di richieste il cui completamento richiede molto più tempo.

Monitoraggio lato server per risultati dettagliati

La profilazione lato server è generalmente preferita per il monitoraggio delle metriche. Di solito il lato server è molto più facile da implementare, consente l'accesso a dati più granulari ed è meno soggetto a perturbazioni dovute a problemi di connettività.

Monitoraggio del browser per visibilità end-to-end

La profilazione del browser può fornire ulteriori informazioni sull'esperienza dell'utente finale. Può mostrare quali pagine hanno richieste lente, che puoi correlare al monitoraggio lato server per ulteriori analisi.

Google Analytics fornisce un monitoraggio immediato dei tempi di caricamento delle pagine nel report Tempi pagine. Ciò fornisce diverse visualizzazioni utili per comprendere l'esperienza utente sul tuo sito, in particolare:

  • Tempi di caricamento delle pagine
  • Tempi di caricamento del reindirizzamento
  • Tempi di risposta del server

Monitoraggio nel cloud

Esistono molti strumenti che puoi utilizzare per acquisire e monitorare le metriche sulle prestazioni della tua applicazione. Ad esempio, puoi utilizzare Google Cloud Logging per registrare le metriche sulle prestazioni nel tuo progetto Google Cloud, quindi configurare le dashboard in Google Cloud Monitoring per monitorare e segmentare le metriche registrate.

Consulta la guida a Logging per un esempio di logging in Google Cloud Logging da un intercettatore personalizzato nella libreria client Python. Con questi dati disponibili in Google Cloud, puoi creare metriche in base ai dati registrati per ottenere visibilità sulla tua applicazione tramite Google Cloud Monitoring. Segui la guida alle metriche basate su log definite dall'utente per creare metriche utilizzando i log inviati a Google Cloud Logging.

In alternativa, puoi utilizzare le librerie del client Monitoring per definire le metriche nel codice e inviarle direttamente a Monitoring, separatamente dai log.

Esempio di metriche basate su log

Supponiamo che tu voglia monitorare il valore is_fault per comprendere meglio le percentuali di errore nella tua applicazione. Puoi estrarre il valore is_fault dai log in una nuova metrica contatore, ErrorCount.

Configurazione delle metriche

Filtri ed etichette nelle metriche

In Cloud Logging, le etichette consentono di raggruppare le metriche in categorie in base ad altri dati nei log. Puoi configurare un'etichetta per il campo method inviato a Cloud Logging in modo da vedere come il numero di errori viene suddiviso dal metodo dell'API Google Ads.

Con la metrica ErrorCount e l'etichetta Method configurate, puoi creare un nuovo grafico in una dashboard di Monitoring per monitorare ErrorCount, raggruppato per Method.

Dashboard ErrorCount

Avvisi

In Cloud Monitoring e in altri strumenti è possibile configurare criteri di avviso che specificano quando e come gli avvisi devono essere attivati dalle tue metriche. Per istruzioni sulla configurazione degli avvisi di Cloud Monitoring, consulta la guida agli avvisi.