Migliorare la qualità della ricerca

Per qualità della ricerca si intende la qualità dei risultati di ricerca in termini di ranking e recupero percepita dall'utente.

Il ranking è l'ordine degli elementi, mentre il richiamo è il numero di elementi pertinenti recuperati. Un elemento (o documento) è qualsiasi contenuto digitale che Google Cloud Search può indicizzare, ad esempio documenti Microsoft Office, file PDF, righe di database o URL univoci. Un elemento è costituito da:

  • Metadati strutturati
  • Contenuti indicizzabili
  • ACL

Cloud Search utilizza vari indicatori per recuperare e classificare i risultati. Puoi influenzare questi indicatori tramite le impostazioni dello schema, i contenuti e i metadati degli elementi e l'applicazione di ricerca. Questo documento ti aiuta a migliorare la qualità della ricerca modificando questi fattori che influenzano i segnali.

Per un riepilogo delle impostazioni, vedi Riepilogo delle impostazioni di qualità della ricerca.

Influenzare il punteggio di pertinenza

La pertinenza è la rilevanza di un risultato di ricerca rispetto ai termini della query. Cloud Search calcola la pertinenza in base a:

  • L'importanza di ogni termine della query.
  • Il numero di hit (la frequenza con cui un termine di query viene visualizzato nei contenuti o nei metadati).
  • I tipi di corrispondenza tra i termini di query e gli elementi indicizzati.

Per influenzare il punteggio di attualità di una proprietà di testo, definisci RetrievalImportance nello schema. Una corrispondenza su una proprietà con un RetrievalImportance elevato genera un punteggio più alto.

Ad esempio, se memorizzi la cronologia dei bug del software, è probabile che gli utenti eseguano query in base al nome del bug. Imposta RetrievalImportance per il nome su HIGHEST. Per le descrizioni, utilizza DEFAULT.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

Per i documenti HTML, i tag come <title> e <h1> aiutano a determinare l'importanza dei termini. Se ContentFormat è TEXT, ItemContent utilizza l'importanza DEFAULT. Se è HTML, l'importanza dipende dalle proprietà HTML.

Aggiornamento dell'influenza

Attualità misura la data di modifica più recente di un elemento utilizzando createTime e updateTime in ItemMetadata. Gli elementi meno recenti hanno un ranking inferiore.

Puoi influire sulla freschezza modificando freshnessProperty e freshnessDuration in FreshnessOptions. freshnessProperty consente di utilizzare una data o un timestamp personalizzati anziché updateTime. Per i bug, potresti utilizzare una data di scadenza in modo che gli elementi con date più vicine a oggi abbiano un ranking più alto.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Utilizza freshnessDuration per specificare quando un elemento viene considerato obsoleto. Un valore elevato, ad esempio 100 anni, annulla l'effetto di aggiornamento. Questa opzione è utile per i dati statici come i profili dei dipendenti. Per le notizie, utilizza un valore piccolo, ad esempio tre giorni.

Influenza sulla qualità

La qualità misura l'accuratezza e l'utilità di un elemento. Specifica un valore compreso tra 0 e 1 utilizzando SearchQualityMetadata. Valori più alti migliorano il ranking. Ad esempio, potresti aumentare la visibilità dei documenti sui benefit creati dalle Risorse umane.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Influenza tramite il tipo di campo

Puoi influenzare il ranking in base alle proprietà enum o integer utilizzando OrderedRanking:

  • NO_ORDER (valore predefinito): nessun effetto sul ranking.
  • ASCENDING: i valori più alti migliorano il ranking.
  • DESCENDING: I valori più bassi migliorano il ranking.

Per la priorità del bug, utilizza DESCENDING se HIGH è 1 e LOW è 3. Per una proprietà votes, utilizza ASCENDING.

Influenzare il ranking tramite l'espansione delle query

L'espansione delle query utilizza sinonimi e ortografia per migliorare i risultati.

Utilizza sinonimi

Cloud Search utilizza contenuti web pubblici per i sinonimi. Puoi anche definire sinonimi personalizzati per la terminologia specifica dell'organizzazione. Consulta la sezione Definire i sinonimi.

Utilizzare l'ortografia

Cloud Search fornisce suggerimenti ortografici in SpellResult. Utilizza anche le correzioni ortografiche come sinonimi per trovare i documenti.

Influenzare il ranking tramite le impostazioni dell'applicazione di ricerca

Un'applicazione di ricerca fornisce informazioni contestuali. Puoi influenzare il ranking utilizzando le seguenti impostazioni.

Modificare la configurazione del punteggio

Specifica un ScoringConfig per disattivare l'aggiornamento o la personalizzazione. La disattivazione della personalizzazione rimuove i boost di proprietario e interazione. Consulta Personalizzare l'esperienza di ricerca.

Modifica la configurazione dell'origine

Specifica le impostazioni a livello di origine dati:

  • Importanza dell'origine: gli elementi provenienti da un'origine con importanza HIGH hanno un ranking più alto.
  • Crowding: limita i risultati di una singola fonte (il valore predefinito è 3) per garantire la diversità.

Personalizzazione

La personalizzazione dà la priorità ai risultati in base all'utente:

  • Proprietà degli elementi: aumenta la visibilità degli elementi di proprietà dell'utente.
  • Interazione con gli elementi: mette in evidenza gli elementi che l'utente ha visualizzato, modificato o commentato di recente.
  • Clic dell'utente: aumenta la visibilità degli elementi su cui l'utente ha fatto clic in precedenza. Non modificare l'URL del risultato, in quanto viene utilizzato per raccogliere questi dati.

Interpretazione delle query

La funzionalità Interpretazione delle query converte le query degli utenti in query strutturate e basate su operatori utilizzando le definizioni dello schema. In questo modo si ottengono risultati precisi anche con un numero minimo di parole chiave. Consulta Strutturare uno schema per un'interpretazione ottimale delle query.

Lingua dell'articolo

Cloud Search declassa gli elementi la cui lingua non corrisponde a quella della query. Imposta languageCode in RequestOptions in base alle preferenze dell'utente.

Contesto dell'elemento

Utilizza contextAttributes per aumentare il ranking degli elementi pertinenti al contesto della query, ad esempio la località o il reparto.

Popolarità dell'articolo

Cloud Search mette in evidenza gli elementi su cui gli utenti fanno clic di frequente nelle query recenti. Non modificare gli URL dei risultati di ricerca, in quanto vengono utilizzati per monitorare questi clic.

Riepilogo delle impostazioni della qualità della ricerca

Le seguenti tabelle forniscono un riepilogo delle impostazioni di qualità della ricerca:

Impostazioni schema

Impostazione Località Suggerimento Dettagli
ItemContent ItemContent Consigliato Pertinenza
RetrievalImportance RetrievalImportance Consigliato Pertinenza
FreshnessOptions FreshnessOptions Facoltativo Aggiornamento

Impostazioni di indicizzazione

Impostazione Località Suggerimento Dettagli
createTime/updateTime ItemMetadata Consigliato Aggiornamento
contentLanguage ItemMetadata Consigliato Lingua dell'articolo
owners ItemAcl Consigliato Proprietà dell'elemento
Sinonimi personalizzati _dictionaryEntry Consigliato Utilizzare i sinonimi
quality SearchQualityMetadata Facoltativo Qualità dell'influenza
Dati sull'interazione interaction Facoltativo Interazione con l'articolo
OrderedRanking OrderedRanking Facoltativo Tipo di campo

Impostazioni dell'applicazione di ricerca

Impostazione Località Suggerimento Dettagli
Disattiva personalizzazione ScoringConfig Consigliato Personalizzazione
Importanza dell'origine SourceCrowdingConfig Facoltativo Configurazione dell'origine
Crowding SourceCrowdingConfig Facoltativo Configurazione dell'origine

Passaggi successivi

  1. Struttura uno schema per un'interpretazione ottimale delle query.
  2. Definisci i sinonimi.