Améliorer la qualité de la recherche

La qualité de la recherche fait référence à la qualité des résultats de recherche en termes de classement et de couverture, telle qu'elle est perçue par l'utilisateur.

Le classement correspond à l'ordre des éléments, et la couverture au nombre d'éléments pertinents récupérés. Un élément (ou document) est tout contenu numérique que Google Cloud Search peut indexer, comme des documents Microsoft Office, des fichiers PDF, des lignes de base de données ou des URL uniques. Un élément se compose des éléments suivants :

  • Métadonnées structurées
  • Contenu indexable
  • LCA

Cloud Search utilise différents signaux pour récupérer et classer les résultats. Vous pouvez influencer ces signaux via les paramètres du schéma, le contenu et les métadonnées des éléments, ainsi que l'application de recherche. Ce document vous aide à améliorer la qualité de la recherche en modifiant ces facteurs d'influence des signaux.

Pour obtenir un résumé des paramètres, consultez le Résumé des paramètres de qualité de la recherche.

Influencer le score de pertinence thématique

La pertinence thématique correspond à la pertinence d'un résultat de recherche par rapport aux termes de la requête. Cloud Search calcule la pertinence thématique en fonction des éléments suivants :

  • L'importance de chaque terme de la requête.
  • Le nombre de correspondances (fréquence à laquelle un terme de requête apparaît dans le contenu ou les métadonnées).
  • Les types de correspondance entre les termes de la requête et les éléments indexés.

Pour influencer le score de pertinence thématique d'une propriété de texte, définissez le RetrievalImportance dans votre schéma. Une correspondance sur une propriété avec une valeur RetrievalImportance élevée génère un score plus élevé.

Par exemple, si vous stockez l'historique des bugs logiciels, les utilisateurs effectueront probablement des requêtes par nom de bug. Définissez RetrievalImportance sur HIGHEST pour le nom. Pour les descriptions, utilisez DEFAULT.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

Pour les documents HTML, les balises telles que <title> et <h1> permettent de déterminer l'importance des termes. Si ContentFormat est TEXT, ItemContent utilise l'importance DEFAULT. S'il s'agit de HTML, l'importance dépend des propriétés HTML.

Influencer l'actualisation

L'actualisation mesure la date de modification d'un élément à l'aide de createTime et updateTime dans ItemMetadata. Les éléments plus anciens sont moins bien classés.

Vous pouvez influencer l'actualisation en ajustant freshnessProperty et freshnessDuration dans FreshnessOptions. freshnessProperty vous permet d'utiliser une date ou un code temporel personnalisé au lieu de updateTime. Pour les bugs, vous pouvez utiliser une date limite afin que les éléments dont les dates sont les plus proches de la date actuelle soient mieux classés.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Utilisez freshnessDuration pour spécifier quand un élément est considéré comme obsolète. Une valeur élevée, comme 100 ans, annule l'effet d'actualisation. Cela est utile pour les données statiques telles que les profils d'employés. Pour les actualités, utilisez une petite valeur, comme trois jours.

Influencer la qualité

La qualité mesure l'exactitude et l'utilité d'un élément. Spécifiez une valeur comprise entre 0 et 1 à l'aide de SearchQualityMetadata. Les valeurs plus élevées améliorent le classement. Par exemple, vous pouvez améliorer le classement des documents sur les avantages sociaux rédigés par les ressources humaines.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Influencer à l'aide du type de champ

Vous pouvez influencer le classement en fonction des propriétés enum ou entières à l'aide de OrderedRanking :

  • NO_ORDER (par défaut) : aucun effet sur le classement.
  • ASCENDING : les valeurs plus élevées améliorent le classement.
  • DESCENDING : les valeurs plus faibles améliorent le classement.

Pour la priorité des bugs, utilisez DESCENDING si HIGH est 1 et LOW est 3. Pour une propriété votes, utilisez ASCENDING.

Influencer le classement par l'extension des requêtes

L'extension des requêtes utilise des synonymes et l'orthographe pour améliorer les résultats.

Utiliser des synonymes

Cloud Search utilise du contenu Web public pour les synonymes. Vous pouvez également définir des synonymes personnalisés pour la terminologie spécifique à l'organisation. Consultez Définir des synonymes.

Utiliser l'orthographe

Cloud Search fournit des suggestions orthographiques dans SpellResult. Il utilise également les corrections orthographiques comme synonymes pour trouver des documents.

Influencer le classement via les paramètres de l'application de recherche

Une application de recherche fournit des informations contextuelles. Vous pouvez influencer le classement à l'aide des paramètres suivants.

Ajuster la configuration de la notation

Spécifiez un ScoringConfig pour désactiver l'actualisation ou la personnalisation. La désactivation de la personnalisation supprime les améliorations du propriétaire et de l'interaction. Consultez Personnaliser l'expérience de recherche.

Ajuster la configuration de la source

Spécifiez les paramètres au niveau de la source de données :

  • Importance de la source : les éléments d'une source d'importance HIGH sont mieux classés.
  • Regroupement : limite les résultats d'une seule source (la valeur par défaut est 3) pour garantir la diversité.

Personnalisation

La personnalisation donne la priorité aux résultats en fonction de l'utilisateur :

  • Propriété de l'élément : améliore le classement des éléments appartenant à l'utilisateur.
  • Interaction avec l'élément : améliore le classement des éléments que l'utilisateur a récemment consultés, modifiés ou commentés.
  • Clics de l'utilisateur : améliore le classement des éléments sur lesquels l'utilisateur a cliqué précédemment. Ne modifiez pas l'URL du résultat, car elle est utilisée pour collecter ces données.

Interprétation des requêtes

La fonctionnalité d'interprétation des requêtes convertit les requêtes des utilisateurs en requêtes structurées basées sur des opérateurs à l'aide de définitions de schéma. Cela fournit des résultats précis, même avec un minimum de mots clés. Consultez Structurer un schéma pour une interprétation optimale des requêtes.

Langue de l'élément

Cloud Search rétrograde les éléments dont la langue ne correspond pas à celle de la requête. Définissez languageCode dans RequestOptions sur la préférence de l'utilisateur.

Contexte de l'élément

Utilisez contextAttributes pour améliorer le classement des éléments pertinents pour le contexte de la requête, tels que l'emplacement ou le service.

Popularité de l'élément

Cloud Search améliore le classement des éléments sur lesquels les utilisateurs cliquent fréquemment dans les requêtes récentes. Ne modifiez pas les URL des résultats de recherche, car elles sont utilisées pour suivre ces clics.

Résumé des paramètres de qualité de la recherche

Les tableaux suivants fournissent un résumé des paramètres de qualité de la recherche :

Paramètres du schéma

Paramètre Emplacement Recommandation Détails
ItemContent ItemContent Recommandé Pertinence thématique
RetrievalImportance RetrievalImportance Recommandé Pertinence thématique
FreshnessOptions FreshnessOptions Facultatif Actualisation

Paramètres d'indexation

Paramètre Emplacement Recommandation Détails
createTime/updateTime ItemMetadata Recommandé Actualisation
contentLanguage ItemMetadata Recommandé Langue de l'élément
owners ItemAcl Recommandé Propriété de l'élément
Synonymes personnalisés _dictionaryEntry Recommandé Utiliser des synonymes
quality SearchQualityMetadata Facultatif Influencer la qualité
Données sur l'interaction interaction Facultatif Interaction avec l'élément
OrderedRanking OrderedRanking Facultatif Type de champ

Paramètres de l'application de recherche

Paramètre Emplacement Recommandation Détails
Désactiver la personnalisation ScoringConfig Recommandé Personnalisation
Importance de la source SourceCrowdingConfig Facultatif Configuration de la source
Regroupement SourceCrowdingConfig Facultatif Configuration de la source

Étapes suivantes

  1. Structurer un schéma pour une interprétation optimale des requêtes.
  2. Définir des synonymes.