Améliorer la qualité de la recherche

La qualité de la recherche fait référence à la qualité des résultats de recherche en termes de classement et de rappel, telle qu'elle est perçue par l'utilisateur.

Le classement correspond à l'ordre des éléments, et le rappel au nombre d'éléments pertinents récupérés. Un élément (ou document) désigne tout contenu numérique que Google Cloud Search peut indexer, comme des documents Microsoft Office, des fichiers PDF, des lignes de base de données ou des URL uniques. Un élément se compose des éléments suivants :

  • Métadonnées structurées
  • Contenu indexable
  • LCA

Cloud Search utilise différents signaux pour récupérer et classer les résultats. Vous pouvez influencer ces signaux grâce aux paramètres du schéma, au contenu et aux métadonnées des éléments, ainsi qu'à l'application de recherche. Ce document vous aide à améliorer la qualité de la recherche en modifiant ces facteurs d'influence des signaux.

Pour obtenir un récapitulatif des paramètres, consultez Récapitulatif des paramètres de qualité de la recherche.

Influencer le score de pertinence thématique

La pertinence thématique correspond à la pertinence d'un résultat de recherche par rapport aux termes de la requête. Cloud Search calcule la pertinence thématique en fonction des éléments suivants :

  • Importance de chaque terme de requête.
  • Nombre de résultats (fréquence d'apparition d'un terme de requête dans le contenu ou les métadonnées).
  • Types de correspondance entre les termes de requête et les éléments indexés.

Pour influencer le score de pertinence thématique d'une propriété de texte, définissez RetrievalImportance dans votre schéma. Une correspondance sur une propriété avec un RetrievalImportance élevé entraîne un score plus élevé.

Par exemple, si vous stockez l'historique des bugs logiciels, les utilisateurs effectuent probablement des requêtes par nom de bug. Définissez RetrievalImportance sur HIGHEST pour le nom. Pour les descriptions, utilisez DEFAULT.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

Pour les documents HTML, les balises telles que <title> et <h1> permettent de déterminer l'importance des termes. Si ContentFormat est défini sur TEXT, ItemContent utilise l'importance DEFAULT. Si la valeur est HTML, l'importance dépend des propriétés HTML.

Fraîcheur de l'influence

La fraîcheur mesure la date de la dernière modification d'un élément à l'aide de createTime et updateTime dans ItemMetadata. Les éléments plus anciens sont moins bien classés.

Vous pouvez influencer la fraîcheur en ajustant freshnessProperty et freshnessDuration dans FreshnessOptions. freshnessProperty vous permet d'utiliser une date ou un code temporel personnalisés au lieu de updateTime. Pour les bugs, vous pouvez utiliser une date limite afin que les éléments dont la date est la plus proche de la date actuelle soient classés plus haut.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Utilisez freshnessDuration pour spécifier quand un élément est considéré comme obsolète. Une valeur élevée, comme 100 ans, annule l'effet de fraîcheur. Cela s'avère utile pour les données statiques, comme les profils d'employés. Pour les actualités, utilisez une petite valeur, comme trois jours.

Qualité de l'influence

La qualité mesure l'exactitude et l'utilité d'un élément. Spécifiez une valeur comprise entre 0 et 1 à l'aide de SearchQualityMetadata. Plus la valeur est élevée, plus le classement est amélioré. Par exemple, vous pouvez mettre en avant les documents sur les avantages sociaux rédigés par les RH.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Influence à l'aide du type de champ

Vous pouvez influencer le classement en fonction des propriétés enum ou integer à l'aide de OrderedRanking :

  • NO_ORDER (par défaut) : aucun effet sur le classement.
  • ASCENDING : les valeurs élevées améliorent le classement.
  • DESCENDING : les valeurs les plus basses améliorent le classement.

Pour la priorité des bugs, utilisez DESCENDING si HIGH est défini sur 1 et LOW sur 3. Pour une propriété votes, utilisez ASCENDING.

Influencer le classement grâce à l'extension des requêtes

L'expansion des requêtes utilise des synonymes et l'orthographe pour améliorer les résultats.

Utiliser des synonymes

Cloud Search utilise du contenu Web public pour les synonymes. Vous pouvez également définir des synonymes personnalisés pour la terminologie spécifique à votre organisation. Consultez Définir des synonymes.

Utiliser l'orthographe

Cloud Search fournit des suggestions orthographiques en SpellResult. Il utilise également les corrections orthographiques comme synonymes pour trouver des documents.

Influencer le classement grâce aux paramètres de l'application de recherche

Une application de recherche fournit des informations contextuelles. Vous pouvez influencer le classement à l'aide des paramètres suivants.

Ajuster la configuration de la notation

Spécifiez ScoringConfig pour désactiver la fraîcheur ou la personnalisation. La désactivation de la personnalisation supprime les boosts propriétaire et interaction. Consultez Personnaliser l'expérience de recherche.

Ajuster la configuration source

Spécifiez les paramètres au niveau de la source de données :

  • Importance de la source : les éléments provenant d'une source d'importance HIGH sont mieux classés.
  • Abondance : limite les résultats provenant d'une même source (la valeur par défaut est 3) pour assurer la diversité.

Personnalisation

La personnalisation donne la priorité aux résultats en fonction de l'utilisateur :

  • Propriété des articles : met en avant les articles appartenant à l'utilisateur.
  • Interaction avec un élément : met en avant les éléments que l'utilisateur a récemment consultés, modifiés ou commentés.
  • Clics de l'utilisateur : met en avant les éléments sur lesquels l'utilisateur a cliqué précédemment. Ne modifiez pas l'URL du résultat, car elle est utilisée pour collecter ces données.

Interprétation des requêtes

La fonctionnalité Interprétation des requêtes convertit les requêtes utilisateur en requêtes structurées basées sur des opérateurs à l'aide de définitions de schéma. Cela permet d'obtenir des résultats précis, même avec un minimum de mots clés. Consultez Structurer un schéma pour une interprétation optimale des requêtes.

Langue de l'article

Cloud Search rétrograde les éléments dont la langue ne correspond pas à celle de la requête. Définissez languageCode dans RequestOptions sur la préférence de l'utilisateur.

Contexte de l'article

Utilisez contextAttributes pour améliorer le classement des éléments pertinents pour le contexte de la requête, comme le lieu ou le service.

Popularité des articles

Cloud Search met en avant les éléments sur lesquels les utilisateurs cliquent fréquemment dans les requêtes récentes. Ne modifiez pas les URL des résultats de recherche, car elles sont utilisées pour suivre ces clics.

Récapitulatif des paramètres de qualité de la recherche

Les tableaux suivants récapitulent les paramètres de qualité de la recherche :

Paramètres du schéma

Paramètre Emplacement Recommandation Détails
ItemContent ItemContent Recommandé Pertinence thématique
RetrievalImportance RetrievalImportance Recommandé Pertinence thématique
FreshnessOptions FreshnessOptions Facultatif Fraîcheur

Paramètres d'indexation

Paramètre Emplacement Recommandation Détails
createTime/updateTime ItemMetadata Recommandé Fraîcheur
contentLanguage ItemMetadata Recommandé Langue de l'article
owners ItemAcl Recommandé Propriété des articles
Synonymes personnalisés _dictionaryEntry Recommandé Utiliser des synonymes
quality SearchQualityMetadata Facultatif Qualité de l'influence
Données sur l'interaction interaction Facultatif Interaction avec un article
OrderedRanking OrderedRanking Facultatif Field type (Type de champ)

Paramètres de l'application de recherche

Paramètre Emplacement Recommandation Détails
Désactiver la personnalisation ScoringConfig Recommandé Personnalisation
Importance de la source SourceCrowdingConfig Facultatif Configuration de la source
Regroupement SourceCrowdingConfig Facultatif Configuration de la source

Étapes suivantes

  1. Structurez un schéma pour une interprétation optimale des requêtes.
  2. Définir des synonymes