Compenser les expansions, les interprétations et les optimisations par défaut

Google Cloud Search propose plusieurs extensions, interprétations et optimisations par défaut qui affectent les résultats de recherche. Si vous constatez que les requêtes de recherche produisent des résultats inattendus, reportez-vous à ce guide avant de contacter l'assistance Cloud Search.

Expansions par défaut

Supposons qu'un utilisateur effectue une recherche à l'aide d'une chaîne, telle que [Joe's PDFs], mais que certains résultats renvoyés contiennent des mots en surbrillance, tels que "documents" et non "PDF". Pourquoi les résultats contiennent-ils les mots en surbrillance qui ne figuraient pas dans la requête de recherche ?

Par défaut, Google Cloud Search, tout comme la recherche sur le Web Google, ne se contente pas de rechercher les mots exacts d'une requête. Au lieu de cela, Cloud Search l'étend pour inclure les synonymes et les radicaux des mots (même si vous n'avez pas implémenté vos propres synonymes). Cette extension permet de récupérer les documents qui correspondent globalement à l'idée et à l'objectif de la requête. Une fois ce large ensemble de documents sélectionné, les algorithmes de classement s'efforcent de placer les meilleures correspondances en haut de l'ensemble de résultats.

Lorsque l'utilisateur a recherché [Joe's PDFs], Cloud Search a fourni les termes suivants comme mots supplémentaires acceptables:

  • Pour [Joe’s], Cloud Search peut également correspondre à "joe" (une extension de radical) et à "joes" (un synonymes basé sur la ponctuation).
  • Pour les fichiers PDF, Cloud Search peut également établir une correspondance avec "documents" (extension de synonyme) et "pdf" (extension de racine).

Par défaut, les synonymes ne sont pas nécessairement bidirectionnels. Par exemple, si un utilisateur recherche le terme "hameçonnage", Cloud Search peut établir une correspondance avec "hameçonnage" en tant qu'extension de synonyme. Toutefois, si l'utilisateur recherche le terme "hameçonnage", il est possible que le terme "hameçonnage" ne soit pas considéré comme une extension dans Google.

Extension des mots avec ou sans trait d'union

Lorsque l'utilisateur recherche des mots composés par rapport à ses équivalents sans trait d'union, tels que [dressage dressing] et [dressing], Cloud Search traite ces requêtes différemment.

En outre, différentes optimisations sont utilisées pour les mots composés et soulignés, tels que [walk-in] et [walk_in].

Compenser les expansions par défaut

Le développement par défaut n'est pas garanti. Si vous souhaitez assurer la bidirectionnelle des synonymes ou des expansions de synonymes spécifiques à un domaine, créez votre propre ensemble de synonymes spécifiques à un domaine. Pour en savoir plus sur l'implémentation des synonymes, consultez la section Définir des synonymes.

Interprétations par défaut

Cloud Search fournit également une interprétation du langage naturel, qui interprète les objets, les propriétés et les valeurs de champ utilisés dans une requête en fonction du schéma importé pour une source de données particulière. Pour en savoir plus sur cette interprétation en langage naturel, consultez la page Structurer votre schéma pour une interprétation optimale des requêtes.

Désactiver les interprétations en langage naturel

Pour désactiver les interprétations en langage naturel pour une requête spécifique, définissez QueryInterpretationOptions.disableNlInterpretation sur true dans la requête de recherche.

Optimisations par défaut

Cloud Search propose également les optimisations par défaut suivantes:

  • Combinaison des résultats fournis par la correction orthographique. Par exemple, si la chaîne de requête est [avantages de l'entreprise], Cloud Search recherche "entreprise" et l'orthographe correcte est "entreprise".

  • Pour les requêtes ne renvoyant pas ou peu de résultats, Cloud Search utilise un ensemble de termes associés plus permissif, plus large que les synonymes directs, lors de la mise en correspondance des résultats. Pour en savoir plus, consultez Gérer les résultats supplémentaires.

Normalisation de documents et de requêtes

La normalisation consiste à standardiser certains mots ou expressions avant ou après une requête. Pour garantir des réponses plus cohérentes à vos requêtes, envisagez de normaliser vos documents (avant ou pendant l'indexation) et vos requêtes (une fois que l'utilisateur a effectué la requête) comme suit:

  • Pour normaliser des documents:

    1. Choisissez une orthographe canonique pour les mots critiques utilisés dans les documents de vos référentiels.
    2. Corrigez l'orthographe dans les documents du dépôt source ou lors de l'indexation du contenu pour qu'elle corresponde à l'orthographe canonique.
  • Pour normaliser les requêtes:

    1. Interceptez les requêtes des utilisateurs avant de les envoyer à Cloud Search.
    2. Réécrivez les mots dans les requêtes des utilisateurs pour qu'ils correspondent à l'orthographe la plus courante dans la source de données indexée.
    3. Envoyez la requête à Cloud Search.

Désactiver les extensions, les interprétations et les optimisations pour toutes les requêtes

Pour désactiver les extensions, les interprétations et les optimisations pour une requête spécifique, définissez QueryInterpretationOptions.enableVerbatim Mode sur true dans la requête de recherche.