Classement personnalisé

Cette page explique comment modifier le classement des résultats de recherche renvoyés par vos moteurs de recherche.

  1. Présentation
  2. Optimiser les résultats grâce aux mots clés
  3. Modifier les résultats de recherche à l'aide de libellés
  4. Ajouter des libellés aux sites
  5. Moduler les effets des étiquettes

Présentation

Supposons que vous ayez compilé une liste de sites que vous souhaitez que votre moteur de recherche couvre, mais que lorsque vous testez certaines requêtes, les résultats de recherche ne correspondent pas tout à fait à ce que vous aviez en tête. Les résultats qui vous semblent les plus pertinents par rapport à la requête ne s'affichent pas en haut de la page. Ou peut-être voulez-vous donner la préférence aux pages web de votre établissement de recherche préféré ou de votre propre site web. Vous pouvez corriger ce problème en promouvant ou en rétrogradant les résultats. Programmable Search Engine vous permet d'ajuster les résultats en fonction de trois méthodes: les mots clés, les étiquettes pondérées et les scores. Les mots clés et les pondérations sont définis dans le fichier de contexte, tandis que les scores sont définis dans le fichier annotations.

  • Les mots clés constituent un moyen rapide de mettre en avant certaines pages Web dans vos résultats de recherche et d'obtenir davantage de résultats sur un sujet spécifique.
  • Les étiquettes pondérées indiquent à Programmable Search Engine s'il faut exclure, promouvoir ou rétrograder un site. La promotion ou la rétrogradation d'un site dépend des pondérations que vous appliquez aux libellés.
  • Les scores, qui sont appliqués aux annotations individuelles, tempèrent ou inversent l'influence des libellés pondérés. Elles ajoutent un niveau de précision supplémentaire à l'ajustement du classement.

Les pondérations dans les libellés et les scores dans les annotations sont les principaux boutons permettant de modifier le classement des résultats de recherche. Les deux ont des valeurs comprises entre -1.0 et +1.0. Vous pouvez promouvoir et rétrograder des sites en tournant les boutons (en augmentant ou en diminuant les valeurs) avec les scores et les pondérations.

Vous avez une forte influence sur le classement, mais vous n'avez pas de contrôle absolu sur les résultats. La promotion ou la rétrogradation des résultats dépendent de nombreux paramètres, dont la pertinence de la page Web, le choix des mots clés, la pondération sur les étiquettes, les scores dans les annotations, etc.

Haut de page

Optimiser les résultats grâce aux mots clés

Les mots clés constituent la méthode la plus rapide pour modifier les résultats. Programmable Search Engine optimise les pages Web contenant vos mots clés. Il peut également récupérer plus de résultats de recherche sur ce sujet. Si les résultats de votre recherche vous semblent dérisoires, essayez d'ajouter des mots clés. Si Programmable Search Engine booste les pages Web qui contiennent ces mots clés, il ne rétrograde ni ne filtre les pages qui ne contiennent pas ces mots clés.

Les mots clés vous permettent d'appliquer l'intention des utilisateurs au moteur de recherche. Par exemple, lorsque les utilisateurs du moteur de recherche de yoga recherchent "tapis", ils recherchent en fait "tapis de yoga", et non "tapis d'analogie de Miller" ou "tapis de maison". Pensez à l'objectif principal de votre moteur de recherche et au contexte des requêtes de recherche de vos utilisateurs. Dans l'exemple de notre moteur de recherche, le mot clé "yoga" est évident. N'utilisez pas de mots clés trop larges ou qui chevauchent trop de catégories. Par exemple, "exercice" et "pratiques orientales" permettent d'obtenir de nombreuses pages Web qui n'ont rien à voir avec le yoga. Les meilleurs mots clés décrivent le contenu des sites couverts par votre moteur de recherche.

Commencez par un seul mot, puis voyez si vous pouvez obtenir les résultats que vous souhaitez. Si vous n'obtenez pas suffisamment de résultats, essayez d'utiliser plusieurs mots clés. Vous pouvez également utiliser des expressions, qui sont une série de mots entre guillemets (par exemple, "pose de yoga"), mais les mots clés composés d'un seul mot sont plus adaptés. Programmable Search Engine interprète yoga pose stretch comme trois mots clés : "yoga", "étirement" et "pose".

Les mots clés ne sont pas indépendants les uns des autres, ils fonctionnent ensemble. Ainsi, si vous avez les mots clés "yoga" et "pose", les pages Web qui contiennent "yoga" et celles qui contiennent "pose" sont boostées, tandis que celles qui contiennent à la fois "yoga" et "pose" sont encore plus stimulées.

Exemple: mots clés

Comparons les résultats de recherche pour "tapis " dans deux versions d'un moteur de recherche programmable pour le yoga.

Figure 1 : Résultats de la requête de recherche "tapis" pour un moteur de recherche qui n'utilise pas de mots clés. (Pour afficher l'ensemble des résultats, cliquez sur l'image.)

Exemple de moteur de recherche
qui n'utilise pas de mots-clés

Figure 2:Résultats de la requête de recherche "tapis" dans un moteur de recherche avec le mot clé "yoga".

Exemple de moteur de recherche
utilisant le mot clé yoga

Dans la version avec le mot clé "yoga", les pages Web contenant le mot clé sont mises en avant sur la page de résultats.

Haut de page

Création de mots-clés

Vous pouvez créer autant de mots clés que vous le souhaitez, sans dépasser 100 caractères. Le moyen le plus simple de créer des mots clés consiste à consulter la section Généralités de la page Présentation dans le panneau de configuration. Vous pouvez utiliser cet onglet pour effectuer des tests, en essayant différents mots clés et en étudiant leurs effets sur la page de résultats. Si les résultats ne vous conviennent pas, vous pouvez facilement supprimer un mot clé et en essayer un autre.

Si vous souhaitez créer des mots clés dans votre fichier de contexte, vous pouvez utiliser l'attribut keywords de l'élément CustomSearchEngine pour définir les valeurs des mots clés. Séparez les mots clés les uns des autres en utilisant un seul espace. Placez les expressions entre guillemets. Vous pouvez utiliser le signe de ponctuation (") ou l'entité de caractère (").

  <CustomSearchEngine keywords="asana &quot;yoga postures&quot;">
  </CustomSearchEngine>

Modification des résultats de recherche à l'aide de libellés

L'autre façon de modifier les résultats de recherche consiste à utiliser des libellés, qui sont des éléments de base pour le classement des résultats de recherche. Ils déterminent la manière dont les sites doivent être traités.

Vous pouvez utiliser deux types de libellés: les libellés du moteur de recherche et les libellés de suggestion. Les libellés du moteur de recherche déterminent quels sites le moteur de recherche doit couvrir. Ils sont invisibles pour vos utilisateurs et s'exécutent en arrière-plan. Par conséquent, leur élément parent s'appelle BackgroundLabels. Les libellés de filtre, quant à eux, sont visibles par les utilisateurs et apparaissent sous forme de liens. Les affinements sont abordés en détail sur la page Affiner les recherches. Bien que les modes, les pondérations et les scores fonctionnent de la même manière dans les libellés de moteur de recherche et dans les libellés d'affinement, la majeure partie de cette page est consacrée aux libellés de moteur de recherche.

Le code suivant montre les deux types d'étiquettes dans le fichier de contexte:

<!--Search engine labels-->
<BackgroundLabels>
  <Label name="_include_" mode="FILTER"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
<lt;/BackgroundLabels>

<!--Refinement label-->
   <Facet>
      <FacetItem title="Lectures">
         <Label name="lectures" mode="BOOST" weight="0.8">
            <Rewrite>lecture OR lectures</Rewrite>
         </Label>
      </FacetItem>
    </Facet>

Lorsque vous créez un moteur Programmable Search Engine à l'aide du panneau de configuration, Programmable Search Engine crée deux libellés de moteur de recherche pour vous. Les libellés comportent des modes qui déterminent la manière dont les sites doivent être traités. L'une d'elles est exclusive (mode="ELIMINATE") et l'autre inclusive (mode="FILTER"). Vous pouvez modifier le mode de l'étiquette inclusive de "FILTER" à "BOOST" après avoir créé le Programmable Search Engine.

Haut de page

Utiliser des libellés

Pour utiliser des libellés de moteur de recherche, procédez comme suit:

  1. Dans le fichier de contexte, créez ou redéfinissez des libellés de moteur de recherche.
    1. Définissez le nom du libellé. Vous pouvez accepter le nom généré par le panneau de configuration ou définir le vôtre.
    2. Définissez le mode.
    3. Facultatif. Définissez les pondérations.
  2. Dans le fichier d'annotations, taguez les sites à l'aide de libellés.

Exemple: fichier de contexte avec des étiquettes

Voici un exemple tronqué de fichier de contexte contenant des libellés de moteur de recherche.

<CustomSearchEngine keywords="climate &quot;global warming&quot; &quot;greenhouse gases&quot;">
  <Title>RealClimate</Title>
  <Description>"Climate change"</Description>
  <Context>
    <BackgroundLabels>
      <Label name="_include_" mode="FILTER"/>
      <Label name="_exclude_" mode="ELIMINATE"/>
    </BackgroundLabels>
  </Context>
</CustomSearchEngine>

Haut de page

Définir le mode du libellé

La promotion, la rétrogradation ou l'exclusion d'un site dépend du libellé du moteur de recherche auquel il est associé. Un libellé de moteur de recherche peut avoir les modes suivants:

Remarque:Veillez à respecter les majuscules. Utilisez des lettres majuscules pour les modes.

Mode Procédez comme suit : Utilisez ce mode si...
ELIMINATE Exclut les sites associés à ce libellé de votre moteur de recherche.

Vous souhaitez exclure les pages Web les mieux classées dans la recherche Google, mais qui ne conviennent pas à votre audience.

Par exemple, si vous créez un moteur de recherche pour l'étude scientifique des hamsters, vous devez utiliser des libellés avec le mode ELIMINATE pour exclure les sites les mieux classés qui proposent des informations sur les soins pour les animaux de compagnie, les hamsters qui dansent et les hamsters qui peuvent chanter d'une voix agaçante tout en jouant du banjo.

FILTER Inclut uniquement les sites associés à ce libellé. Il exclut tout le reste.

Vous souhaitez que le moteur de recherche n'explore que votre site, vos sites affiliés ou ceux traitant d'un sujet spécifique.

Étant donné que la couverture de ces moteurs de recherche est limitée à un nombre limité de sites, vous pouvez mieux contrôler le classement des résultats de recherche. La modification de l'ordre des résultats de recherche à l'aide de pondérations est abordée dans la section suivante.

Par exemple, si vous souhaitez créer un moteur de recherche uniquement pour votre site Web, ajoutez un seul site tagué avec un libellé associé au mode FILTER. Les résultats de recherche incluent uniquement les pages de votre site Web.

BOOST Inclut tous les sites Web de votre moteur de recherche, mais met en avant ou rétrograde les sites associés à ce libellé. La promotion ou la rétrogradation d'un site dépend de la pondération que vous lui attribuez. Vous souhaitez un moteur de recherche large qui met l'accent sur certains sites, mais n'exclut pas d'autres du tout.

Par exemple, si vous souhaitez créer un moteur de recherche offrant une couverture étendue, mais que vous avez un faible pour votre propre site Web (le meilleur site Web de tous les temps), utilisez des libellés avec le mode BOOST.

Haut de page

Créer des étiquettes pondérées

Une fois que vous avez défini des libellés qui incluent, promeuvent ou excluent des sites, vous pouvez attribuer une pondération aux libellés inclusifs. Les pondérations vous permettent de définir dans quelle mesure un libellé doit promouvoir ou rétrograder un site tagué. Les valeurs de pondération peuvent varier de -1.0 à +1.0. La plage de poids vous donne un contrôle assez précis des sites. Une pondération positive dans le libellé met l'accent sur les sites associés, tandis qu'une pondération négative le réduit.

Le code suivant montre un libellé pondéré:

<BackgroundLabels>
  <Label name="_include_" mode="FILTER" weight="0.65"/>
  <Label name="_exclude_" mode="ELIMINATE"/>
</BackgroundLabels>

Les libellés de boosting et de filtre qui n'ont pas de pondération définie, comme ceux générés par Programmable Search Engine, ont une pondération par défaut de +0.7. Par conséquent, si vous souhaitez renforcer la capacité du libellé généré à promouvoir des sites, remplacez sa valeur par une valeur supérieure à +0.7. Si vous remplacez cette valeur par une valeur inférieure à celle par défaut, vous affaiblissez l'effet d'optimisation du libellé sur le classement du site. Lorsque vous utilisez l'autre méthode et que vous attribuez une pondération négative au libellé, celui-ci rétrograde ou supprime un site. À mesure que vous approchez de -1.0, il est de plus en plus difficile pour les sites d'obtenir un bon classement dans les résultats. Chez -1.0, même un site très bien classé aura du mal à surmonter cette forte rétrogradation.

Le tableau suivant montre comment les résultats sont ajustés en fonction du mode et de la pondération d'une étiquette.

Mode Poids Effet
BOOST +1.0 Faire une grande promotion au site. Toutefois, cela ne signifie pas nécessairement que le site tagué sera toujours le meilleur résultat ou que d'autres sites seront exclus. Ce n'est pas la même chose que de définir le mode sur FILTER. Les résultats peuvent toujours être affichés même si aucun d'eux ne correspond au libellé. Les résultats les plus pertinents par rapport à la requête de recherche peuvent toujours supplanter vos sites non pertinents, mais fortement favoris.

Si vous êtes convaincu que les sites auxquels vous ajoutez des libellés fortement pondérés doivent être les meilleurs résultats tout en excluant tous les autres résultats, vous devez utiliser un libellé de filtre plutôt qu'un libellé de boost.

BOOST -1.0 Cela permet de procéder à une forte rétrogradation du site. Ce n'est pas la même chose que de définir le mode sur ELIMINATE, car des résultats très pertinents peuvent tout de même être affichés. Le site doit se battre en amont pour obtenir un classement assez élevé, mais il n'est pas complètement masqué.
BOOST Indéterminé Si vous ne définissez pas la pondération (par exemple, <Label name="standard" mode="BOOST"/>), sa pondération implicite est de +0.7.
FILTER +1.0 Il permet au site sélectionné de bénéficier d'une promotion importante. Lorsque le mode est défini sur FILTER, Programmable Search Engine affiche uniquement les sites qui correspondent au libellé. Par conséquent, si aucun des sites que vous avez sélectionnés n'est pertinent par rapport à la requête de l'utilisateur, aucun résultat ne s'affichera.
FILTER -1.0 Empêche le site sélectionné de s'afficher dans les résultats. C'est comme si vous aviez ajouté au site le libellé "remove".
FILTER Indéterminé Si vous ne définissez pas la pondération (par exemple, <Label name="standard" mode="FILTER"/>), la pondération implicite est de +0.7.
ELIMINATE Aucun poids Bloque le site. Les sites correspondant au libellé ne sont pas affichés. Si tous les résultats pertinents sont associés à un libellé d'élimination, vous pouvez avoir une page de résultats vide. Ce phénomène est plus susceptible de se produire avec les moteurs de recherche de type filtre, et non avec les moteurs de recherche boostés.

Vous pouvez créer plusieurs libellés de pondérations différentes et les appliquer aux sites comme bon vous semble. Par exemple, vous pouvez créer un libellé qui promeut fortement les sites et un autre qui en fait légèrement la promotion. Vous pouvez créer autant de libellés pondérés que vous le souhaitez, mais après un certain temps, ils peuvent devenir difficiles à gérer. Les scores, qui sont abordés dans la section suivante, constituent un meilleur moyen de contrôler le classement des sites à un niveau plus précis.

Haut de page

Ajouter des libellés à des sites

Une fois que vous avez défini des libellés, vous pouvez commencer à les taguer sur les sites. Chaque annotation peut être associée à plusieurs libellés. Le même site peut donc être utilisé dans d'autres moteurs de recherche et être classé différemment.

<Annotations>
  <Annotation about="webcast.berkeley.edu/*" score="1">
    <Label name="cse_university_boost_highest"/>
    <Label name="cse_bicycles_exclude"/>
    <Label name="cse_hamsters_filter"/>
  </Annotation>
</Annotations>

Haut de page

Moduler les effets des étiquettes

Les scores vous permettent de moduler l'influence des étiquettes. Ils peuvent atténuer ou inverser les effets des libellés sur des sites spécifiques. L'attribut score de l'élément Annotation peut avoir une valeur comprise entre -1.0 et 1.0. Un score de 0 supprime l'influence du libellé sur le classement du site. Un score de 1 applique toute l'influence. Un score de -1 inverse complètement les effets. Les valeurs comprises entre 0 et 1, ou -1 et 0 (par exemple, 0.55) permettent d'affiner l'influence des libellés. Si vous n'attribuez pas de score à une annotation, la recherche personnalisée applique tout l'effet du libellé au site. C'est comme si vous lui aviez attribué le score 1.

Le tableau suivant montre comment les scores peuvent ajuster l'influence des libellés:

Mode Poids Score Effet
Tous Tous Aucun Cela revient à attribuer à l'annotation un score de 1.0. Le libellé est appliqué à l'intégralité du site.
BOOST +1.0 -1.0 Cela revient à inverser l'étiquette BOOST et à lui attribuer une pondération de -1.0. Elle rétrograde de manière agressive le site.
BOOST -1.0 -1.0 Cela revient à inverser l'étiquette BOOST et à lui attribuer une pondération de +1.0. Il fait la promotion agressive du site.
FILTER +1.0 -1.0 Cela revient à ajouter le libellé ELIMINATE au site. Elle exclut complètement le site.
FILTER -1.0 -1.0 Cela revient à inverser l'étiquette FILTER et à lui attribuer une pondération de +1.0. Il fait la promotion agressive du site.
ELIMINATE Aucun poids -1.0 Identique à la conversion du libellé ELIMINATE en un libellé de filtre avec un score de +1.0. Il fait une promotion agressive du site.

Exemple: code pour le score

Dans l'exemple suivant, trois sites sont tagués avec le même libellé de moteur de recherche. Cependant, les effets du thème ne sont pas uniformes sur les trois sites différents, car chaque annotation a un score différent, appliquant le thème avec des intensités différentes.

<Annotations>
    
  <Annotation about="*.edu/*" score="0.0001">
    <Label name="vision_label"/>
  </Annotation>

  <Annotation about="*.ucsd.edu/*" score="0.7">
    <Label name="vision_label"/>
  </Annotation>

  <Annotation about="*.vision.ucsd.edu/*" score="1">
    <Label name="vision_label"/>
  </Annotation>

</Annotations>

Même si les trois annotations comportent la balise vision_label, Programmable Search Engine les traite différemment en fonction de leurs scores. Les résultats provenant de vision.ucsd.edu sont très favorables. Ceux provenant de ucsd.edu le sont modérément, tandis que ceux provenant des domaines de premier niveau .edu sont légèrement privilégiés par rapport aux autres sites.

Haut de page