Suchqualität bezieht sich auf die Qualität der Suchergebnisse in Bezug auf Ranking und Recall aus Nutzersicht.
Ranking ist die Reihenfolge der Elemente und Recall ist die Anzahl der abgerufenen relevanten Elemente. Ein Element (oder Dokument) ist ein beliebiger digitaler Inhalt, den Google Cloud Search indexieren kann, z. B. Microsoft Office-Dokumente, PDF-Dateien, Datenbankzeilen oder eindeutige URLs. Ein Element besteht aus:
- Strukturierte Metadaten
- Indexierbare Inhalte
- ACLs
Cloud Search verwendet verschiedene Signale, um Ergebnisse abzurufen und zu ranken. Sie können diese Signale über Einstellungen im Schema, in den Artikelinhalten und ‑metadaten sowie in der Suchanwendung beeinflussen. In diesem Dokument erfahren Sie, wie Sie die Qualität der Suche verbessern können, indem Sie diese Signalparameter ändern.
Eine Zusammenfassung der Einstellungen finden Sie unter Zusammenfassung der Einstellungen für die Suchqualität.
Aktualitätswert beeinflussen
Aktualität ist die Relevanz eines Suchergebnisses für die Suchbegriffe. Cloud Search berechnet die Aktualität anhand von:
- Die Wichtigkeit der einzelnen Suchbegriffe.
- Die Anzahl der Treffer (wie oft ein Suchbegriff in Inhalten oder Metadaten vorkommt).
- Die Keyword-Optionen zwischen Suchanfragebegriffen und indexierten Elementen.
Wenn Sie den Aktualitätswert einer Texteigenschaft beeinflussen möchten, definieren Sie RetrievalImportance in Ihrem Schema. Eine Übereinstimmung bei einer Eigenschaft mit einem hohen RetrievalImportance führt zu einer höheren Punktzahl.
Wenn Sie beispielsweise den Verlauf von Softwarefehlern speichern, fragen Nutzer wahrscheinlich nach dem Namen des Fehlers.
Legen Sie für den Namen RetrievalImportance als HIGHEST fest. Verwenden Sie für Beschreibungen DEFAULT.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
In HTML-Dokumenten helfen Tags wie <title> und <h1> dabei, die Wichtigkeit von Begriffen zu bestimmen. Wenn ContentFormat gleich TEXT ist, wird für ItemContent die DEFAULT-Wichtigkeit verwendet. Wenn der Wert HTML ist, hängt die Wichtigkeit von den HTML-Attributen ab.
Aktualität von Einflussfaktoren
Aktualität: Gibt an, wie lange es her ist, dass ein Element zuletzt geändert wurde. Dazu werden createTime und updateTime in ItemMetadata verwendet.
Ältere Elemente werden niedriger eingestuft.
Sie können die Aktualität beeinflussen, indem Sie freshnessProperty und freshnessDuration in FreshnessOptions anpassen.
Mit freshnessProperty können Sie ein benutzerdefiniertes Datum oder einen benutzerdefinierten Zeitstempel anstelle von updateTime verwenden. Bei Fehlern können Sie ein Fälligkeitsdatum verwenden, damit Elemente mit Datumsangaben, die am nächsten am aktuellen Datum liegen, höher eingestuft werden.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Mit freshnessDuration können Sie angeben, wann ein Artikel als veraltet gilt. Ein hoher Wert wie 100 Jahre macht den Aktualitätseffekt zunichte. Das ist nützlich für statische Daten wie Mitarbeiterprofile. Verwenden Sie für Nachrichten einen kleinen Wert wie drei Tage.
Qualität der Einflussfaktoren
Qualität gibt an, wie genau und nützlich ein Element ist. Geben Sie mit SearchQualityMetadata einen Wert zwischen 0 und 1 an.
Höhere Werte verbessern das Ranking. Sie können beispielsweise Dokumente zu Mitarbeiterleistungen, die von der Personalabteilung erstellt wurden, priorisieren.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Einfluss über Feldtyp
Sie können das Ranking basierend auf Enum- oder Integer-Attributen mit OrderedRanking beeinflussen:
NO_ORDER(Standard): Keine Auswirkungen auf das Ranking.ASCENDING: Höhere Werte verbessern das Ranking.DESCENDING: Niedrigere Werte verbessern das Ranking.
Verwenden Sie für die Fehlerpriorität DESCENDING, wenn HIGH = 1 und LOW = 3 ist. Verwenden Sie für das Attribut votes den Wert ASCENDING.
Ranking durch Suchanfragenerweiterung beeinflussen
Bei der Suchanfragenerweiterung werden Synonyme und die Rechtschreibung verwendet, um die Ergebnisse zu verbessern.
Synonyme verwenden
Cloud Search verwendet öffentliche Webinhalte für Synonyme. Sie können auch benutzerdefinierte Synonyme für organisationsspezifische Terminologie definieren. Weitere Informationen finden Sie unter Synonyme definieren.
Rechtschreibung verwenden
Cloud Search bietet Rechtschreibvorschläge in SpellResult.
Außerdem werden Rechtschreibkorrekturen als Synonyme verwendet, um Dokumente zu finden.
Ranking über die Einstellungen der Suchanwendung beeinflussen
Eine Suchanwendung liefert Kontextinformationen. Mit den folgenden Einstellungen können Sie das Ranking beeinflussen.
Konfiguration für die Bewertung anpassen
Geben Sie einen ScoringConfig an, um die Aktualität oder Personalisierung zu deaktivieren.
Wenn Sie die Personalisierung deaktivieren, werden Eigentümer- und Interaktions-Steigerungen entfernt. Weitere Informationen finden Sie unter Suche anpassen.
Quellkonfiguration anpassen
Einstellungen auf Datenquellenebene festlegen:
- Wichtigkeit der Quelle: Elemente aus einer
HIGH-Wichtigkeitsquelle werden höher eingestuft. - Crowding: Beschränkt die Ergebnisse aus einer einzelnen Quelle (Standardwert ist 3), um für Vielfalt zu sorgen.
Personalisierung
Bei der Personalisierung werden Ergebnisse basierend auf dem Nutzer priorisiert:
- Artikelinhaberschaft: Steigert die Sichtbarkeit von Artikeln, die dem Nutzer gehören.
- Interaktion mit Elementen: Es werden Elemente hervorgehoben, die der Nutzer vor Kurzem angesehen, bearbeitet oder kommentiert hat.
- Nutzerklicks: Es werden Elemente beworben, auf die der Nutzer zuvor geklickt hat. Ändern Sie die Ergebnis-URL nicht, da sie zum Erheben dieser Daten verwendet wird.
Interpretation von Suchanfragen
Mit der Funktion Abfrageinterpretation werden Nutzeranfragen mithilfe von Schemadefinitionen in strukturierte, operatorbasierte Anfragen umgewandelt. So erhalten Sie auch mit wenigen Keywords präzise Ergebnisse. Weitere Informationen finden Sie unter Schema für optimale Abfrageinterpretation strukturieren.
Sprache des Artikels
In Cloud Search werden Elemente, deren Sprache nicht mit der Sprache der Anfrage übereinstimmt, herabgestuft. Legen Sie languageCode in RequestOptions entsprechend den Nutzerpräferenzen fest.
Artikelkontext
Verwenden Sie contextAttributes, um das Ranking von Elementen zu verbessern, die für den Kontext der Anfrage relevant sind, z. B. Standort oder Abteilung.
Beliebtheit von Artikeln
In Cloud Search werden Elemente, auf die Nutzer bei den letzten Anfragen häufig geklickt haben, höher eingestuft. Ändern Sie die URLs der Suchergebnisse nicht, da sie zum Erfassen dieser Klicks verwendet werden.
Zusammenfassung der Einstellungen für die Suchqualität
Die folgenden Tabellen enthalten eine Zusammenfassung der Einstellungen für die Suchqualität:
Schemaeinstellungen
| Einstellung | Standort | Empfehlung | Details |
|---|---|---|---|
ItemContent |
ItemContent |
Empfohlen | Aktualität |
RetrievalImportance |
RetrievalImportance |
Empfohlen | Aktualität |
FreshnessOptions |
FreshnessOptions |
Optional | Aktualität |
Indexierungseinstellungen
| Einstellung | Standort | Empfehlung | Details |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
Empfohlen | Aktualität |
contentLanguage |
ItemMetadata |
Empfohlen | Sprache des Artikels |
owners |
ItemAcl |
Empfohlen | Artikelinhaberschaft |
| Benutzerdefinierte Synonyme | _dictionaryEntry |
Empfohlen | Synonyme verwenden |
quality |
SearchQualityMetadata |
Optional | Qualität der Beeinflussung |
| Interaktionsdaten | interaction |
Optional | Interaktion mit Artikel |
OrderedRanking |
OrderedRanking |
Optional | Feldtyp |
Einstellungen der Suchanwendung
| Einstellung | Standort | Empfehlung | Details |
|---|---|---|---|
| Personalisierung deaktivieren | ScoringConfig |
Empfohlen | Personalisierung |
| Wichtigkeit der Quelle | SourceCrowdingConfig |
Optional | Quellkonfiguration |
| Crowding | SourceCrowdingConfig |
Optional | Quellkonfiguration |