Качество поиска относится к качеству результатов поиска с точки зрения ранжирования и запоминаемости, воспринимаемых пользователем.
Ranking is the order of items, and recall is the number of relevant items retrieved. An item (or document) is any piece of digital content Google Cloud Search can index, such as Microsoft Office documents, PDF files, database rows, or unique URLs. An item consists of:
- Структурированные метаданные
- Индексируемый контент
- передние крестообразные связки
Cloud Search uses various signals to retrieve and rank results. You can influence these signals through settings in the schema, item content and metadata, and the search application. This document helps you improve search quality by modifying these signal influencers.
Сводную информацию о настройках см. в разделе «Сводка настроек качества поиска» .
Оценка актуальности влияния
Темальность — это релевантность результатов поиска поисковым запросам. Cloud Search рассчитывает темальность на основе следующих критериев:
- Важность каждого поискового запроса.
- Количество совпадений (как часто поисковый запрос встречается в контенте или метаданных).
- Типы соответствия между поисковыми запросами и индексированными элементами.
Чтобы повлиять на показатель актуальности текстового свойства, определите параметр RetrievalImportance в вашей схеме. Совпадение со свойством с высоким значением RetrievalImportance приводит к более высокому показателю.
Например, если вы храните историю ошибок программного обеспечения, пользователи, скорее всего, будут искать информацию по названию ошибки. Установите параметр RetrievalImportance для имени на HIGHEST . Для описаний используйте DEFAULT .
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
For HTML documents, tags like <title> and <h1> help determine term importance. If ContentFormat is TEXT , ItemContent uses DEFAULT importance. If it is HTML , importance depends on HTML properties.
Влияние на свежесть
Показатель актуальности (Freshity) измеряет, как давно был изменен элемент, используя createTime и updateTime в ItemMetadata . Более старые элементы имеют более низкий рейтинг.
You can influence freshness by adjusting freshnessProperty and freshnessDuration in FreshnessOptions . The freshnessProperty lets you use a custom date or timestamp instead of updateTime . For bugs, you might use a due date so items with dates closest to now rank higher.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Use freshnessDuration to specify when an item is considered out-of-date. A high value, like 100 years, nullifies the freshness effect. This is useful for static data like employee profiles. For news, use a small value like three days.
Качество влияния
Quality measures an item's accuracy and usefulness. Specify a value between 0 and 1 using SearchQualityMetadata . Higher values boost ranking. For example, you might boost benefits documents authored by HR.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Влияние с использованием типа поля
С помощью OrderedRanking вы можете влиять на ранжирование на основе свойств перечислений или целых чисел:
-
NO_ORDER(по умолчанию): Не влияет на ранжирование. -
ASCENDING: Более высокие значения повышают рейтинг. -
DESCENDING: более низкие значения повышают рейтинг.
Для определения приоритета ошибки используйте DESCENDING , если HIGH равно 1, а LOW равно 3. Для параметра votes используйте ASCENDING .
Влияние на ранжирование посредством расширения запроса
Расширение поискового запроса использует синонимы и орфографию для улучшения результатов.
Используйте синонимы
Cloud Search использует общедоступный веб-контент в качестве синонимов. Вы также можете определить собственные синонимы для терминологии, специфичной для вашей организации. См. раздел «Определение синонимов» .
Используйте орфографию
Cloud Search предоставляет орфографические подсказки в SpellResult . Он также использует исправления орфографии в качестве синонимов для поиска документов.
Рейтинг влияния через настройки поискового приложения
Приложение для поиска предоставляет контекстную информацию. Вы можете влиять на ранжирование, используя следующие настройки.
Настройте параметры подсчета баллов.
Укажите параметр ScoringConfig , чтобы отключить проверку актуальности или персонализацию . Отключение персонализации снимает бонусы за действия пользователя и за взаимодействие с сайтом . См. раздел «Настройка поиска» .
Настройте конфигурацию источника.
Укажите параметры на уровне источника данных:
- Важность источника : Элементы из источника
HIGHважности занимают более высокое место в рейтинге. - Ограничение количества результатов : Ограничивает количество результатов из одного источника (по умолчанию — 3) для обеспечения разнообразия.
Персонализация
Персонализация определяет приоритетность результатов в зависимости от пользователя:
- Владение предметами : Повышает характеристики предметов, принадлежащих пользователю.
- Взаимодействие с товарами : Повышает рейтинг товаров, которые пользователь недавно просматривал, редактировал или комментировал.
- Клики пользователя : Поднимает в результатах поиска элементы, на которые пользователь кликал ранее. Не изменяйте URL-адрес результата, так как он используется для сбора этих данных.
Интерпретация запроса
The query interpretation feature converts user queries into structured, operator-based queries using schema definitions. This provides precise results even with minimal keywords. See Structure a schema for optimal query interpretation .
Язык элемента
Cloud Search понижает рейтинг элементов, язык которых не совпадает с языком запроса. Установите languageCode в RequestOptions в соответствии с предпочтениями пользователя.
Контекст элемента
Используйте contextAttributes для повышения рейтинга элементов, релевантных контексту запроса, таким как местоположение или отдел.
Популярность товара
Облачный поиск повышает позиции результатов поиска, отображая товары, на которые пользователи часто нажимают в последних запросах. Не изменяйте URL-адреса результатов поиска, так как они используются для отслеживания этих кликов.
Сводная информация о настройках качества поиска
В следующих таблицах представлено краткое описание настроек качества поиска:
Настройки схемы
| Параметр | Расположение | Рекомендация | Подробности |
|---|---|---|---|
ItemContent | ItemContent | Рекомендуется | Актуальность |
RetrievalImportance | RetrievalImportance | Рекомендуется | Актуальность |
FreshnessOptions | FreshnessOptions | Необязательный | Свежесть |
Настройки индексирования
| Параметр | Расположение | Рекомендация | Подробности |
|---|---|---|---|
createTime / updateTime | ItemMetadata | Рекомендуется | Свежесть |
contentLanguage | ItemMetadata | Рекомендуется | Язык элемента |
owners | ItemAcl | Рекомендуется | Право собственности на предмет |
| Пользовательские синонимы | _dictionaryEntry | Рекомендуется | Используйте синонимы |
quality | SearchQualityMetadata | Необязательный | Качество влияния |
| Данные о взаимодействии | interaction | Необязательный | Взаимодействие элементов |
OrderedRanking | OrderedRanking | Необязательный | Тип поля |
Поиск настроек приложения
| Параметр | Расположение | Рекомендация | Подробности |
|---|---|---|---|
| Отключить персонализацию | ScoringConfig | Рекомендуется | Персонализация |
| Важность источника | SourceCrowdingConfig | Необязательный | Исходная конфигурация |
| Переполненность | SourceCrowdingConfig | Необязательный | Исходная конфигурация |