Качество поиска относится к качеству результатов поиска с точки зрения ранжирования и запоминаемости, воспринимаемых пользователем.
Ранжирование — это порядок элементов, а полнота — это количество найденных релевантных элементов. Элемент (или документ) — это любой фрагмент цифрового контента, который может индексировать Google Cloud Search, например, документы Microsoft Office, PDF-файлы, строки баз данных или уникальные URL-адреса. Элемент состоит из:
- Структурированные метаданные
- Индексируемый контент
- передние крестообразные связки
Cloud Search использует различные сигналы для получения и ранжирования результатов. Вы можете влиять на эти сигналы с помощью настроек в схеме, содержимом элементов и метаданных, а также в поисковом приложении. Этот документ поможет вам улучшить качество поиска, изменив параметры, влияющие на эти сигналы.
Сводную информацию о настройках см. в разделе «Сводка настроек качества поиска» .
Оценка актуальности влияния
Темальность — это релевантность результатов поиска поисковым запросам. Cloud Search рассчитывает темальность на основе следующих критериев:
- Важность каждого поискового запроса.
- Количество совпадений (как часто поисковый запрос встречается в контенте или метаданных).
- Типы соответствия между поисковыми запросами и индексированными элементами.
Чтобы повлиять на показатель актуальности текстового свойства, определите параметр RetrievalImportance в вашей схеме. Совпадение со свойством с высоким значением RetrievalImportance приводит к более высокому показателю.
Например, если вы храните историю ошибок в программном обеспечении, пользователи, скорее всего, будут искать информацию по имени ошибки. Установите параметр RetrievalImportance для имени на HIGHEST . Для описаний используйте DEFAULT .
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
В HTML-документах теги <title> и <h1> помогают определить важность термина. Если ContentFormat имеет TEXT , ItemContent использует важность DEFAULT . Если же это HTML , важность зависит от свойств HTML.
Влияние на свежесть
Показатель актуальности (Freshation) измеряет, как давно был изменен элемент, используя createTime и updateTime в ItemMetadata . Более старые элементы имеют более низкий рейтинг.
Вы можете влиять на актуальность данных, изменяя значения freshnessProperty и freshnessDuration в FreshnessOptions . Параметр freshnessProperty позволяет использовать пользовательскую дату или метку времени вместо updateTime . Для обработки ошибок можно использовать дату завершения, чтобы элементы с датами, наиболее близкими к текущей, занимали более высокие позиции в рейтинге.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Используйте freshnessDuration , чтобы указать, когда элемент считается устаревшим. Высокое значение, например, 100 лет, нивелирует эффект свежести. Это полезно для статических данных, таких как профили сотрудников. Для новостей используйте небольшое значение, например, три дня.
Качество влияния
Показатель качества измеряет точность и полезность элемента. Укажите значение от 0 до 1, используя SearchQualityMetadata . Более высокие значения повышают рейтинг. Например, вы можете повысить рейтинг документов по льготам, составленных отделом кадров.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Влияние с использованием типа поля
С помощью OrderedRanking вы можете влиять на ранжирование на основе свойств перечислений или целых чисел:
-
NO_ORDER(по умолчанию): Не влияет на ранжирование. -
ASCENDING: Более высокие значения повышают рейтинг. -
DESCENDING: более низкие значения повышают рейтинг.
Для определения приоритета ошибки используйте DESCENDING , если HIGH равно 1, а LOW равно 3. Для параметра votes используйте ASCENDING .
Влияние на ранжирование посредством расширения запроса
Расширение поискового запроса использует синонимы и орфографию для улучшения результатов.
Используйте синонимы
Cloud Search использует общедоступный веб-контент в качестве синонимов. Вы также можете определить собственные синонимы для терминологии, специфичной для вашей организации. См. раздел «Определение синонимов» .
Используйте орфографию
Cloud Search предоставляет орфографические подсказки в SpellResult . Он также использует исправления орфографии в качестве синонимов для поиска документов.
Рейтинг влияния через настройки поискового приложения
Приложение для поиска предоставляет контекстную информацию. Вы можете влиять на ранжирование, используя следующие настройки.
Настройте параметры подсчета баллов.
Укажите параметр ScoringConfig , чтобы отключить проверку актуальности или персонализацию . Отключение персонализации снимает бонусы за действия пользователя и за взаимодействие с сайтом . См. раздел «Настройка поиска» .
Настройте конфигурацию источника.
Укажите параметры на уровне источника данных:
- Важность источника : Элементы из источника
HIGHважности занимают более высокое место в рейтинге. - Ограничение количества результатов : Ограничивает количество результатов из одного источника (по умолчанию — 3) для обеспечения разнообразия.
Персонализация
Персонализация определяет приоритетность результатов в зависимости от пользователя:
- Владение предметами : Повышает характеристики предметов, принадлежащих пользователю.
- Взаимодействие с товарами : Повышает рейтинг товаров, которые пользователь недавно просматривал, редактировал или комментировал.
- Клики пользователя : Поднимает в результатах поиска элементы, на которые пользователь кликал ранее. Не изменяйте URL-адрес результата, так как он используется для сбора этих данных.
Интерпретация запроса
Функция интерпретации запросов преобразует пользовательские запросы в структурированные запросы на основе операторов с использованием определений схемы. Это обеспечивает точные результаты даже при минимальном количестве ключевых слов. См. раздел «Структурирование схемы для оптимальной интерпретации запросов» .
Язык элемента
Cloud Search понижает рейтинг элементов, язык которых не совпадает с языком запроса. Установите languageCode в RequestOptions в соответствии с предпочтениями пользователя.
Контекст элемента
Используйте contextAttributes для повышения рейтинга элементов, релевантных контексту запроса, таким как местоположение или отдел.
Популярность товара
Облачный поиск повышает позиции результатов поиска, отображая товары, на которые пользователи часто нажимают в последних запросах. Не изменяйте URL-адреса результатов поиска, так как они используются для отслеживания этих кликов.
Сводная информация о настройках качества поиска
В следующих таблицах представлено краткое описание настроек качества поиска:
Настройки схемы
| Параметр | Расположение | Рекомендация | Подробности |
|---|---|---|---|
ItemContent | ItemContent | Рекомендуется | Актуальность |
RetrievalImportance | RetrievalImportance | Рекомендуется | Актуальность |
FreshnessOptions | FreshnessOptions | Необязательный | Свежесть |
Настройки индексирования
| Параметр | Расположение | Рекомендация | Подробности |
|---|---|---|---|
createTime / updateTime | ItemMetadata | Рекомендуется | Свежесть |
contentLanguage | ItemMetadata | Рекомендуется | Язык элемента |
owners | ItemAcl | Рекомендуется | Право собственности на предмет |
| Пользовательские синонимы | _dictionaryEntry | Рекомендуется | Используйте синонимы |
quality | SearchQualityMetadata | Необязательный | Качество влияния |
| Данные о взаимодействии | interaction | Необязательный | Взаимодействие элементов |
OrderedRanking | OrderedRanking | Необязательный | Тип поля |
Поиск настроек приложения
| Параметр | Расположение | Рекомендация | Подробности |
|---|---|---|---|
| Отключить персонализацию | ScoringConfig | Рекомендуется | Персонализация |
| Важность источника | SourceCrowdingConfig | Необязательный | Исходная конфигурация |
| Переполненность | SourceCrowdingConfig | Необязательный | Исходная конфигурация |