Улучшить качество поиска

Качество поиска относится к качеству результатов поиска с точки зрения ранжирования и запоминаемости, воспринимаемых пользователем.

Ранжирование — это порядок элементов, а полнота — это количество найденных релевантных элементов. Элемент (или документ) — это любой фрагмент цифрового контента, который может индексировать Google Cloud Search, например, документы Microsoft Office, PDF-файлы, строки баз данных или уникальные URL-адреса. Элемент состоит из:

  • Структурированные метаданные
  • Индексируемый контент
  • передние крестообразные связки

Cloud Search использует различные сигналы для получения и ранжирования результатов. Вы можете влиять на эти сигналы с помощью настроек в схеме, содержимом элементов и метаданных, а также в поисковом приложении. Этот документ поможет вам улучшить качество поиска, изменив параметры, влияющие на эти сигналы.

Сводную информацию о настройках см. в разделе «Сводка настроек качества поиска» .

Оценка актуальности влияния

Темальность — это релевантность результатов поиска поисковым запросам. Cloud Search рассчитывает темальность на основе следующих критериев:

  • Важность каждого поискового запроса.
  • Количество совпадений (как часто поисковый запрос встречается в контенте или метаданных).
  • Типы соответствия между поисковыми запросами и индексированными элементами.

Чтобы повлиять на показатель актуальности текстового свойства, определите параметр RetrievalImportance в вашей схеме. Совпадение со свойством с высоким значением RetrievalImportance приводит к более высокому показателю.

Например, если вы храните историю ошибок в программном обеспечении, пользователи, скорее всего, будут искать информацию по имени ошибки. Установите параметр RetrievalImportance для имени на HIGHEST . Для описаний используйте DEFAULT .

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

В HTML-документах теги <title> и <h1> помогают определить важность термина. Если ContentFormat имеет TEXT , ItemContent использует важность DEFAULT . Если же это HTML , важность зависит от свойств HTML.

Влияние на свежесть

Показатель актуальности (Freshation) измеряет, как давно был изменен элемент, используя createTime и updateTime в ItemMetadata . Более старые элементы имеют более низкий рейтинг.

Вы можете влиять на актуальность данных, изменяя значения freshnessProperty и freshnessDuration в FreshnessOptions . Параметр freshnessProperty позволяет использовать пользовательскую дату или метку времени вместо updateTime . Для обработки ошибок можно использовать дату завершения, чтобы элементы с датами, наиболее близкими к текущей, занимали более высокие позиции в рейтинге.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Используйте freshnessDuration , чтобы указать, когда элемент считается устаревшим. Высокое значение, например, 100 лет, нивелирует эффект свежести. Это полезно для статических данных, таких как профили сотрудников. Для новостей используйте небольшое значение, например, три дня.

Качество влияния

Показатель качества измеряет точность и полезность элемента. Укажите значение от 0 до 1, используя SearchQualityMetadata . Более высокие значения повышают рейтинг. Например, вы можете повысить рейтинг документов по льготам, составленных отделом кадров.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Влияние с использованием типа поля

С помощью OrderedRanking вы можете влиять на ранжирование на основе свойств перечислений или целых чисел:

  • NO_ORDER (по умолчанию): Не влияет на ранжирование.
  • ASCENDING : Более высокие значения повышают рейтинг.
  • DESCENDING : более низкие значения повышают рейтинг.

Для определения приоритета ошибки используйте DESCENDING , если HIGH равно 1, а LOW равно 3. Для параметра votes используйте ASCENDING .

Влияние на ранжирование посредством расширения запроса

Расширение поискового запроса использует синонимы и орфографию для улучшения результатов.

Используйте синонимы

Cloud Search использует общедоступный веб-контент в качестве синонимов. Вы также можете определить собственные синонимы для терминологии, специфичной для вашей организации. См. раздел «Определение синонимов» .

Используйте орфографию

Cloud Search предоставляет орфографические подсказки в SpellResult . Он также использует исправления орфографии в качестве синонимов для поиска документов.

Рейтинг влияния через настройки поискового приложения

Приложение для поиска предоставляет контекстную информацию. Вы можете влиять на ранжирование, используя следующие настройки.

Настройте параметры подсчета баллов.

Укажите параметр ScoringConfig , чтобы отключить проверку актуальности или персонализацию . Отключение персонализации снимает бонусы за действия пользователя и за взаимодействие с сайтом . См. раздел «Настройка поиска» .

Настройте конфигурацию источника.

Укажите параметры на уровне источника данных:

  • Важность источника : Элементы из источника HIGH важности занимают более высокое место в рейтинге.
  • Ограничение количества результатов : Ограничивает количество результатов из одного источника (по умолчанию — 3) для обеспечения разнообразия.

Персонализация

Персонализация определяет приоритетность результатов в зависимости от пользователя:

  • Владение предметами : Повышает характеристики предметов, принадлежащих пользователю.
  • Взаимодействие с товарами : Повышает рейтинг товаров, которые пользователь недавно просматривал, редактировал или комментировал.
  • Клики пользователя : Поднимает в результатах поиска элементы, на которые пользователь кликал ранее. Не изменяйте URL-адрес результата, так как он используется для сбора этих данных.

Интерпретация запроса

Функция интерпретации запросов преобразует пользовательские запросы в структурированные запросы на основе операторов с использованием определений схемы. Это обеспечивает точные результаты даже при минимальном количестве ключевых слов. См. раздел «Структурирование схемы для оптимальной интерпретации запросов» .

Язык элемента

Cloud Search понижает рейтинг элементов, язык которых не совпадает с языком запроса. Установите languageCode в RequestOptions в соответствии с предпочтениями пользователя.

Контекст элемента

Используйте contextAttributes для повышения рейтинга элементов, релевантных контексту запроса, таким как местоположение или отдел.

Популярность товара

Облачный поиск повышает позиции результатов поиска, отображая товары, на которые пользователи часто нажимают в последних запросах. Не изменяйте URL-адреса результатов поиска, так как они используются для отслеживания этих кликов.

Сводная информация о настройках качества поиска

В следующих таблицах представлено краткое описание настроек качества поиска:

Настройки схемы

Параметр Расположение Рекомендация Подробности
ItemContent ItemContent Рекомендуется Актуальность
RetrievalImportance RetrievalImportance Рекомендуется Актуальность
FreshnessOptions FreshnessOptions Необязательный Свежесть

Настройки индексирования

Параметр Расположение Рекомендация Подробности
createTime / updateTime ItemMetadata Рекомендуется Свежесть
contentLanguage ItemMetadata Рекомендуется Язык элемента
owners ItemAcl Рекомендуется Право собственности на предмет
Пользовательские синонимы _dictionaryEntry Рекомендуется Используйте синонимы
quality SearchQualityMetadata Необязательный Качество влияния
Данные о взаимодействии interaction Необязательный Взаимодействие элементов
OrderedRanking OrderedRanking Необязательный Тип поля

Поиск настроек приложения

Параметр Расположение Рекомендация Подробности
Отключить персонализацию ScoringConfig Рекомендуется Персонализация
Важность источника SourceCrowdingConfig Необязательный Исходная конфигурация
Переполненность SourceCrowdingConfig Необязательный Исходная конфигурация

Следующие шаги

  1. Создайте схему для оптимальной интерпретации запросов .
  2. Дайте определение синонимам .