Mejorar la calidad de búsqueda

La calidad de búsqueda hace referencia a la calidad de los resultados de la búsqueda en términos de clasificación y recuperación, tal como la percibe el usuario.

La clasificación es el orden de los elementos, y la recuperación es la cantidad de elementos relevantes recuperados. Un elemento (o documento) es cualquier pieza de contenido digital que Google Cloud Search puede indexar, como documentos de Microsoft Office, archivos PDF, filas de bases de datos o URLs únicas. Un elemento consta de lo siguiente:

  • Metadatos estructurados
  • Contenido indexable
  • LCA

Cloud Search utiliza varios indicadores para recuperar y clasificar los resultados. Puedes influir en estos indicadores a través de la configuración del esquema, el contenido y los metadatos del elemento, y la aplicación de búsqueda. Este documento te ayuda a mejorar la calidad de la búsqueda mediante la modificación de estos factores de influencia en los indicadores.

Para obtener un resumen de la configuración, consulta el Resumen de la configuración de la calidad de la búsqueda.

Influir en la puntuación de novedad

Novedad hace referencia a la relevancia de un resultado de la búsqueda respecto de los términos de la consulta. Cloud Search calcula la novedad en función de lo siguiente:

  • La importancia de cada término de la consulta
  • La cantidad de hits (la frecuencia con la que aparece un término de la consulta en el contenido o los metadatos)
  • Los tipos de concordancia entre los términos de la consulta y los elementos indexados

Para influir en la puntuación de novedad de una propiedad de texto, define la RetrievalImportance en tu esquema. Una concordancia en una propiedad con RetrievalImportance alta da como resultado una puntuación más alta.

Por ejemplo, si almacenas el historial de errores de software, es probable que los usuarios realicen búsquedas por nombre de error. Establece la RetrievalImportance para el nombre en HIGHEST. Para las descripciones, usa DEFAULT.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

En el caso de los documentos HTML, las etiquetas como <title> y <h1> ayudan a determinar la importancia de los términos. Si ContentFormat es TEXT, ItemContent usa la importancia DEFAULT. Si es HTML, la importancia depende de las propiedades HTML.

Influir en la actualidad

La actualidad mide qué tan recientemente se modificó un elemento, usando createTime y updateTime en ItemMetadata. Los elementos más antiguos tienen una clasificación más baja.

Puedes influir en la actualidad ajustando freshnessProperty y freshnessDuration en FreshnessOptions. La freshnessProperty te permite usar una fecha o marca de tiempo personalizada en lugar de updateTime. En el caso de los errores, puedes usar una fecha de vencimiento para que los elementos con fechas más cercanas a la actual tengan una clasificación más alta.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Usa freshnessDuration para especificar cuándo se considera desactualizado un elemento. Un valor alto, como 100 años, anula el efecto de actualidad. Esto es útil para datos estáticos, como perfiles de empleados. En el caso de las noticias, usa un valor pequeño, como tres días.

Influir en la calidad

La calidad mide la exactitud y utilidad de un elemento. Especifica un valor entre 0 y 1 con SearchQualityMetadata. Los valores más altos mejoran la clasificación. Por ejemplo, puedes mejorar los documentos de beneficios creados por el departamento de RR.HH.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Influir mediante el tipo de campo

Puedes influir en la clasificación según las propiedades de enumeración o de número entero con OrderedRanking:

  • NO_ORDER (predeterminado): No tiene ningún efecto en la clasificación.
  • ASCENDING: Los valores más altos mejoran la clasificación.
  • DESCENDING: Los valores más bajos mejoran la clasificación.

En el caso de la prioridad de errores, usa DESCENDING si HIGH es 1 y LOW es 3. En el caso de una propiedad votes, usa ASCENDING.

Influir en la clasificación a través de la búsqueda expandida

La búsqueda expandida usa sinónimos y ortografía para mejorar los resultados.

Utilizar sinónimos

Cloud Search usa contenido web público para los sinónimos. También puedes definir sinónimos personalizados para la terminología específica de la organización. Consulta Define sinónimos.

Usar la ortografía

Cloud Search proporciona sugerencias de ortografía en SpellResult. También usa correcciones de ortografía como sinónimos para encontrar documentos.

Influir en la clasificación a través de la configuración de la aplicación de búsqueda

Una aplicación de búsqueda proporciona información contextual. Puedes influir en la clasificación con la siguiente configuración.

Ajustar la configuración de la puntuación

Especifica un ScoringConfig para inhabilitar la actualidad o la personalización. Si se inhabilita la personalización, se quitan las mejoras del propietario y de la interacción. Consulta Personaliza la experiencia de búsqueda.

Ajustar la configuración de la fuente

Especifica la configuración a nivel de la fuente de datos:

  • Importancia de la fuente: Los elementos de una fuente de importancia HIGH tienen una clasificación más alta.
  • Multiplicidad: Limita los resultados de una sola fuente (el valor predeterminado es 3) para garantizar la diversidad.

Personalización

La personalización prioriza los resultados según el usuario:

  • Propiedad del elemento: Mejora los elementos que pertenecen al usuario.
  • Interacción del elemento: Mejora los elementos que el usuario vio, editó o comentó recientemente.
  • Clics del usuario: Mejora los elementos en los que el usuario hizo clic anteriormente. No modifiques la URL del resultado, ya que se usa para recopilar estos datos.

Interpretación de una consulta

La función de interpretación de consultas convierte las consultas de los usuarios en consultas estructuradas basadas en operadores mediante definiciones de esquema. Esto proporciona resultados precisos incluso con palabras clave mínimas. Consulta Diseña la estructura de un esquema para optimizar la interpretación de consultas.

Idioma del elemento

Cloud Search reduce la clasificación de los elementos cuyo idioma no coincide con el idioma de la consulta. Establece languageCode en RequestOptions según la preferencia del usuario.

Contexto del elemento

Usa contextAttributes para aumentar la clasificación de los elementos relevantes para el contexto de la consulta, como la ubicación o el departamento.

Popularidad del elemento

Cloud Search mejora los elementos en los que los usuarios hacen clic con frecuencia en las consultas recientes. No modifiques las URLs de los resultados de la búsqueda, ya que se usan para hacer un seguimiento de estos clics.

Resumen de la configuración de la calidad de la búsqueda

En las siguientes tablas, se proporciona un resumen de la configuración de la calidad de la búsqueda:

Configuración de esquema

Configuración Ubicación Recomendación Detalles
ItemContent ItemContent Recomendado Novedad
RetrievalImportance RetrievalImportance Recomendado Novedad
FreshnessOptions FreshnessOptions Opcional Actualidad

Configuración de indexación

Configuración Ubicación Recomendación Detalles
createTime/updateTime ItemMetadata Recomendado Actualidad
contentLanguage ItemMetadata Recomendado Idioma del elemento
owners ItemAcl Recomendado Propiedad del elemento
Sinónimos personalizados _dictionaryEntry Recomendado Utilizar sinónimos
quality SearchQualityMetadata Opcional Influir en la calidad
Datos de interacción interaction Opcional Interacción del elemento
OrderedRanking OrderedRanking Opcional Tipo de campo

Configuración de la aplicación de búsqueda

Configuración Ubicación Recomendación Detalles
Inhabilitar la personalización ScoringConfig Recomendado Personalización
Importancia de la fuente SourceCrowdingConfig Opcional Configuración de la fuente
Multiplicidad SourceCrowdingConfig Opcional Configuración de la fuente

Próximos pasos

  1. Diseña la estructura de un esquema para optimizar la interpretación de consultas.
  2. Define sinónimos.