La calidad de búsqueda hace referencia a la calidad de los resultados de la búsqueda en términos de clasificación y recuperación, tal como la percibe el usuario.
La clasificación es el orden de los elementos, y la recuperación es la cantidad de elementos relevantes recuperados. Un elemento (o documento) es cualquier pieza de contenido digital que Google Cloud Search puede indexar, como documentos de Microsoft Office, archivos PDF, filas de bases de datos o URLs únicas. Un elemento consta de lo siguiente:
- Metadatos estructurados
- Contenido indexable
- LCA
Cloud Search utiliza varios indicadores para recuperar y clasificar los resultados. Puedes influir en estos indicadores a través de la configuración del esquema, el contenido y los metadatos del elemento, y la aplicación de búsqueda. Este documento te ayuda a mejorar la calidad de la búsqueda mediante la modificación de estos factores de influencia en los indicadores.
Para obtener un resumen de la configuración, consulta el Resumen de la configuración de la calidad de la búsqueda.
Influir en la puntuación de novedad
Novedad hace referencia a la relevancia de un resultado de la búsqueda respecto de los términos de la consulta. Cloud Search calcula la novedad en función de lo siguiente:
- La importancia de cada término de la consulta
- La cantidad de hits (la frecuencia con la que aparece un término de la consulta en el contenido o los metadatos)
- Los tipos de concordancia entre los términos de la consulta y los elementos indexados
Para influir en la puntuación de novedad de una propiedad de texto, define la
RetrievalImportance
en tu esquema. Una concordancia en una propiedad con RetrievalImportance alta da como resultado una puntuación más alta.
Por ejemplo, si almacenas el historial de errores de software, es probable que los usuarios realicen búsquedas por nombre de error.
Establece la RetrievalImportance para el nombre en HIGHEST. Para las descripciones, usa DEFAULT.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
En el caso de los documentos HTML, las etiquetas como <title> y <h1> ayudan a determinar la importancia de los términos. Si ContentFormat
es TEXT, ItemContent
usa la importancia DEFAULT. Si es HTML, la importancia depende de las propiedades HTML.
Influir en la actualidad
La actualidad mide qué tan recientemente se modificó un elemento, usando createTime y
updateTime en
ItemMetadata.
Los elementos más antiguos tienen una clasificación más baja.
Puedes influir en la actualidad ajustando freshnessProperty y
freshnessDuration en
FreshnessOptions.
La freshnessProperty te permite usar una fecha o marca de tiempo personalizada en lugar de updateTime. En el caso de los errores, puedes usar una fecha de vencimiento para que los elementos con fechas más cercanas a la actual tengan una clasificación más alta.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Usa freshnessDuration para especificar cuándo se considera desactualizado un elemento. Un valor alto, como 100 años, anula el efecto de actualidad. Esto es útil para datos estáticos, como perfiles de empleados. En el caso de las noticias, usa un valor pequeño, como tres días.
Influir en la calidad
La calidad mide la exactitud y utilidad de un elemento. Especifica un valor entre 0
y 1 con
SearchQualityMetadata.
Los valores más altos mejoran la clasificación. Por ejemplo, puedes mejorar los documentos de beneficios creados por el departamento de RR.HH.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Influir mediante el tipo de campo
Puedes influir en la clasificación según las propiedades de enumeración o de número entero con
OrderedRanking:
NO_ORDER(predeterminado): No tiene ningún efecto en la clasificación.ASCENDING: Los valores más altos mejoran la clasificación.DESCENDING: Los valores más bajos mejoran la clasificación.
En el caso de la prioridad de errores, usa DESCENDING si HIGH es 1 y LOW es 3. En el caso de una propiedad votes, usa ASCENDING.
Influir en la clasificación a través de la búsqueda expandida
La búsqueda expandida usa sinónimos y ortografía para mejorar los resultados.
Utilizar sinónimos
Cloud Search usa contenido web público para los sinónimos. También puedes definir sinónimos personalizados para la terminología específica de la organización. Consulta Define sinónimos.
Usar la ortografía
Cloud Search proporciona sugerencias de ortografía en
SpellResult.
También usa correcciones de ortografía como sinónimos para encontrar documentos.
Influir en la clasificación a través de la configuración de la aplicación de búsqueda
Una aplicación de búsqueda proporciona información contextual. Puedes influir en la clasificación con la siguiente configuración.
Ajustar la configuración de la puntuación
Especifica un
ScoringConfig
para inhabilitar la actualidad o la personalización.
Si se inhabilita la personalización, se quitan las mejoras del propietario y de la interacción. Consulta
Personaliza la experiencia de búsqueda.
Ajustar la configuración de la fuente
Especifica la configuración a nivel de la fuente de datos:
- Importancia de la fuente: Los elementos de una fuente de importancia
HIGHtienen una clasificación más alta. - Multiplicidad: Limita los resultados de una sola fuente (el valor predeterminado es 3) para garantizar la diversidad.
Personalización
La personalización prioriza los resultados según el usuario:
- Propiedad del elemento: Mejora los elementos que pertenecen al usuario.
- Interacción del elemento: Mejora los elementos que el usuario vio, editó o comentó recientemente.
- Clics del usuario: Mejora los elementos en los que el usuario hizo clic anteriormente. No modifiques la URL del resultado, ya que se usa para recopilar estos datos.
Interpretación de una consulta
La función de interpretación de consultas convierte las consultas de los usuarios en consultas estructuradas basadas en operadores mediante definiciones de esquema. Esto proporciona resultados precisos incluso con palabras clave mínimas. Consulta Diseña la estructura de un esquema para optimizar la interpretación de consultas.
Idioma del elemento
Cloud Search reduce la clasificación de los elementos cuyo idioma no coincide con el idioma de la consulta. Establece languageCode en
RequestOptions
según la preferencia del usuario.
Contexto del elemento
Usa
contextAttributes
para aumentar la clasificación de los elementos relevantes para el contexto de la consulta, como la ubicación o el
departamento.
Popularidad del elemento
Cloud Search mejora los elementos en los que los usuarios hacen clic con frecuencia en las consultas recientes. No modifiques las URLs de los resultados de la búsqueda, ya que se usan para hacer un seguimiento de estos clics.
Resumen de la configuración de la calidad de la búsqueda
En las siguientes tablas, se proporciona un resumen de la configuración de la calidad de la búsqueda:
Configuración de esquema
| Configuración | Ubicación | Recomendación | Detalles |
|---|---|---|---|
ItemContent |
ItemContent |
Recomendado | Novedad |
RetrievalImportance |
RetrievalImportance |
Recomendado | Novedad |
FreshnessOptions |
FreshnessOptions |
Opcional | Actualidad |
Configuración de indexación
| Configuración | Ubicación | Recomendación | Detalles |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
Recomendado | Actualidad |
contentLanguage |
ItemMetadata |
Recomendado | Idioma del elemento |
owners |
ItemAcl |
Recomendado | Propiedad del elemento |
| Sinónimos personalizados | _dictionaryEntry |
Recomendado | Utilizar sinónimos |
quality |
SearchQualityMetadata |
Opcional | Influir en la calidad |
| Datos de interacción | interaction |
Opcional | Interacción del elemento |
OrderedRanking |
OrderedRanking |
Opcional | Tipo de campo |
Configuración de la aplicación de búsqueda
| Configuración | Ubicación | Recomendación | Detalles |
|---|---|---|---|
| Inhabilitar la personalización | ScoringConfig |
Recomendado | Personalización |
| Importancia de la fuente | SourceCrowdingConfig |
Opcional | Configuración de la fuente |
| Multiplicidad | SourceCrowdingConfig |
Opcional | Configuración de la fuente |