La calidad de búsqueda hace referencia a la calidad de los resultados de la búsqueda en términos de clasificación y recuperación, tal como la percibe el usuario.
La clasificación es el orden de los elementos, y la recuperación es la cantidad de elementos relevantes recuperados. Un elemento (o documento) es cualquier pieza de contenido digital que Google Cloud Search puede indexar, como documentos de Microsoft Office, archivos PDF, filas de bases de datos o URLs únicas. Un elemento consta de lo siguiente:
- Metadatos estructurados
- Contenido indexable
- LCA
Cloud Search utiliza varios indicadores para recuperar y clasificar los resultados. Puedes influir en estos indicadores a través de la configuración del esquema, el contenido y los metadatos del elemento, y la aplicación de búsqueda. Este documento te ayuda a mejorar la calidad de la búsqueda modificando estos factores de influencia en los indicadores.
Para obtener un resumen de la configuración, consulta el Resumen de la configuración de la calidad de búsqueda.
Influir en la puntuación de novedad
La novedad es la relevancia de un resultado de la búsqueda respecto de los términos de la búsqueda. Cloud Search calcula la relevancia según los siguientes factores:
- La importancia de cada término de la consulta
- La cantidad de hits (con qué frecuencia aparece un término de búsqueda en el contenido o los metadatos)
- Son los tipos de concordancia entre los términos de búsqueda y los elementos indexados.
Para influir en la puntuación de novedad de una propiedad de texto, define RetrievalImportance en tu esquema. Una coincidencia en una propiedad con alta RetrievalImportance da como resultado una puntuación más alta.
Por ejemplo, si almacenas el historial de errores de software, es probable que los usuarios realicen búsquedas por nombre de error.
Establece el RetrievalImportance para el nombre en HIGHEST. Para las descripciones, usa DEFAULT.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": { "importance": "HIGHEST" }
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": { "importance": "DEFAULT" }
}
}
]
}
]
}
En el caso de los documentos HTML, las etiquetas como <title> y <h1> ayudan a determinar la importancia de los términos. Si ContentFormat es TEXT, ItemContent usa la importancia DEFAULT. Si es HTML, la importancia depende de las propiedades HTML.
Influir en la actualidad
La actualidad mide qué tan recientemente se modificó un elemento, con createTime y updateTime en ItemMetadata.
Los elementos más antiguos tienen una clasificación más baja.
Puedes influir en la actualidad ajustando freshnessProperty y freshnessDuration en FreshnessOptions.
El freshnessProperty te permite usar una fecha o una marca de tiempo personalizadas en lugar de updateTime. En el caso de los errores, puedes usar una fecha de vencimiento para que los elementos con fechas más cercanas a la actual se clasifiquen más alto.
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": { "freshnessProperty": "duedate" }
}
}
]
}
Usa freshnessDuration para especificar cuándo se considera que un elemento está desactualizado. Un valor alto, como 100 años, anula el efecto de la actualidad. Esto es útil para datos estáticos, como los perfiles de empleados. Para las noticias, usa un valor pequeño, como tres días.
Influir en la calidad
La calidad mide la precisión y la utilidad de un elemento. Especifica un valor entre 0 y 1 con SearchQualityMetadata.
Los valores más altos mejoran la clasificación. Por ejemplo, podrías potenciar los documentos de beneficios creados por RR.HH.
{
"metadata": {
"searchQualityMetadata": { "quality": 1.0 }
}
}
Influir mediante el tipo de campo
Puedes influir en la clasificación según las propiedades de enumeración o números enteros con OrderedRanking:
NO_ORDER(predeterminado): No afecta la clasificación.ASCENDING: Los valores más altos mejoran la clasificación.DESCENDING: Los valores más bajos mejoran la clasificación.
Para la prioridad de errores, usa DESCENDING si HIGH es 1 y LOW es 3. Para una propiedad votes, usa ASCENDING.
Influir en la clasificación a través de la búsqueda expandida
La búsqueda expandida usa sinónimos y ortografía para mejorar los resultados.
Utilizar sinónimos
Cloud Search utiliza contenido web público para los sinónimos. También puedes definir sinónimos personalizados para la terminología específica de la organización. Consulta Define sinónimos.
Usa la ortografía
Cloud Search proporciona sugerencias de ortografía en SpellResult.
También usa correcciones ortográficas como sinónimos para encontrar documentos.
Cómo influir en la clasificación a través de la configuración de la aplicación de búsqueda
Una aplicación de búsqueda proporciona información contextual. Puedes influir en la clasificación con los siguientes parámetros de configuración.
Ajustar la configuración de la puntuación
Especifica un ScoringConfig para inhabilitar la actualidad o la personalización.
Si se inhabilita la personalización, se quitan las mejoras del propietario y de la interacción. Consulta Cómo personalizar la experiencia de búsqueda.
Ajustar la configuración de la fuente
Especifica la configuración a nivel de la fuente de datos:
- Importancia de la fuente: Los elementos de una fuente de importancia
HIGHse clasifican más alto. - Acumulación: Limita los resultados de una sola fuente (el valor predeterminado es 3) para garantizar la diversidad.
Personalización
La personalización prioriza los resultados según el usuario:
- Propiedad del elemento: Mejora la clasificación de los elementos que pertenecen al usuario.
- Interacción del elemento: Aumenta la clasificación de los elementos que el usuario vio, editó o comentó recientemente.
- Clics del usuario: Potencia los elementos en los que el usuario hizo clic anteriormente. No modifiques la URL del resultado, ya que se usa para recopilar estos datos.
Interpretación de una consulta
La función de interpretación de consultas convierte las búsquedas de los usuarios en búsquedas estructuradas basadas en operadores a través de definiciones de esquemas. Esto proporciona resultados precisos incluso con una cantidad mínima de palabras clave. Consulta Diseña la estructura de un esquema para optimizar la interpretación de consultas.
Idioma del elemento
Cloud Search reduce la clasificación de los elementos cuyo idioma no coincide con el idioma de la búsqueda. Establece languageCode en RequestOptions según la preferencia del usuario.
Contexto del elemento
Usa contextAttributes para aumentar la clasificación de los elementos relevantes para el contexto de la búsqueda, como la ubicación o el departamento.
Popularidad del elemento
Cloud Search potencia los elementos en los que los usuarios hacen clic con frecuencia en las búsquedas recientes. No modifiques las URLs de los resultados de la búsqueda, ya que se usan para hacer un seguimiento de estos clics.
Resumen de la configuración de la calidad de la búsqueda
En las siguientes tablas, se proporciona un resumen de la configuración de calidad de la búsqueda:
Configuración de esquema
| Configuración | Ubicación | Recomendación | Detalles |
|---|---|---|---|
ItemContent |
ItemContent |
Recomendado | Topicalidad |
RetrievalImportance |
RetrievalImportance |
Recomendado | Topicalidad |
FreshnessOptions |
FreshnessOptions |
Opcional | Actualidad |
Configuración de indexación
| Configuración | Ubicación | Recomendación | Detalles |
|---|---|---|---|
createTime/updateTime |
ItemMetadata |
Recomendado | Actualidad |
contentLanguage |
ItemMetadata |
Recomendado | Idioma del elemento |
owners |
ItemAcl |
Recomendado | Propiedad del elemento |
| Sinónimos personalizados | _dictionaryEntry |
Recomendado | Usa sinónimos |
quality |
SearchQualityMetadata |
Opcional | Influir en la calidad |
| Datos de interacción | interaction |
Opcional | Interacción con el elemento |
OrderedRanking |
OrderedRanking |
Opcional | Tipo de campo |
Configuración de la aplicación de búsqueda
| Configuración | Ubicación | Recomendación | Detalles |
|---|---|---|---|
| Inhabilitar la personalización | ScoringConfig |
Recomendado | Personalización |
| Importancia de la fuente | SourceCrowdingConfig |
Opcional | Configuración de la fuente |
| Multiplicidad | SourceCrowdingConfig |
Opcional | Configuración de la fuente |