검색 품질 향상

검색 품질 이란 검색을 수행하는 사용자가 인식하는 순위 및 재현율을 기준으로 측정한 검색결과의 품질입니다.

순위 는 항목의 순서이고 재현율 은 검색된 관련 항목의 수입니다. 항목 (또는 문서)은 Microsoft Office 문서, PDF 파일, 데이터베이스 행, 고유 URL과 같이 Google Cloud Search가 색인 생성할 수 있는 모든 디지털 콘텐츠 조각입니다. 항목은 다음으로 구성됩니다.

  • 구조화된 메타데이터
  • 색인 생성이 가능한 콘텐츠
  • ACL

Cloud Search는 다양한 신호를 사용하여 결과를 가져오고 순위를 매깁니다. 스키마, 항목 콘텐츠 및 메타데이터, 검색 애플리케이션의 설정을 통해 이러한 신호에 영향을 줄 수 있습니다. 이 문서는 이러한 신호 영향 요소를 수정하여 검색 품질을 개선하는 데 도움이 됩니다.

설정 요약은 검색 품질 설정 요약을 참고하세요.

적합성 점수에 영향 주기

적합성 이란 검색결과와 검색어의 관련성을 나타냅니다. Cloud Search는 다음을 기준으로 적합성을 계산합니다.

  • 각 검색어의 중요도
  • 적중 횟수 (콘텐츠 또는 메타데이터에서 검색어가 등장하는 빈도)
  • 검색어와 색인 생성된 항목 간의 검색 유형

텍스트 속성의 적합성 점수에 영향을 주려면 스키마에서 RetrievalImportance 를 정의합니다. RetrievalImportance가 높은 속성과 일치하면 점수가 높아집니다.

예를 들어 소프트웨어 버그 기록을 저장하는 경우 사용자는 버그 이름으로 검색할 가능성이 높습니다. 이름의 RetrievalImportanceHIGHEST로 설정합니다. 설명에는 DEFAULT를 사용합니다.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

HTML 문서의 경우 <title><h1> 등의 태그를 사용하여 검색어 중요도를 판단합니다. ContentFormatTEXT인 경우 ItemContentDEFAULT 중요도를 사용합니다. HTML인 경우 중요도는 HTML 속성에 따라 달라집니다.

최신성에 영향 주기

최신성createTimeupdateTime을(를) 사용하여 항목이 수정된 시점을 측정합니다. ItemMetadata 오래된 항목의 순위가 낮습니다.

FreshnessOptions에서 freshnessPropertyfreshnessDuration을 조정하여 최신성에 영향을 줄 수 있습니다. freshnessProperty를 사용하면 updateTime 대신 맞춤 날짜 또는 타임스탬프를 사용할 수 있습니다. 버그의 경우 기한을 사용하여 현재 날짜와 가장 가까운 항목의 순위를 높일 수 있습니다.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

freshnessDuration을 사용하여 항목이 만료된 것으로 간주할 시점을 지정합니다. 100년과 같이 높은 값을 지정하면 최신성 효과가 무효화됩니다. 이는 직원 프로필과 같은 정적 데이터에 유용합니다. 뉴스에는 3일과 같은 작은 값을 사용합니다.

품질에 영향 주기

품질 은 항목의 정확성과 유용성을 측정합니다. SearchQualityMetadata를 사용하여 0 에서 1 사이의 값을 지정합니다. 값이 높을수록 순위가 높아집니다. 예를 들어 인사팀에서 작성한 혜택 문서를 순위 상승시킬 수 있습니다.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

필드 유형 사용에 영향 주기

`OrderedRanking`을 사용하여 열거형 또는 정수 속성을 기반으로 순위에 영향을 줄 수 있습니다. OrderedRanking

  • NO_ORDER (기본값): 순위에 영향을 주지 않습니다.
  • ASCENDING: 값이 높을수록 순위가 높아집니다.
  • DESCENDING: 값이 낮을수록 순위가 높아집니다.

버그 우선순위의 경우 HIGH가 1이고 LOW가 3이면 DESCENDING을 사용합니다. votes 속성의 경우 ASCENDING을 사용합니다.

검색어 확장을 통해 순위에 영향 주기

검색어 확장 은 동의어와 맞춤법을 사용하여 결과를 개선합니다.

동의어 사용

Cloud Search는 동의어에 공개 웹 콘텐츠를 사용합니다. 조직별 용어에 맞춤 동의어를 정의할 수도 있습니다. 동의어 정의를 참고하세요.

맞춤법 사용

Cloud Search는 SpellResult에서 맞춤법을 추천합니다. 또한 맞춤법 교정을 동의어로 사용하여 문서를 찾습니다.

검색 애플리케이션 설정을 통해 순위에 영향 주기

검색 애플리케이션은 상황 정보를 제공합니다. 다음 설정을 사용하여 순위에 영향을 줄 수 있습니다.

스코어링 구성 조정

ScoringConfig 를 지정하여 최신성 또는 맞춤설정을 사용 중지합니다. 맞춤설정을 사용 중지하면 소유자상호작용 순위 상승이 삭제됩니다. 검색 환경 맞춤설정을 참고하세요.

소스 구성 조정

데이터 소스 수준 설정을 지정합니다.

  • 소스 중요도: 중요도가 HIGH인 소스의 항목이 순위가 높습니다.
  • 크라우딩: 다양성을 보장하기 위해 단일 소스의 결과를 제한합니다 (기본값은 3).

맞춤설정

맞춤설정은 사용자를 기준으로 결과의 우선순위를 지정합니다.

  • 항목 소유권: 사용자가 소유한 항목의 순위를 높입니다.
  • 항목 상호작용: 사용자가 최근에 조회, 수정 또는 댓글을 작성한 항목의 순위를 높입니다.
  • 사용자 클릭수: 사용자가 이전에 클릭한 항목의 순위를 높입니다. 결과 URL은 이 데이터를 수집하는 데 사용되므로 수정하지 마세요.

검색어 해석

검색어 해석 기능은 스키마 정의를 사용하여 사용자 검색어를 구조화된 연산자 기반 검색어로 변환합니다. 이를 통해 최소한의 키워드로도 정확한 결과를 얻을 수 있습니다. 검색어 해석 최적화를 위한 스키마 구조화를 참고하세요.

항목 언어

Cloud Search는 언어가 검색어 언어와 일치하지 않는 항목의 순위를 내립니다. 사용자 환경설정으로 languageCodeRequestOptions 설정합니다.

항목 컨텍스트

contextAttributes 를 사용하여 위치 또는 부서와 같은 검색어 컨텍스트와 관련된 항목의 순위를 높입니다.

항목 인기도

Cloud Search는 사용자가 최근 검색에서 자주 클릭하는 항목의 순위를 높입니다. 검색 결과 URL은 이러한 클릭수를 추적하는 데 사용되므로 수정하지 마세요.

검색 품질 설정 요약

다음 표에서는 검색 품질 설정을 요약해서 보여줍니다.

스키마 설정

설정 위치 권장사항 세부정보
ItemContent ItemContent 권장 적합성
RetrievalImportance RetrievalImportance 권장 적합성
FreshnessOptions FreshnessOptions 선택사항 최신성

색인 생성 설정

설정 위치 권장사항 세부정보
createTime/updateTime ItemMetadata 권장 최신성
contentLanguage ItemMetadata 권장 항목 언어
owners ItemAcl 권장 항목 소유권
커스텀 동의어 _dictionaryEntry 권장 동의어 사용
quality SearchQualityMetadata 선택사항 품질에 영향 주기
상호작용 데이터 interaction 선택사항 항목 상호작용
OrderedRanking OrderedRanking 선택사항 필드 유형

검색 애플리케이션 설정

설정 위치 권장사항 세부정보
맞춤설정 사용 안함 ScoringConfig 권장 맞춤설정
소스 중요도 SourceCrowdingConfig 선택사항 소스 구성
크라우딩 SourceCrowdingConfig 선택사항 소스 구성

다음 단계

  1. 검색어 해석 최적화를 위한 스키마 구조화.
  2. 동의어 정의.