순위 다시 지정

추천 시스템의 마지막 단계에서 시스템은 추가 기준이나 제약 조건을 고려하기 위해 후보의 순위를 다시 정할 수 있습니다. 재순위 접근 방식 중 하나는 일부 후보를 삭제하는 필터를 사용하는 것입니다.

순위를 다시 지정하는 또 다른 방법은 순위 지정자가 반환한 점수를 수동으로 변환하는 것입니다.

이 섹션에서는 최신 상태, 다양성, 공정성에 관해 간략하게 설명합니다. 이러한 요소는 추천 시스템 개선에 도움이 되는 많은 요소 중 하나입니다. 이러한 요소 중 일부는 종종 프로세스의 여러 단계를 수정해야 합니다. 각 섹션에서는 개별적으로 또는 공동으로 적용할 수 있는 솔루션을 제공합니다.

최신 상태

대부분의 추천 시스템은 현재 사용자 기록 및 최신 항목과 같은 최신 사용 정보를 통합하는 것을 목표로 합니다. 모델을 최신 상태로 유지하면 모델이 적절한 추천을 하는 데 도움이 됩니다.

솔루션

  • 최신 학습 데이터에 관해 알아보려면 학습을 최대한 자주 재실행하세요. 모델을 처음부터 다시 학습할 필요가 없도록 학습을 웜 스타트하는 것이 좋습니다. 웜 스타트는 학습 시간을 크게 줄일 수 있습니다. 예를 들어 행렬 분해에서 모델의 이전 인스턴스에 있던 항목의 임베딩을 웜 스타트합니다.
  • 행렬 분해 모델에서 신규 사용자를 나타내는 '평균' 사용자를 만듭니다. 각 사용자에게 동일한 임베딩이 필요하지 않으며 사용자 기능을 기반으로 사용자 클러스터를 만들 수 있습니다.
  • 소프트맥스 모델 또는 2탑 탑 모델과 같은 DNN을 사용합니다. 모델은 특징 벡터를 입력으로 사용하기 때문에 학습 중에 확인되지 않은 쿼리나 항목에서 실행될 수 있습니다.
  • 특성으로 문서 연령을 추가합니다. 예를 들어 YouTube에서 동영상 연령 또는 마지막으로 시청한 시간을 특성으로 추가할 수 있습니다.

올빼미에 관한 맞춤 동영상 4개의 이미지입니다.

다양성

시스템에서 항상 쿼리 임베딩과 유사한 항목을 추천한다면 후보는 서로 매우 유사한 경향이 있습니다. 이러한 다양성 부족으로 인해 사용자 환경이 저하되거나 지루해질 수 있습니다. 예를 들어 YouTube가 올빼미 동영상만(그림에 나와 있음) 동영상과 같이 사용자가 현재 시청 중인 동영상과 매우 유사한 동영상만 추천하는 경우 사용자는 곧 관심을 잃을 가능성이 높습니다.

솔루션

  • 다양한 소스를 사용하여 여러 후보 생성기를 학습시킵니다.
  • 다양한 목표 함수를 사용하여 여러 순위 조정자를 교육합니다.
  • 다양성을 보장하기 위해 장르 또는 기타 메타데이터에 따라 항목의 순위를 다시 지정합니다.

공정성

모델이 모든 사용자를 공정하게 대해야 합니다. 따라서 모델이 학습 데이터에서 무의식적인 편향을 학습하지 않도록 해야 합니다.

솔루션

  • 디자인 및 개발에 다양한 관점을 포함합니다.
  • 포괄적인 데이터 세트에서 ML 모델 학습 데이터가 너무 희소한 경우 (예: 특정 카테고리가 과소 표현되는 경우) 보조 데이터를 추가합니다.
  • 편향을 관찰하기 위해 각 인구통계의 측정항목 (예: 정확성 및 절대 오차)을 추적합니다.
  • 소외된 그룹을 위한 별도의 모델을 만듭니다.