이 페이지에는 추천 시스템 용어집 용어가 포함되어 있습니다. 모든 용어집을 보려면 여기를 클릭하세요.
C
후보 생성
추천 시스템에서 선택한 초기 추천 모음입니다. 예를 들어 100,000개의 도서를 제공하는 서점이 있다고 가정해 보겠습니다. 후보 생성 단계에서는 특정 사용자에게 적합한 도서 목록이 훨씬 작아집니다(예: 500). 하지만 500권의 책도 사용자에게 추천하기에는 너무 많습니다. 이후에 더 많은 비용이 드는 추천 시스템의 단계 (예: 점수 및 순위 재지정)는 이러한 500개를 훨씬 더 작고 유용한 추천 집합으로 줄입니다.
협업 필터링
여러 사용자의 관심분야를 기반으로 한 사용자의 관심분야를 예측합니다. 협업 필터링은 추천 시스템에서 자주 사용됩니다.
I
항목 행렬
추천 시스템에서 행렬 분해에 의해 생성된 임베딩 벡터의 행렬로, 각 항목에 관한 잠재 신호를 보유합니다. 항목 행렬의 각 행에는 모든 항목의 단일 잠재 특성 값이 포함됩니다. 예를 들어 영화 추천 시스템을 살펴보겠습니다. 항목 행렬의 각 열은 단일 영화를 나타냅니다. 잠재 신호는 장르를 나타내거나 장르, 스타, 영화 시대, 기타 요인 사이의 복잡한 상호작용을 수용하기가 더 어려운 신호일 수 있습니다.
항목 행렬의 분해 중인 타겟 행렬과 동일한 수의 열이 있습니다. 예를 들어 10,000개의 영화 제목을 평가하는 영화 추천 시스템이 지정된 경우 상품 행렬에는 10,000개의 열이 포함됩니다.
items
추천 시스템에서는 시스템이 추천하는 항목입니다. 예를 들어 동영상은 동영상 스토어에서 추천하는 상품이고 책은 서점에서 추천하는 항목입니다.
M
행렬 분해
수학에서 내적이 대상 행렬의 근사치인 행렬을 찾기 위한 메커니즘입니다.
추천 시스템에서는 대상 매트릭스에 항목에 대한 사용자 평가가 포함된 경우가 많습니다. 예를 들어 영화 추천 시스템의 타겟 매트릭스는 다음과 같습니다. 여기서 양의 정수는 사용자 평점이고 0은 사용자가 영화를 평가하지 않았음을 의미합니다.
카사블랑카 | 필라델피아 이야기 | 블랙 팬서 | 원더 우먼 | 펄프 픽션 | |
---|---|---|---|---|---|
사용자 1 | 5.0 | 3.0 | 0.0 | 2.0 | 0.0 |
사용자 2 | 4.0 | 0.0 | 0.0 | 1.0 | 5.0 |
사용자 3 | 3.0 | 1.0 | 4.0 | 5.0 | 0.0 |
영화 추천 시스템은 등급이 없는 영화에 대한 사용자 평점을 예측하는 것을 목표로 합니다. 예를 들어 사용자 1은 블랙 팬서를 좋아할까요?
추천 시스템에 대한 한 가지 접근 방식은 행렬 분해를 통해 다음과 같은 두 행렬을 생성하는 것입니다.
예를 들어 사용자 3명과 항목 5개에서 행렬 분해를 사용하면 다음과 같은 사용자 행렬과 항목 행렬을 얻을 수 있습니다.
User Matrix Item Matrix 1.1 2.3 0.9 0.2 1.4 2.0 1.2 0.6 2.0 1.7 1.2 1.2 -0.1 2.1 2.5 0.5
사용자 행렬 및 항목 행렬의 내적은 원래 사용자 평점뿐 아니라 각 사용자가 보지 못한 영화에 대한 예측도 포함된 추천 행렬을 생성합니다. 예를 들어 사용자 1의 카사블랑카 평점(5.0)을 고려합니다. 추천 행렬에서 해당 셀에 해당하는 내적은 약 5.0이어야 하며 다음과 같습니다.
(1.1 * 0.9) + (2.3 * 1.7) = 4.9
더 중요한 점은 사용자 1이 블랙 팬서를 좋아할까요? 첫 번째 행과 세 번째 열에 해당하는 내적을 사용하면 예측 평점 4.3이 생성됩니다.
(1.1 * 1.4) + (2.3 * 1.2) = 4.3
행렬 분해는 일반적으로 타겟 행렬보다 훨씬 간결한 사용자 행렬과 항목 행렬을 생성합니다.
R
추천 시스템
각 사용자에게 대규모 코퍼스에서 원하는 비교적 작은 항목 집합을 선택하는 시스템입니다. 예를 들어 동영상 추천 시스템이 100,000개의 동영상 코퍼스에서 두 개의 동영상을 추천할 수 있으며, 한 명의 사용자는 카사블랑카와 필라델피아 스토리를 선택하고 다른 사용자는 원더맨과 블랙 팬서를 선택합니다. 동영상 추천 시스템은 다음 요소를 바탕으로 추천할 수 있습니다.
- 비슷한 사용자가 평가하거나 시청한 영화입니다.
- 장르, 감독, 배우, 타겟 인구통계...
순위 다시 지정
추천 시스템의 마지막 단계이며, 이 기간 동안 채점된 항목은 다른 (일반적으로 ML이 아닌) 알고리즘에 따라 다시 채점될 수 있습니다. 다시 순위 지정은 점수 단계에서 생성된 항목 목록을 평가하여 다음과 같은 작업을 합니다.
- 사용자가 이미 구매한 상품을 제거합니다.
- 최신 항목의 점수를 높일 수 있습니다.
S
점수 매기기
후보 항목 생성 단계에서 생성된 각 항목의 값 또는 순위를 제공하는 추천 시스템의 일부
U
사용자 행렬
추천 시스템에서 행렬 분해가 생성한 임베딩 벡터는 사용자 환경설정에 관한 잠재 신호를 보유합니다. 사용자 행렬의 각 행에는 단일 사용자의 다양한 잠재 신호의 상대적 강도에 대한 정보가 포함됩니다. 예를 들어 영화 추천 시스템을 살펴보겠습니다. 이 시스템에서 사용자 매트릭스의 잠재 신호는 특정 장르에 대한 각 사용자의 관심을 나타내거나, 여러 요인 간의 복잡한 상호작용을 포함하는 해석하기 어려운 신호일 수 있습니다.
사용자 행렬에는 각 잠재 특성에 관한 열과 각 사용자의 행이 있습니다. 즉, 사용자 행렬은 분해 중인 타겟 행렬과 동일한 수의 행을 갖습니다. 예를 들어 1,000,000명의 사용자를 위한 영화 추천 시스템의 경우 사용자 행렬은 1,000,000개의 행으로 구성됩니다.
W
가중치가 적용된 대체 최소 정사각형 (WALS)
추천 시스템의 행렬 분해 중에 목표 함수를 최소화하기 위한 알고리즘으로, 누락된 예를 축소할 수 있습니다. WALS는 행 분해 수정과 열 분해를 번갈아 가면서 원래 행렬과 재구성 사이의 가중치 제곱 오차를 최소화합니다. 이러한 각 최적화는 제곱 최소 볼록 최적화로 해결할 수 있습니다. 자세한 내용은 추천 시스템 과정을 참고하세요.