콘텐츠 기반 필터링
컬렉션을 사용해 정리하기
내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.
콘텐츠 기반 필터링은 항목 기능을 사용하여 다른 항목을 추천합니다.
사용자의 이전 행동이나 명시적인 행동을 기준으로
사용자가 원하는 것과 유사한
의견을 보냅니다.
콘텐츠 기반 필터링을 시연하기 위해 몇 가지 특성을 직접 엔지니어링해 보겠습니다.
'Google Play 스토어'로 이동합니다. 다음 그림은 특성 행렬을 보여줍니다.
각 행은 앱을 나타내고 각 열은 기능을 나타냅니다. 특징
카테고리 (예: 교육, 일반, 건강), 게시자
앱 등이 있습니다. 단순화하기 위해 다음 특성 행렬이 바이너리라고 가정합니다.
0이 아닌 값은 앱에 해당 기능이 있음을 의미합니다.
또한 동일한 특성 공간에서 사용자를 나타냅니다. 일부 사용자 관련 콘텐츠는
사용자가 명시적으로 기능을 제공할 수 있습니다. 예를 들어 사용자가
'엔터테인먼트 앱' 표시됩니다. 다른 기능은 암시적일 수 있지만
이전에 설치한 앱을 기반으로 합니다. 예를 들어 사용자가
Science R Us에서 게시한 다른 앱을 설치했습니다.
모델에서 이 사용자와 관련된 상품을 추천해야 합니다. 이렇게 하려면
먼저 유사성 측정항목 (예: 내적)을 선택합니다. 그런 다음
이러한 유사성에 따라 각 후보 항목을 채점하도록 시스템을 설정합니다.
측정항목입니다. 추천은 이 사용자에게 한정되므로
다른 사용자에 대한 정보는 전혀 사용하지 않았습니다.
내적을 유사성 척도로 사용
사용자가 임베딩 및 앱을 \(x\) 만드는 경우를 생각해 보겠습니다.
임베딩 \(y\) 은 모두 바이너리 벡터입니다. 이후
\(\langle x, y \rangle = \sum_{i = 1}^d x_i y_i\), a
특성이 \(x\) \(y\)
있습니다. 즉, \(\langle x, y \rangle\) 는
특성으로 할 수 있습니다. A 최고
그러면 내적이 더 일반적인 특성을 나타내므로 유사성이 더 높아집니다.
직접 해 보세요.
앞의 앱 문제에서 각 앱의 내적을 계산합니다.
그런 다음 이 정보를 사용하여 아래 질문에 답하세요.
어떤 앱을 추천해야 할까요?
Science R Us에서 만든 교육용 앱입니다.
정답입니다. 이 상품의 내적이 가장 높습니다.
2. 저희 사용자는 과학 및 교육용 앱을 정말 좋아합니다.
Healthcare에서 만든 건강 앱입니다.
이 앱은 1점을 받았습니다. 나쁘지 않은 추천이지만
하지만 최선의 선택은 아닙니다.
TimeWastr에서 만든 캐주얼 앱입니다.
이 앱은 실제로 내적이 0으로 가장 낮습니다. Google의
게임과 같은 캐주얼 앱에 관심이 없는 사용자
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2024-07-26(UTC)"],[],[]]