후보 생성 후 다른 모델이 생성된 후보 항목의 점수를 매기고 순위를 매깁니다.
표시할 항목 집합을 선택할 수 있습니다. 추천 시스템
다음과 같이 서로 다른 소스를 사용하는 여러 후보 생성기가 있을 수 있습니다.
방법은 다음과 같습니다.
예
행렬 분해 모델의 관련 항목입니다.
맞춤설정을 고려한 사용자 기능입니다.
'지역' vs '원격' items; 즉, 지리 정보를 가져와
고려해야 합니다
인기 상품 또는 인기 상품
소셜 그래프 즉, 다음 사용자가 좋아하거나 추천한 항목
친구.
시스템은 이러한 다양한 소스를
이를 하나의 모델로 채점하고
확인할 수 있습니다. 예를 들어 시스템은 특정 신경망에
다음 조건에서 사용자가 YouTube에서 동영상을 시청할 확률:
검색어 기능 (예: 사용자 시청 기록, 언어, 국가, 시간)
동영상 기능 (예: 제목, 태그, 동영상 삽입)
그런 다음 시스템은
후보자 풀에서 동영상의 순위를 매기고
모델의 예측에 사용됩니다.
후보 생성기가 점수를 내도록 해서는 안 되는 이유는 무엇일까요?
후보 생성기는 점수 (유사성 측정 기준)를 계산하고
임베딩의 경우처럼 순위 지정을 위해 임베딩을 사용하고 싶을 수 있습니다.
있습니다. 그러나 다음과 같은 이유로 이 방법은 사용하지 말아야 합니다.
일부 시스템은 여러 후보 생성기에 의존합니다. 이러한
서로 다른 생성기를 비교하지 못할 수 있습니다.
후보자 풀이 적기 때문에 시스템에서
더 많은 특성과 컨텍스트를 더 잘 포착할 수 있는 더 복잡한 모델이 필요합니다.
점수 산정을 위한 목적 함수 선택
ML 문제 소개에서 기억하시겠지만
프레임 조정,
ML은 짓궂은 장난 지팡이처럼 행동할 수 있습니다. 목표를 배우고
하지만 무엇을 원하는지 신중하게 고려해야 합니다. 이 장난꾸러기
추천 시스템에도 적용됩니다 점수의 선택
기능이 항목의 순위에 크게 영향을 줄 수 있으며 궁극적으로는
맞춤 동영상의 품질도 관리할 수 있습니다.
예:
각 매개변수를 사용하면 어떻게 되는지 알아보려면 더하기 아이콘을 클릭하세요.
목표일 수 있습니다
클릭률 극대화
점수 함수가 클릭수 증가를 위해 최적화되면 시스템에서
클릭베이트 동영상 이 점수 산정 함수는 클릭을 생성하지만
제공하는 것이 좋습니다. 사용자 관심이 금세 사라질 수 있습니다
시청 시간 극대화
점수 기능이 시청 시간을 기준으로 최적화되면 시스템에서
매우 긴 동영상을 추천하므로 사용자 경험이 저하될 수 있습니다.
단, 짧은 시계 여러 개는 긴 시계 한 개만큼도 효과적일 수 있습니다.
다양성 향상 및 세션 시청 시간 극대화
길이가 짧은 동영상을 추천하되
알 수 있습니다.
점수 산정의 위치 편향
화면 아래에 표시되는 항목은 아래 항목보다 클릭 가능성이 낮습니다.
항목이 표시되는 것을 볼 수 있습니다. 하지만 동영상을 채점할 때는
시스템은 일반적으로 해당 동영상의 링크가 화면의 어느 위치에 표시될지 알지 못합니다.
마침내 나타날 겁니다. 가능한 모든 위치로 모델을 쿼리하는 것 역시
비용이 많이 듭니다. 여러 위치를 쿼리할 수 있더라도 시스템은
여러 순위 점수에서 일관된 순위를 찾지 못할 수도 있습니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2024-07-26(UTC)"],[[["Recommendation systems often involve candidate generation followed by scoring and ranking to select items for display."],["Candidate generation can leverage various sources like user features, popular items, or social graphs, which are then combined and scored by a separate model."],["Using a single scoring model allows for better comparability and context consideration compared to relying on individual candidate generator scores."],["Careful selection of the scoring function is crucial as it directly impacts the quality and relevance of recommendations, with considerations for click-bait or overly long content."],["Positional bias should be addressed by aiming for position-independent rankings, potentially by scoring candidates as if they were in the top position."]]],[]]