프레이밍: 이해한 내용 확인하기

지도 학습

아래 옵션을 살펴보세요.

주어진 이메일이 '스팸'인지 '스팸 아님'인지 예측하기 위해 지도 머신러닝 모델을 개발한다고 가정해 보겠습니다. 다음 중 올바른 설명은 무엇인가요?
'스팸' 또는 '스팸 아님'으로 표시되지 않은 이메일은 라벨이 없는 예입니다.
이 라벨은 '스팸' 및 '스팸 아님' 값으로 구성되므로 아직 스팸 또는 스팸 아님으로 표시되지 않은 모든 이메일은 라벨이 지정되지 않은 예시입니다.
제목 헤더의 단어는 라벨이 바람직합니다.
제목 헤더의 단어는 훌륭한 특성이 될 수 있지만 좋은 라벨이 될 수는 없습니다.
라벨이 없는 예시를 사용하여 모델을 학습시켜 보겠습니다.
라벨이 있는 예시를 사용하여 모델을 학습시켜 보겠습니다. 그러면 학습된 모델을 라벨이 없는 예와 비교하여 실행하여 라벨이 없는 이메일 메시지가 스팸인지 아닌지 추론할 수 있습니다.
일부 예시에 적용된 라벨은 불안정할 수 있습니다.
물론입니다. 데이터의 신뢰성을 확인하는 것이 중요합니다. 이 데이터 세트의 라벨은 특정 이메일 메시지를 스팸으로 표시한 이메일 사용자로부터 가져온 것일 수 있습니다. 대부분의 사용자가 모든 의심스러운 이메일 메시지를 스팸으로 표시하지는 않으므로 Google에서 이메일이 스팸인지 확인하는 데 문제가 발생할 수 있습니다. 또한 스팸 발송자는 잘못된 라벨을 제공하여 의도적으로 모델을 손상시킬 수 있습니다.

특성 및 라벨

아래 옵션을 살펴보세요.

온라인 신발 매장에서 사용자에게 맞춤 신발 추천을 제공하는 지도 ML 모델을 만들고자 한다고 가정해 보겠습니다. 즉, 이 모델은 마르티에게 특정 신발을 추천하고 자네에게 다른 신발을 추천합니다. 시스템에서 과거 사용자 행동 데이터를 사용하여 학습 데이터를 생성합니다. 다음 중 올바른 설명은 무엇인가요?
'신발 크기'는 유용한 특성입니다.
'신발 크기'는 사용자가 추천된 신발을 좋아할지 여부에 큰 영향을 미칠 만한 정량적 신호입니다. 예를 들어 마티가 사이즈 9를 착용하는 경우 모델이 사이즈 7 신발을 추천하면 안 됩니다.
'신발 뷰티'는 유용한 특성입니다.
좋은 특성은 구체적이고 수량화할 수 있어야 합니다. 뷰티는 모호하게 느껴질 정도로 유용한 기능이라고는 할 수 없습니다. 뷰티는 아마도 스타일, 색상 등 구체적인 특징이 혼합된 것입니다. 스타일과 색상은 각각 뷰티보다 더 나은 특징입니다.
사용자가 신발 설명을 클릭했을 때 유용한 라벨입니다.
사용자는 마음에 드는 신발에 관해서만 읽기를 원합니다. 따라서 사용자의 클릭수는 좋은 학습 라벨 역할을 할 수 있는 관찰 가능하고 수치화 가능한 측정항목입니다. 학습 데이터는 과거 사용자 행동에서 파생되므로 라벨은 사용자 환경설정과 밀접한 관련이 있는 클릭과 같은 객관적인 행동에서 파생되어야 합니다.
'사용자가 좋아하는 신발'은 유용한 라벨입니다.
사랑은 관찰 가능한 정량적 측정항목이 아닙니다. 가능한 가장 좋은 방법은 관측을 위한 관찰 가능한 프록시 측정항목을 검색하는 것입니다.