아래 옵션을 살펴보세요.

주어진 이메일이 '스팸'인지 '스팸 아님'인지 예측하기 위해 지도 머신러닝 모델을 개발한다고 가정해 보겠습니다. 다음 중 올바른 설명은 무엇인가요?
'스팸' 또는 '스팸 아님'으로 표시되지 않은 이메일은 라벨이 없는 예입니다.
이 라벨은 '스팸' 및 '스팸 아님' 값으로 구성되므로 아직 스팸 또는 스팸 아님으로 표시되지 않은 모든 이메일은 라벨이 지정되지 않은 예시입니다.
제목 헤더의 단어는 라벨이 바람직합니다.
제목 헤더의 단어는 훌륭한 특성이 될 수 있지만 좋은 라벨이 될 수는 없습니다.
라벨이 없는 예시를 사용하여 모델을 학습시켜 보겠습니다.
라벨이 있는 예시를 사용하여 모델을 학습시켜 보겠습니다. 그러면 학습된 모델을 라벨이 없는 예와 비교하여 실행하여 라벨이 없는 이메일 메시지가 스팸인지 아닌지 추론할 수 있습니다.
일부 예시에 적용된 라벨은 불안정할 수 있습니다.
물론입니다. 데이터의 신뢰성을 확인하는 것이 중요합니다. 이 데이터 세트의 라벨은 특정 이메일 메시지를 스팸으로 표시한 이메일 사용자로부터 가져온 것일 수 있습니다. 대부분의 사용자가 모든 의심스러운 이메일 메시지를 스팸으로 표시하지는 않으므로 Google에서 이메일이 스팸인지 확인하는 데 문제가 발생할 수 있습니다. 또한 스팸 발송자는 잘못된 라벨을 제공하여 의도적으로 모델을 손상시킬 수 있습니다.