예측 편향은 모델의 예측 평균과 데이터의 정답 라벨 평균 간의 차이입니다. 이메일의 5% 가 스팸인 데이터 세트로 학습된 모델은 분류하는 이메일의 5% 가 스팸이라고 평균적으로 예측해야 합니다. 즉, 정답 데이터 세트의 라벨 평균은 0.05이며 모델의 예측 평균도 0.05여야 합니다. 이 경우 모델의 예측 편향은 0입니다. 물론 모델에 다른 문제가 있을 수도 있습니다.
모델이 이메일이 스팸이라고 50% 의 시간 동안 예측한다면 학습 데이터 세트, 모델이 적용되는 새 데이터 세트 또는 모델 자체에 문제가 있는 것입니다. 두 평균 간에 유의미한 차이가 있으면 모델에 예측 편향이 있음을 나타냅니다.
[[["이해하기 쉬움","easyToUnderstand","thumb-up"],["문제가 해결됨","solvedMyProblem","thumb-up"],["기타","otherUp","thumb-up"]],[["필요한 정보가 없음","missingTheInformationINeed","thumb-down"],["너무 복잡함/단계 수가 너무 많음","tooComplicatedTooManySteps","thumb-down"],["오래됨","outOfDate","thumb-down"],["번역 문제","translationIssue","thumb-down"],["샘플/코드 문제","samplesCodeIssue","thumb-down"],["기타","otherDown","thumb-down"]],["최종 업데이트: 2025-10-17(UTC)"],[],[]]