머신러닝 (ML) 모델은 본질적으로 객관적이지 않습니다. ML 실무자 모델에 학습 예시 데이터 세트를 제공하여 이러한 데이터의 프로비저닝과 선별에 개입함으로써 모델의 예측하는 데 사용됩니다.
모델을 만들 때는 인간의 모델에 영향을 줄 수 있는 데이터에 매니페스트를 삽입하여 사전 예방적 조치를 취하여 사용할 수 있습니다.
보고 편향
-
정의
보고 편향은 이벤트, 속성 및/또는 결과가 데이터 세트에 캡처된 경우 정확한 실제 빈도를 반영합니다. 이러한 편향은 왜냐하면 사람들은 이처럼 광범위하고 안전한 상황을 기억하기 쉬울 수도 있습니다. 기록되어야 합니다.
-
예
감정 분석 모델은 책이 한 권의 책인지 사용자 코퍼스를 기준으로 긍정적 또는 부정적 리뷰 인기 웹사이트에 제출할 수 있습니다. 학습 데이터 세트에는 극단적인 의견( 좋아하거나 싫어함). 호의적이지 않은 경우 책에 대한 리뷰를 작성했습니다. 모델이 감정을 정확하게 예측하는 능력이 보다 섬세한 언어를 사용하여 책을 설명하는 리뷰
를 클릭합니다. chevron_left를 사용해 보세요.
과거 편향
-
정의
이전 편향은 이전 데이터가 당시 세상에 존재했던 불평등을 반영합니다.
-
예
1960년대의 도시 주택 데이터 세트에는 주택 가격 데이터가 포함되어 있습니다. 해당 기간 동안 시행되는 차별적 대출 관행 10년 동안
를 클릭합니다. chevron_left를 사용해 보세요.
자동화 편향
-
정의
자동화 편향 - 결과를 선호하는 경향 자동화 시스템에서 생성된 데이터보다 각 시스템의 오류율과 관계없이
-
예
톱니 제조업체에서 일하는 ML 실무자는 새로운 "혁신" 기술을 식별을 위해 학습시킨 치아 결함의 발생을 계산하는데, 공장 감독자가 정밀도와 재현율이 나머지보다 15% 낮았습니다. 검사 중이었습니다
를 클릭합니다. chevron_left를 사용해 보세요.
표본 선택 편향
표본 선택 편향은 데이터 세트의 예시는 예시를 반영하지 않은 방식으로 살펴보겠습니다. 표본 선택 편향은 다양한 형태를 취할 수 있습니다. 범위 편향, 무응답 편향, 표본 편향 등이 있습니다
포함 편향
-
정의
범위 편향은 잘 보이게 할 수 있습니다.
-
예
모델을 학습시켜 신제품의 향후 판매를 예측하고 제품을 구매한 소비자 표본을 대상으로 실시한 전화 설문조사에서 있습니다. 대신 경쟁 제품을 구매하기로 선택한 소비자 설문 조사에 응하지 않았으며, 그 결과 이 그룹은 학습 데이터에 표현됩니다.
를 클릭합니다. chevron_left를 사용해 보세요.
무응답 편향
-
정의
무응답 편향 (이라고도 함) 참여 편향)이 발생할 수 있는데, 데이터 수집에 대한 참여 격차로 인해 대표성이 없는 프로세스입니다
-
예
모델을 학습시켜 신제품의 향후 판매를 예측하고 제품을 구매한 소비자 표본을 대상으로 실시한 전화 설문조사에서 경쟁업체의 제품을 구매한 소비자 표본을 대상으로 있습니다. 경쟁 제품을 구매한 소비자는 80% 더 높았습니다. 설문조사 작성을 거부할 가능성이 높았으며 데이터는 잘 드러나지 않습니다
를 클릭합니다. chevron_left를 사용해 보세요.
표본 추출 편향
-
정의
표본 추출 편향은 적절한 무작위 순서 지정이 데이터 수집 중에 사용되지 않습니다.
-
예
모델을 학습시켜 신제품의 향후 판매를 예측하고 제품을 구매한 소비자 표본을 대상으로 실시한 전화 설문조사에서 경쟁업체의 제품을 구매한 소비자 표본을 대상으로 있습니다. 설문조사 담당자는 소비자를 무작위로 타겟팅하는 대신 이메일에 응답한 첫 200명의 소비자를 뽑아 제품에 대한 열정이 평균보다 높음 있습니다.
를 클릭합니다. chevron_left를 사용해 보세요.
그룹 귀인 편향
그룹 귀인 편향 전체 그룹에서 개인의 특성을 일반화하여 확인할 수 있습니다 그룹 귀인 편향은 보통 양식을 작성했습니다.
내집단 편향
-
정의
내집단 편향은 내가 속한 그룹 또는 특성 공유할 수 있습니다
-
예
ML 실무자 2명이 이력서 선별 모델을 학습시킴 소프트웨어 개발자는 신청자가 자신의 데이터를 보호하는 데 도움이 된다고 둘 다 같은 컴퓨터 공학 아카데미에 다녔습니다. 더 적합할 수 있습니다
를 클릭합니다. chevron_left를 사용해 보세요.
외부 집단 동질화 편향
-
정의
외부 집단 동질화 편향은 특정 집단의 개별 구성원에 대해 고정 관념을 드러내지 않고 소속감을 느끼거나 더 균일한 특성을 보이는 것으로 나타났습니다.
-
예
ML 실무자 2명이 이력서 선별 모델을 학습시킴 소프트웨어 개발자는 모든 신청자가 컴퓨터 공학 아카데미에 다니지 않은 사람은 충분한 전문성이 있는지 확인해야 합니다
를 클릭합니다. chevron_left를 사용해 보세요.
내재적 편향
-
정의
내재적 편향은 가정할 때 발생합니다. 스스로의 사고 모델과 개인적 경험을 바탕으로 항상 더 일반적으로 적용되는 것은 아닙니다
-
예
동작 인식 모델을 학습시키는 ML 실무자가 머리 흔들기 '아니요'라는 단어를 말하고 있음을 나타내는 기능입니다 하지만 일부 지역에서는 실제로 머리를 흔드는 는 '예'를 나타냅니다.
를 클릭합니다. chevron_left를 사용해 보세요.
확증 편향
-
정의
확증 편향은 모델 빌더가 기존 믿음을 확립하는 방식으로 무의식적으로 데이터를 처리함 가설을 세울 수 있습니다.
-
예
공격성을 예측하는 모델을 빌드하고 있는 ML 실무자가 키, 몸무게, 품종, 품종 등 다양한 특성을 기반으로 합니다. 전문직 종사자가 직장에서 토이푸들은 활동량이 많아서 공격적인 품종. 모델의 학습 데이터를 선별할 때 전문 분야 종사자가 무의식적으로 사용한 특성 중 작은 강아지가 순조롭게 움직였다는 증거가 있습니다.
를 클릭합니다. chevron_left를 사용해 보세요.
실험자 편향
-
정의
실험자 편향은 모델 빌더가 모델에 맞는 결과가 나올 때까지 모델을 원래 가설을 확인해 주어야 합니다.
-
예
공격성을 예측하는 모델을 빌드하고 있는 ML 실무자가 키, 몸무게, 품종, 품종 등 다양한 특성을 기반으로 합니다. 전문직 종사자가 직장에서 토이푸들은 활동량이 많아서 공격적인 품종. 학습된 모델에서 가장 많이 예측한 시점 토이 푸들이 상대적으로 순조롭게 느껴지면서 결과를 보여주는 결과가 나올 때까지 모델을 여러 번 작은 푸들로 인해 더 폭력적으로 행동할 수 있습니다.
를 클릭합니다. chevron_left를 사용해 보세요.