Machine Learning | Google for Developers

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

아래 옵션을 살펴보세요.

테스트 세트와 학습 세트를 사용해 모델 개발을 반복하는 프로세스를 살펴보았습니다. 반복할 때마다 학습 데이터를 학습하고 테스트 데이터를 평가하여 테스트 데이터에 대한 평가 결과를 사용하여 학습률 및 특성과 같은 다양한 모델 초매개변수의 선택 및 변경사항을 안내합니다. 이 접근 방식에 문제가 있나요? 정답을 하나만 선택하세요.

괜찮습니다. 학습 데이터를 학습시키고 별도로 보류된 테스트 데이터를 평가하는 것입니다.

사실 여기에는 미묘한 문제가 있습니다. 이 양식을 여러 번 반복했다면 어떤 일이 일어날지 생각해 보세요.

이 절차를 여러 번 진행하면 특정 테스트 세트의 특이성에 암시적으로 적합할 수 있습니다.

실제로 그렇습니다. 특정 테스트 세트에 대해 더 자주 평가할수록 해당 테스트 세트에 암시적으로 과적합될 위험이 커집니다. 이제 더 나은 프로토콜을 살펴보겠습니다.

이는 비효율적입니다. 단순히 기본 초매개변수 집합을 선택하고 그대로 사용하여 리소스를 저장해야 합니다.

이러한 종류의 반복은 비용이 많이 발생하지만 모델 개발에서 중요한 부분입니다. 초매개변수 설정은 모델 품질을 크게 향상할 수 있으며, 가능한 한 최상의 품질을 얻을 수 있도록 항상 시간과 컴퓨팅 리소스에 예산을 투자해야 합니다.