이 과정에서는 결정 트리와 결정 포레스트를 소개합니다.
결정 포레스트는 지도 학습 머신러닝 모델 및 알고리즘의 계열입니다. 다음과 같은 이점이 있습니다.
- 신경망보다 더 쉽게 구성할 수 있습니다. 결정 포레스트는 더 적은 초매개변수를 갖습니다. 또한 결정 포레스트의 초매개변수는 적절한 기본값을 제공합니다.
- 숫자, 범주형, 누락된 특성을 기본적으로 처리합니다. 즉, 신경망 사용 시보다 훨씬 적은 사전 처리 코드를 작성할 수 있으므로 시간이 절약되고 오류에 대한 소스를 줄일 수 있습니다.
- 대체로 즉시 우수한 결과를 제공하고 노이즈가 많은 데이터에 강력하며 해석 가능한 속성을 갖습니다.
- 신경망보다 작은 데이터 세트(예: 100만 개 미만)를 훨씬 더 빠르게 추론하고 학습합니다.
결정 포레스트는 머신러닝 경연대회에서 훌륭한 성과를 낼 뿐 아니라 많은 산업 작업에서 많이 사용됩니다. 결정 포레스트는 실용적이고 효율적이며 해석 가능합니다. 결정 포레스트는 다음을 포함한 많은 지도 학습 작업에 사용할 수 있습니다.
이 과정의 자료는 결정 포레스트에 일반적이며 특정 라이브러리에 구속되지 않습니다. 그러나 이와 같은 주황색 상자에는
TensorFlow 결정 포레스트 (TF-DF) 라이브러리를 사용하는 코드 예가 포함되어 있습니다. 이러한 예는 TF-DF에 해당하지만 다른 결정 포레스트 라이브러리로 쉽게 변환할 수 있는 경우가 많습니다.
기본 요건
이 과정에서는 다음 과정을 완료했거나 이에 상응하는 지식을 가지고 있다고 가정합니다.
감사합니다.