숫자 데이터 작업

를 통해 개인정보처리방침을 정의할 수 있습니다.

ML 전문가는 모델을 빌드하는 것보다 데이터를 평가, 정리, 변환하는 데 훨씬 더 많은 시간을 보냅니다. 데이터가 매우 중요하므로 이 과정에서는 이 주제를 다음 세 가지 단원으로 정합니다.

이 단원에서는 숫자처럼 동작하는 정수 또는 부동 소수점 값을 의미하는 숫자 데이터에 중점을 둡니다. 즉, 덧셈, 집계, 순서 지정 등이 가능합니다. 다음 단원에서는 카테고리처럼 작동하는 숫자가 포함될 수 있는 범주형 데이터에 중점을 둡니다. 세 번째 단원에서는 모델을 학습하고 평가할 때 고품질 결과를 얻기 위해 데이터를 준비하는 방법을 중점적으로 다룹니다.

수치 데이터의 예는 다음과 같습니다.

  • 온도
  • 무게
  • 자연 보호 구역에서 겨울을 나는 사슴의 수

반대로 미국 우편번호가 5자리 또는 9자리 숫자인 경우, 숫자처럼 동작하거나 관계라고 할 수 있습니다. 우편번호 40004 (켄터키주 넬슨 카운티)는 워싱턴 D.C.의 우편번호 20002의 두 배가 아닙니다. 이러한 숫자는 카테고리, 특히 지리적 지역을 나타내며 범주형 데이터로 간주됩니다.