TensorFlow 첫걸음: 프로그래밍 실습

머신러닝 단기집중과정을 진행하는 동안 고급 TensorFlow API인 tf.estimator를 사용하여 모델을 코딩함으로써 학습한 원리와 기법을 실습에 적용하게 됩니다.

머신러닝 단기집중과정 프로그래밍 실습에서는 코드, 출력 및 설명 텍스트를 하나의 공동작업 문서로 결합하는 데이터 분석 플랫폼을 사용합니다.

프로그래밍 실습은 별도의 설정이 필요 없이 브라우저에서 바로 실행되며 Colaboratory 플랫폼을 이용합니다. Colaboratory는 대부분의 주요 브라우저에서 지원되며 Chrome 및 Firefox 데스크톱 버전을 대상으로 가장 꼼꼼한 테스트가 이루어졌습니다. 실습을 다운로드하여 오프라인에서 실행하시려면 이 안내를 확인하여 로컬 환경 설정에 관해 자세히 알아보세요.

다음 세 개의 실습을 지정된 순서로 실행하세요.

  1. Pandas 빠른 가이드: Pandas는 데이터 분석 및 모델링에 중요한 라이브러리이며 TensorFlow 코딩에 널리 사용됩니다. 이 가이드에서는 이 교육 과정에 필요한 Pandas 정보를 모두 제공합니다. 이미 Pandas를 알고 있으면 이 실습을 건너뛸 수 있습니다.
  2. TensorFlow 첫걸음: 선형 회귀에 관해 알아봅니다.
  3. 합성 특성과 이상점: 합성 특성 및 입력 이상점의 효과를 알아봅니다.

    머신러닝 단기집중과정 실습에서 자주 사용되는 초매개변수

    많은 코딩 실습에 다음과 같은 초매개변수가 포함됩니다.

    • steps: 총 학습 반복 횟수입니다. 한 단계에서 한 배치의 손실을 계산한 후, 이 값을 사용하여 모델의 가중치를 한 번 수정합니다.
    • batch size: 하나의 단계와 관련된 예시의 수(임의로 선택됨)입니다. 예를 들어 SGD의 batch size는 1입니다.

    다음 수식이 적용됩니다.

    \[ total\,number\,of\,trained\,examples = batch\,size * steps \]

    머신러닝 단기집중과정 실습에서 사용되는 편의 변수

    여러 실습에 다음과 같은 편의 변수가 포함됩니다.

    • periods: 보고의 세부사항을 제어합니다. 예를 들어 periods가 7로 설정되고 steps가 70으로 설정되면 실습에서 10단계마다(또는 7번) 손실 값을 출력합니다. 초매개변수와 달리 periods의 값을 수정하지 않아도 됩니다. periods를 수정해도 모델이 학습하는 내용은 변경되지 않습니다.

    다음 수식이 적용됩니다.

    \[ number\,of\,training\,examples\,in\,each\,period = \frac{batch\,size * steps} {periods} \]