ML 파이프라인 개요

훌륭합니다. 모델을 프로덕션 ML 파이프라인에 배포할 준비가 되었습니다. 이 섹션에서는 ML 파이프라인의 테스트 가이드라인을 소개합니다. 그러나 이 섹션에서는 샌드박스 환경에서 이러한 데모를 실행할 수 없으므로 이러한 가이드라인을 보여주지 않습니다.

학습할 내용

  • 출시 및 프로덕션을 위한 적절한 테스트를 작성합니다.
  • 테스트를 사용하여 ML 파이프라인에서 실패 모드를 감지합니다.
  • 프로덕션 단계에서 모델 품질을 평가합니다.

ML 파이프라인이란?

ML 파이프라인은 다이어그램에 나와 있는 것처럼 여러 구성요소로 구성됩니다. 이러한 구성요소는 나중에 알아보겠습니다. 지금은 '모델'(블랙박스)이 프로덕션 ML에 필요한 파이프라인 인프라의 작은 부분입니다.

일반적인 머신러닝 파이프라인의 도표 도표에는 파이프라인의 각 구성요소에 하나씩, 여러 개의 상자가 표시되어 있습니다. 'model' 라벨이 지정된 상자는 도식의 중심에 있습니다. 다른 상자는 '모델' 상자 주위에 정렬됩니다. 이 상자에는 데이터 수집, 데이터 검증, 머신 리소스 관리, 제공 인프라, 특성 추출, 분석 도구, 프로세스 관리 도구, 구성, 모니터링 라벨이 지정됩니다.
그림 1: 일반적인 머신러닝 파이프라인의 도표

ML 파이프라인의 테스트 역할

소프트웨어 개발에서 이상적인 워크플로는 테스트 기반 개발(TDD)을 따릅니다. 그러나 ML에서는 테스트를 시작하는 것이 간단하지 않습니다. 테스트는 데이터, 모델, 문제에 따라 달라집니다. 예를 들어 모델을 학습시키기 전에는 손실을 검증하는 테스트를 작성할 수 없습니다. 대신 모델 개발 중에 달성할 수 있는 손실을 알아낸 다음 달성 가능한 손실을 기준으로 새 모델 버전을 테스트합니다.

다음과 같은 테스트가 필요합니다.

  • 입력 데이터 검증 중
  • 특성 추출 검증.
  • 새 모델 버전의 품질 확인
  • 제공 인프라 검증
  • 파이프라인 구성요소 간 통합 테스트.