프로덕션 ML 시스템

머신러닝에는 단순한 ML 알고리즘 구현 외에 훨씬 더 많은 것이 포함되어 있습니다. 프로덕션 ML 시스템에는 많은 구성요소가 포함됩니다.

프로덕션 ML 시스템

다음과 같은 구성요소가 포함된 ML 시스템: 데이터 수집, 특성 추출, 프로세스 관리 도구, 데이터 확인, 구성, 머신 리소스 관리, 모니터링, 서빙 인프라, ML 코드 다이어그램의 ML 코드는 다른 구성요소 아홉 개에 의해 축소됩니다.
다음과 같은 구성요소가 포함된 ML 시스템: 데이터 수집, 특성 추출, 프로세스 관리 도구, 데이터 확인, 구성, 머신 리소스 관리, 모니터링, 서빙 인프라, ML 코드 다이어그램의 ML 코드는 다른 구성요소 아홉 개에 의해 축소됩니다.
  • 모든 구성요소를 직접 만들 필요는 없습니다.
    • 가능하면 일반 ML 시스템 구성요소를 재사용하세요.
    • Google CloudML 솔루션에는 Dataflow 및 TF 서빙이 포함됩니다.
    • Spark, Hadoop 등 다른 플랫폼에서도 구성요소를 찾을 수 있습니다.
    • 어떤 구성요소가 필요한지 어떻게 알 수 있나요?
      • 몇 가지 ML 시스템 패러다임과 요구사항을 확인하세요.

지금까지 머신러닝 단기집중과정에서는 ML 모델을 만드는 데 초점을 맞췄습니다. 하지만 다음 그림에서 알 수 있듯이, 이 모델은 실제 프로덕션 ML 시스템 생태계의 한 부분에 지나지 않습니다.

다음과 같은 구성요소가 포함된 ML 시스템: 데이터 수집, 특성 추출, 프로세스 관리 도구, 데이터 확인, 구성, 머신 리소스 관리, 모니터링, 서빙 인프라, ML 코드 다이어그램의 ML 코드는 다른 구성요소 아홉 개에 의해 축소됩니다.

그림 1. 실제 프로덕션 ML 시스템

ML 코드는 실제 ML 프로덕션 시스템의 중심에 있지만 일반적으로 전체 ML 프로덕션 시스템 코드의 5%만을 나타냅니다. 오타가 아닙니다. ML 프로덕션 시스템은 입력 데이터에 많은 리소스를 투입하여 데이터를 수집 및 확인하고 데이터에서 특성을 추출합니다. 또한 ML 모델의 예측을 실제로 사용하려면 서빙 인프라를 설치해야 합니다.

다행히 위 그림 안의 많은 구성요소들은 재사용 가능합니다. 또한 그림 2의 모든 구성요소를 직접 만들 필요가 없습니다.

텐서플로우에서 많은 구성요소를 제공하지만 Spark, Hadoop 등 다른 플랫폼에서도 사용 가능한 다른 옵션을 제공합니다.

다음 모듈에서는 프로덕션 ML 시스템 디자인에 대해 다룹니다. 여러분의 ML 시스템 구성 결정에 도움이 될 것 입니다.