ML Pipelines'a Genel Bakış

Tebrikler! Modeliniz, üretim ML ardışık düzenine dağıtıma hazır. Kursun bu bölümünde makine öğrenimi ardışık düzenleri için test kuralları açıklanmaktadır. Ancak böyle bir demo korumalı alan ortamında mümkün olmadığından bu bölümde bu yönergeler gösterilmez.

Öğrenecekleriniz:

  • Kullanıma sunma ve üretim için uygun testler yazma.
  • Testleri kullanarak makine öğrenimi hattınızdaki hata modlarını tespit etme.
  • Üretimde model kalitenizi değerlendirme.

ML Ardışık Düzeni nedir?

Şemada gösterildiği gibi bir makine öğrenimi hattı birkaç bileşenden oluşur. Daha sonra bu bileşenleri tanıyacağız. Şimdilik, "Model"in (siyah kutu) makine öğrenimi için gereken ardışık düzen altyapısının küçük bir parçası olduğunu unutmayın.

Tipik bir makine öğrenimi hattının şeması. Şemada, ardışık düzenin her bileşeni için bir kutu olmak üzere birkaç kutu gösterilir. "Model" etiketli kutu, şemanın merkezindedir. Diğer kutular, "model" kutusunun etrafında düzenlenir. Bu kutular şu şekilde etiketlenir: veri toplama, veri doğrulama, makine kaynağı yönetimi, sunum altyapısı, özellik çıkarma, analiz araçları, işlem yönetimi araçları, yapılandırma ve izleme.
Şekil 1: Tipik bir makine öğrenimi hattının şeması.

ML Ardışık Düzenlerinde Test Rolü

Yazılım geliştirmede, ideal iş akışı test odaklı geliştirmeyi (TDD) takip eder. Ancak makine öğreniminde testlere başlamak kolay değildir. Testleriniz verilerinize, modelinize ve sorununuza bağlıdır. Örneğin, modelinizi eğitmeden önce kaybı doğrulamak için bir test yazamazsınız. Bunun yerine, model geliştirilirken ulaşılabilir bir kayıp keşfeder ve sonrayeni model sürümlerini ulaşılabilir bir kayıpla karşılaştırmalı olarak test edersiniz.

Şunlar için testlere ihtiyacınız vardır:

  • Giriş verileri doğrulanıyor.
  • Özellik mühendisliği doğrulanıyor.
  • Yeni model sürümlerinin kalitesi doğrulanıyor.
  • Sunum altyapısı doğrulanıyor.
  • Ardışık düzen bileşenleri arasındaki entegrasyonu test etme.