Prodüksiyon

Makine öğrenimi ardışık düzenlerinizi üretime hazırlamak için aşağıdakileri yapmanız gerekir:

  • Ardışık düzenleriniz için işlem kaynakları sağlama
  • Günlüğe kaydetme, izleme ve uyarı özelliklerini uygulama

İşlem kaynaklarını sağlama

Makine öğrenimi işlem hatlarını çalıştırmak için RAM, CPU ve GPU/TPU gibi işlem kaynakları gerekir. Yeterli işlem gücü olmadan işlem hatlarınızı çalıştıramazsınız. Bu nedenle, işlem hatlarınızın üretimde çalışması için gereken kaynakları sağlamak üzere yeterli kotayı aldığınızdan emin olun.

  • Sunma, eğitim ve doğrulama ardışık düzenleri. Bu işlem hatları için TPU, GPU veya CPU gerekir. Kullanım alanınıza bağlı olarak farklı donanımlarda eğitim ve yayın yapabilir veya aynı donanımı kullanabilirsiniz. Örneğin, eğitim CPU'larda gerçekleşebilir ancak sunumda TPU'lar kullanılabilir veya bunun tam tersi de geçerli olabilir. Genel olarak, daha büyük donanımlarda eğitim yapmak ve ardından daha küçük donanımlarda yayınlamak yaygın bir uygulamadır.

    Donanım seçerken aşağıdakileri göz önünde bulundurun:

    • Daha ucuz donanımlarda eğitim yapabilir misiniz?
    • Farklı bir donanıma geçiş yapmak performansı artırır mı?
    • Modelin boyutu nedir ve hangi donanım performansı optimize eder?
    • Modelinizin mimarisine göre hangi donanım idealdir?
  • Veri ardışık düzenleri. Veri ardışık düzenleri için RAM ve CPU kotası Ardışık düzeninizin eğitim ve test veri kümeleri oluşturmak için ne kadar kota gerektiğini tahmin etmeniz gerekir.

Her işlem hattı için kota ayırmayabilirsiniz. Bunun yerine, işlem hatlarının paylaştığı kotayı ayırabilirsiniz. Bu gibi durumlarda, tüm işlem hatlarınızı çalıştırmak için yeterli kotanız olduğunu doğrulayın ve tek bir hatalı işlem hattının tüm kotayı tüketmesini önlemek için izleme ve uyarı ayarlayın.

Kotayı tahmin etme

Veri ve eğitim işlem hatları için ihtiyacınız olacak kotayı tahmin etmek üzere tahminlerinizi temel alacağınız benzer projeler bulun. Yayınlama kotasını tahmin etmek için hizmetin saniyedeki sorgu sayısını tahmin etmeye çalışın. Bu yöntemler bir temel oluşturur. Deneme aşamasında bir çözümün prototipini oluşturmaya başladığınızda daha kesin bir kota tahmini almaya başlarsınız.

Kotayı tahmin ederken yalnızca üretim işlem hatlarınızın değil, devam eden denemelerin de kotasını hesaba katmayı unutmayın.

Anlayıp anlamadığınızı kontrol etme

Tahmin sunmak için donanım seçerken her zaman modeli eğitmek için kullanılan donanımdan daha güçlü bir donanım seçmelisiniz.
Yanlış
Doğru. Genellikle eğitim için hizmet sunmaya kıyasla daha büyük bir donanım gerekir.
Doğru

Günlük kaydı, izleme ve uyarılar

Bir üretim modelinin davranışını günlüğe kaydetmek ve izlemek çok önemlidir. Güçlü bir izleme altyapısı, modellerinizin güvenilir ve yüksek kaliteli tahminler sunduğunu onaylar.

İyi günlük kaydı ve izleme uygulamaları, makine öğrenimi işlem hatlarındaki sorunları proaktif olarak belirlemeye ve olası iş etkilerini azaltmaya yardımcı olur. Sorunlar oluştuğunda uyarılar ekibinizin üyelerini bilgilendirir ve kapsamlı günlükler, sorunun temel nedeninin teşhis edilmesini kolaylaştırır.

ML ardışık düzenleriyle ilgili aşağıdaki sorunları tespit etmek için günlüğe kaydetme ve izleme işlemlerini uygulamanız gerekir:

Pipeline Gözle
Sunma
  • Yayın verilerinde eğitim verilerine kıyasla oluşan çarpıklıklar veya kaymalar
  • Tahminlerdeki çarpıklıklar veya sapmalar
  • Eksik veya bozuk değerler gibi veri türü sorunları
  • Kota kullanımı
  • Model kalitesi metrikleri
Veriler
  • Özellik değerlerindeki çarpıklıklar ve kaymalar
  • Etiket değerlerindeki çarpıklıklar ve kaymalar
  • Eksik veya bozuk değerler gibi veri türü sorunları
  • Kota kullanım oranı
  • Kota sınırına ulaşılmak üzere
Eğitim
  • Eğitim süresi
  • Eğitim hataları
  • Kota kullanımı
Doğrulama
  • Test veri kümelerindeki çarpıklık veya kayma

Ayrıca aşağıdakiler için günlük kaydı, izleme ve uyarı özelliklerini de kullanmak isteyebilirsiniz:

  • Gecikme. Tahminlerin sunulması ne kadar sürer?
  • Kesintiler. Model tahmin sunmayı durdurdu mu?

Anlayıp anlamadığınızı kontrol etme

Aşağıdakilerden hangisi makine öğrenimi işlem hatlarınızı günlüğe kaydetmenin ve izlemenin temel nedenidir?
Sorunları kullanıcıları etkilemeden önce proaktif olarak tespit edin
Kota ve kaynak kullanımını izleme
Olası güvenlik sorunlarını belirleme
Yukarıdakilerin tümü
Doğru. Makine öğrenimi işlem hatlarınızı günlüğe kaydetmek ve izlemek, sorunların ciddi hale gelmeden önce önlenmesine ve teşhis edilmesine yardımcı olur.

Model dağıtma

Model dağıtımı için aşağıdakileri belgelemeniz gerekir:

  • Dağıtımı başlatmak ve kullanıma sunma hızını artırmak için onaylar gerekir.
  • Modeli üretime alma
  • Modelin dağıtıldığı yer (ör. hazırlama veya kanarya ortamları varsa).
  • Dağıtım başarısız olursa ne yapmanız gerekir?
  • Üretimde olan bir modeli nasıl geri alacağınızı öğrenin.

Model eğitimini otomatikleştirdikten sonra doğrulama ve dağıtımı da otomatikleştirmek isteyebilirsiniz. Dağıtımların otomatikleştirilmesi sorumluluğu dağıtır ve dağıtımın tek bir kişi tarafından engellenme olasılığını azaltır. Ayrıca olası hataları azaltır, verimliliği ve güvenilirliği artırır, nöbetçi rotasyonlarına ve SRE desteğine olanak tanır.

Genellikle, modelin beklendiği gibi çalıştığını kontrol etmek için yeni modelleri bir kullanıcı alt kümesine dağıtırsınız. Öyleyse dağıtıma devam edin. Bu durumda, dağıtımı geri alıp sorunları teşhis etmeye ve hatalarını ayıklamaya başlarsınız.