Makine öğrenimi ardışık düzenlerinizi üretime hazırlamak için aşağıdakileri yapmanız gerekir:
- Ardışık düzenleriniz için işlem kaynakları sağlama
- Günlüğe kaydetme, izleme ve uyarı özelliklerini uygulama
İşlem kaynaklarını sağlama
Makine öğrenimi işlem hatlarını çalıştırmak için RAM, CPU ve GPU/TPU gibi işlem kaynakları gerekir. Yeterli işlem gücü olmadan işlem hatlarınızı çalıştıramazsınız. Bu nedenle, işlem hatlarınızın üretimde çalışması için gereken kaynakları sağlamak üzere yeterli kotayı aldığınızdan emin olun.
Sunma, eğitim ve doğrulama ardışık düzenleri. Bu işlem hatları için TPU, GPU veya CPU gerekir. Kullanım alanınıza bağlı olarak farklı donanımlarda eğitim ve yayın yapabilir veya aynı donanımı kullanabilirsiniz. Örneğin, eğitim CPU'larda gerçekleşebilir ancak sunumda TPU'lar kullanılabilir veya bunun tam tersi de geçerli olabilir. Genel olarak, daha büyük donanımlarda eğitim yapmak ve ardından daha küçük donanımlarda yayınlamak yaygın bir uygulamadır.
Donanım seçerken aşağıdakileri göz önünde bulundurun:
- Daha ucuz donanımlarda eğitim yapabilir misiniz?
- Farklı bir donanıma geçiş yapmak performansı artırır mı?
- Modelin boyutu nedir ve hangi donanım performansı optimize eder?
- Modelinizin mimarisine göre hangi donanım idealdir?
Veri ardışık düzenleri. Veri ardışık düzenleri için RAM ve CPU kotası Ardışık düzeninizin eğitim ve test veri kümeleri oluşturmak için ne kadar kota gerektiğini tahmin etmeniz gerekir.
Her işlem hattı için kota ayırmayabilirsiniz. Bunun yerine, işlem hatlarının paylaştığı kotayı ayırabilirsiniz. Bu gibi durumlarda, tüm işlem hatlarınızı çalıştırmak için yeterli kotanız olduğunu doğrulayın ve tek bir hatalı işlem hattının tüm kotayı tüketmesini önlemek için izleme ve uyarı ayarlayın.
Kotayı tahmin etme
Veri ve eğitim işlem hatları için ihtiyacınız olacak kotayı tahmin etmek üzere tahminlerinizi temel alacağınız benzer projeler bulun. Yayınlama kotasını tahmin etmek için hizmetin saniyedeki sorgu sayısını tahmin etmeye çalışın. Bu yöntemler bir temel oluşturur. Deneme aşamasında bir çözümün prototipini oluşturmaya başladığınızda daha kesin bir kota tahmini almaya başlarsınız.
Kotayı tahmin ederken yalnızca üretim işlem hatlarınızın değil, devam eden denemelerin de kotasını hesaba katmayı unutmayın.
Anlayıp anlamadığınızı kontrol etme
Günlük kaydı, izleme ve uyarılar
Bir üretim modelinin davranışını günlüğe kaydetmek ve izlemek çok önemlidir. Güçlü bir izleme altyapısı, modellerinizin güvenilir ve yüksek kaliteli tahminler sunduğunu onaylar.
İyi günlük kaydı ve izleme uygulamaları, makine öğrenimi işlem hatlarındaki sorunları proaktif olarak belirlemeye ve olası iş etkilerini azaltmaya yardımcı olur. Sorunlar oluştuğunda uyarılar ekibinizin üyelerini bilgilendirir ve kapsamlı günlükler, sorunun temel nedeninin teşhis edilmesini kolaylaştırır.
ML ardışık düzenleriyle ilgili aşağıdaki sorunları tespit etmek için günlüğe kaydetme ve izleme işlemlerini uygulamanız gerekir:
Pipeline | Gözle |
---|---|
Sunma |
|
Veriler |
|
Eğitim |
|
Doğrulama |
|
Ayrıca aşağıdakiler için günlük kaydı, izleme ve uyarı özelliklerini de kullanmak isteyebilirsiniz:
- Gecikme. Tahminlerin sunulması ne kadar sürer?
- Kesintiler. Model tahmin sunmayı durdurdu mu?
Anlayıp anlamadığınızı kontrol etme
Model dağıtma
Model dağıtımı için aşağıdakileri belgelemeniz gerekir:
- Dağıtımı başlatmak ve kullanıma sunma hızını artırmak için onaylar gerekir.
- Modeli üretime alma
- Modelin dağıtıldığı yer (ör. hazırlama veya kanarya ortamları varsa).
- Dağıtım başarısız olursa ne yapmanız gerekir?
- Üretimde olan bir modeli nasıl geri alacağınızı öğrenin.
Model eğitimini otomatikleştirdikten sonra doğrulama ve dağıtımı da otomatikleştirmek isteyebilirsiniz. Dağıtımların otomatikleştirilmesi sorumluluğu dağıtır ve dağıtımın tek bir kişi tarafından engellenme olasılığını azaltır. Ayrıca olası hataları azaltır, verimliliği ve güvenilirliği artırır, nöbetçi rotasyonlarına ve SRE desteğine olanak tanır.
Genellikle, modelin beklendiği gibi çalıştığını kontrol etmek için yeni modelleri bir kullanıcı alt kümesine dağıtırsınız. Öyleyse dağıtıma devam edin. Bu durumda, dağıtımı geri alıp sorunları teşhis etmeye ve hatalarını ayıklamaya başlarsınız.