मशीन लर्निंग मॉडल डिप्लॉय करने की जांच

आप डिप्लॉय करने के लिए तैयार हैं! अगर सिर्फ़ किसी मॉडल को डिप्लॉय करना, लाल रंग के बड़े बटन को दबाने जितना आसान है, तो डिप्लॉय करते समय, आप चाहते हैं कि आपकी पाइपलाइन चले, अपडेट हो और बिना किसी रुकावट के काम करे. इन ज़रूरी शर्तों की वजह से, इस पेज पर बताई गई ज़रूरी शर्तें और समाधान होते हैं.

फिर से जनरेट की जा सकने वाली ट्रेनिंग के साथ मॉडल से जुड़े अपडेट की जांच करना

कोई बात नहीं कि आप यूनिकॉर्न के दिखने वाले पूर्वानुमान को लगातार बेहतर बनाना चाहते हैं. मान लें कि आप "दिन के समय" सुविधा के लिए फ़ीचर इंजीनियरिंग कोड को रीफ़ैक्टर करते हैं. आप कैसे जांच करते हैं कि कोड सही है? अपने मॉडल को फिर से ट्रेनिंग देने का फ़ैसला लें और देखें कि क्या आपको वही नतीजा मिलता है. अरे नहीं, आप पाते हैं कि आपके मॉडल की ट्रेनिंग को फिर से इस्तेमाल नहीं किया जा सकता. इसका पता लगाने के लिए, यूनिकॉर्न के दिखने के तरीके को बेहतर बनाना जारी रखा जाता है. इसके बाद, आगे की जांच करें. आप इन तरीकों को अपनाकर पता लगा सकते हैं कि प्रजनन फिर से हो सकती है:

  • न्यूमेरिक नंबर जनरेट करता है (आरएनजी). ज़्यादा जानकारी के लिए, एमएल कोर्स की डेटा प्रिपरेशन और फ़ीचर इंजीनियरिंग से, डेटा जनरेट करने में बदलाव देखें.

  • मॉडल के कॉम्पोनेंट को तय किए गए क्रम में शुरू करें, ताकि यह पक्का किया जा सके कि हर रन पर आरएनजी से कॉम्पोनेंट को एक जैसा रैंडम नंबर मिले. ML लाइब्रेरी आम तौर पर इस ज़रूरत को अपने-आप मैनेज करती हैं.

  • मॉडल के औसत कई रन.

  • शुरुआती बार के लिए भी वर्शन कंट्रोल का इस्तेमाल करें. इससे अपने मॉडल या पाइपलाइन की जांच करते समय, कोड और पैरामीटर को पिन किया जा सकता है.

ये कदम उठाने के बाद भी, आपके पास ऐसे अन्य तरीके हो सकते हैं जो तय नहीं हैं.

खास जानकारी और एपीआई कॉल के लिए मॉडल अपडेट की जांच की जा रही है

अपने मॉडल को यूनिकॉर्न पूर्वानुमान आइए, इसका तरीका पढ़ें.

एपीआई कॉल को टेस्ट किया जा रहा है

आप एपीआई कॉल में हुए अपडेट की जांच कैसे करते हैं? आप अपने मॉडल को फिर से पहचानना सीख सकते हैं, लेकिन यह तेज़ काम है. इसके बजाय, रैंडम इनपुट डेटा जनरेट करने के लिए, एक यूनिट टेस्ट लिखें और ग्रेडिएंट डाउन का एक चरण चलाएं. आप चाहते हैं कि रनटाइम की गड़बड़ियों के बिना यह चरण पूरा हो जाए.

एल्गोरिदम के सही होने की जांच करना

मॉडल का अनुमान सही तरीके से नहीं लगाना चाहिए, बल्कि ऐसा इसलिए करना चाहिए, क्योंकि यह एल्गोरिदम के हिसाब से सही होता है, न कि भाग्यशाली. उदाहरण के लिए, अगर 99% ईमेल स्पैम नहीं हैं, तो सभी ईमेल को 'स्पैम नहीं' की कैटगरी में रखने से, 99% सटीक ईमेल मिल सकता है. इसलिए, आपको एल्गोरिदम के सही होने की जांच करने के लिए अपना मॉडल देखना होगा. यह तरीका अपनाएं:

  • अपने मॉडल को कुछ बार दोहराने के लिए प्रशिक्षित करें और पुष्टि करें कि नुकसान कम होता है.
  • अपने एल्गोरिदम को ट्रेनिंग दें. अगर आपका मॉडल काफ़ी जटिल है, तो यह ट्रेनिंग के डेटा को याद रखेगा और आपकी ट्रेनिंग के दौरान उसका खोने का आंकड़ा 0 के करीब होगा.
  • अपने एल्गोरिदम के लिए खास तौर पर बने आंकड़ों की जांच करें. उदाहरण के लिए, आप यह जांच सकते हैं कि आपके आरएनएन का एक हिस्सा, इनपुट डेटा के हर एलिमेंट के लिए एक बार चलता है.

पाइपलाइन कॉम्पोनेंट के लिए इंटिग्रेशन टेस्ट लिखें

एमएल पाइपलाइन में, एक कॉम्पोनेंट में बदलाव होने पर, दूसरे कॉम्पोनेंट में गड़बड़ियां हो सकती हैं. पूरे पाइपलाइन को शुरू से आखिर तक चलाने के लिए, कोई टेस्ट लिखें. इस तरह के टेस्ट को इंटिग्रेशन टेस्ट कहा जाता है.

इंटिग्रेशन के टेस्ट लगातार चलाने के अलावा, आपको नए मॉडल और नए सॉफ़्टवेयर वर्शन को पुश करते समय इंटिग्रेशन की जांच भी करनी चाहिए. पूरे सिस्टम को चलाने की धीमी रफ़्तार से, इंटिग्रेशन की जांच लगातार होती रहती है. इंटिग्रेशन तेज़ी से चलाने के लिए, डेटा के सबसेट पर या आसान मॉडल की मदद से ट्रेनिंग करें. विवरण आपके मॉडल और डेटा पर निर्भर करता है. लगातार कवरेज पाने के लिए, आपको अपने तेज़ टेस्ट में बदलाव करना होगा, ताकि वे मॉडल या सॉफ़्टवेयर के हर नए वर्शन पर चल सकें. तब तक, आपके धीमे टेस्ट बैकग्राउंड में लगातार चलते रहेंगे.

पेश करने से पहले मॉडल की क्वालिटी की पुष्टि करें

किसी नए मॉडल को प्रोडक्शन में भेजने से पहले, क्वालिटी में इन दो तरह के गिरावटों की जांच करें:

  • अचानक गिरावट: नए वर्शन में किसी गड़बड़ी की वजह से क्वालिटी बहुत खराब हो सकती है. नए वर्शन की पुष्टि करने के लिए, पिछले वर्शन की क्वालिटी देखें.

  • धीमी गिरावट: हो सकता है कि अचानक गिरावट के लिए किए गए आपके टेस्ट में, कई वर्शन के लिए मॉडल की क्वालिटी में धीमी गिरावट का पता न चले. इसके बजाय, पक्का करें कि पुष्टि करने वाले डेटासेट पर आपके मॉडल के अनुमान पहले से तय एक शर्त को पूरा करते हैं. अगर पुष्टि करने वाला आपका डेटासेट लाइव डेटा से अलग हो जाता है, तो पुष्टि करने वाला डेटासेट अपडेट करें. साथ ही, पक्का करें कि आपका मॉडल अब भी क्वालिटी थ्रेशोल्ड के मुताबिक हो.

मॉडल करने से पहले मॉडल-इंफ़्रापैबिलिटी की पुष्टि करना

अगर आपके मॉडल को आपके सर्वर से ज़्यादा तेज़ी से अपडेट किया जाता है, तो आपके मॉडल में आपके सर्वर से अलग सॉफ़्टवेयर डिपेंडेंसी हो सकती हैं, जिसकी वजह से समस्याएं हो सकती हैं. पक्का करें कि मॉडल के इस्तेमाल किए गए ऑपरेशन, सर्वर पर मौजूद हों.