मशीन लर्निंग क्या है?

अनुवाद करने वाले ऐप्लिकेशन से लेकर ऑटोनॉमस वाहन तक, कुछ सबसे अहम टेक्नोलॉजी का इस्तेमाल मशीन लर्निंग (एमएल) के ज़रिए की जाती है. इस कोर्स में, एमएल की मुख्य बातों के बारे में बताया गया है.

ML, समस्याओं को हल करने, मुश्किल सवालों का जवाब देने, और नया कॉन्टेंट बनाने का एक नया तरीका देता है. ML, मौसम का अनुमान लगा सकता है, यात्रा में लगने वाले समय का अनुमान लगा सकता है, गानों के सुझाव दे सकता है, वाक्यों को अपने-आप पूरा होने के लिए कह सकता है, लेखों की खास जानकारी दे सकता है, और ऐसी इमेज जनरेट कर सकता है जो पहले कभी न देखी गई हो.

आसान शब्दों में कहें, तो एमएल वह प्रक्रिया है जिसमें किसी सॉफ़्टवेयर को ट्रेनिंग दी जाती है. इसे model कहा जाता है, ताकि काम के अनुमान बनाए जा सकें या डेटा से कॉन्टेंट जनरेट किया जा सके.

उदाहरण के लिए, मान लें कि हमें बारिश का अनुमान लगाने वाला ऐप्लिकेशन बनाना है. इसके लिए हम पारंपरिक तरीके या एमएल (मशीन लर्निंग) वाले तरीके का इस्तेमाल कर सकते हैं. पारंपरिक नज़रिए का इस्तेमाल करते हुए, हम पृथ्वी के वायुमंडल और सतह का भौतिकी के हिसाब से प्रतिनिधित्व करेंगे और बड़ी मात्रा में तरल पदार्थों के समीकरणों की गणना करेंगे. यह बहुत ही मुश्किल है.

मशीन लर्निंग (एमएल) वाले तरीके का इस्तेमाल करके, हम एमएल मॉडल को मौसम की बहुत ज़्यादा मात्रा का डेटा तब तक देते हैं, जब तक कि एमएल मॉडल अलग-अलग मात्रा में बारिश पैदा करने वाले मौसम के पैटर्न के बीच के गणित के हिसाब से सीखता रहता है. इसके बाद, हम मॉडल को मौजूदा मौसम का डेटा देंगे और यह बारिश की मात्रा का अनुमान लगाएगा.

अपनी समझ को जांचें

मशीन लर्निंग में "मॉडल" क्या होता है?
मॉडल, गणित के विषय से जुड़ा ऐसा संबंध है जो डेटा से मिलता है. एमएल सिस्टम, अनुमान लगाने के लिए इस डेटा का इस्तेमाल करता है
मॉडल, कंप्यूटर हार्डवेयर का हिस्सा होता है
मॉडल उस चीज़ का छोटा प्रतिरूप होता है जिसके बारे में पढ़ा जा रहा है.

एमएल सिस्टम के टाइप

एमएल सिस्टम इनमें से एक या उससे ज़्यादा कैटगरी में आते हैं. यह इस बात पर निर्भर करता है कि वे अनुमान लगाने या कॉन्टेंट जनरेट करने का तरीका कैसे सीखते हैं:

  • सुपरवाइज़्ड लर्निंग
  • अनसुपरवाइज़्ड लर्निंग
  • रीइन्फ़ोर्समेंट लर्निंग
  • जनरेटिव एआई

सुपरवाइज़्ड लर्निंग

सुपरवाइज़्ड लर्निंग मॉडल सही जवाब के साथ बहुत सारा डेटा देखने और फिर सही जवाब देने वाले डेटा में एलिमेंट के बीच कनेक्शन का पता लगाने के बाद अनुमान लगा सकता है. यह किसी छात्र/छात्रा की तरह है, क्योंकि वह पुरानी परीक्षाओं को पढ़ता है और इनमें सवाल और जवाब, दोनों शामिल होते हैं. जब छात्र-छात्राओं ने पुरानी परीक्षा पास कर ली हो, तब वह नई परीक्षा देने के लिए तैयार हो जाता है. इन एमएल सिस्टम को इस हिसाब से "निगरानी में" रखा जाता है कि कोई व्यक्ति, एमएल सिस्टम का डेटा सही नतीजों के साथ देता है.

सामान्य तौर पर, माता-पिता की निगरानी वाले मोड में सीखने के दो तरीके हैं, रिग्रेशन और क्लासिफ़िकेशन.

रिग्रेशन

रिग्रेशन मॉडल, संख्या वाली वैल्यू का अनुमान लगाता है. उदाहरण के लिए, इंच या मिलीमीटर में बारिश की मात्रा का अनुमान लगाने वाला मौसम मॉडल, रिग्रेशन मॉडल है.

रिग्रेशन मॉडल के ज़्यादा उदाहरण देखने के लिए, यहां दी गई टेबल देखें:

स्थिति संभावित इनपुट डेटा अंकों में अनुमान
फ़्यूचर हाउस की कीमत वर्ग फ़ुटेज, पिन कोड, बेडरूम और बाथरूम की संख्या, लॉट साइज़, गिरवी रखने की ब्याज दर, प्रॉपर्टी पर लगने वाले टैक्स की दर, निर्माण की लागत, और उस इलाके में बिक्री के लिए उपलब्ध घरों की संख्या. होम की कीमत.
अगली राइड का समय ट्रैफ़िक का पुराना डेटा (स्मार्टफ़ोन, ट्रैफ़िक सेंसर, राइड-हाइलिंग, और दूसरे नेविगेशन ऐप्लिकेशन से इकट्ठा किया गया डेटा), डेस्टिनेशन से दूरी, और मौसम की जानकारी. किसी मंज़िल पर पहुंचने में लगने वाला समय, मिनट और सेकंड में.

कैटगरी

क्लासिफ़िकेशन मॉडल इस बात की संभावना का अनुमान लगाते हैं कि कोई चीज़ किसी कैटगरी से जुड़ी है. रिग्रेशन मॉडल से अलग, जिसका आउटपुट एक संख्या होती है, क्लासिफ़िकेशन मॉडल एक वैल्यू दिखाते हैं. इससे पता चलता है कि कोई चीज़ किसी खास कैटगरी से जुड़ी है या नहीं. उदाहरण के लिए, क्लासिफ़िकेशन मॉडल का इस्तेमाल यह अनुमान लगाने के लिए किया जाता है कि किसी ईमेल में स्पैम है या फ़ोटो में बिल्ली है.

क्लासिफ़िकेशन मॉडल को दो ग्रुप में बांटा जाता है: बाइनरी कैटगरी और मल्टीक्लास क्लासिफ़िकेशन. बाइनरी क्लासिफ़िकेशन मॉडल, ऐसी क्लास से वैल्यू दिखाते हैं जिसमें सिर्फ़ दो वैल्यू होती हैं. उदाहरण के लिए, ऐसा मॉडल जो rain या no rain देता है. मल्टी-क्लास क्लासिफ़िकेशन मॉडल, ऐसी क्लास से कोई वैल्यू देते हैं जिसमें दो से ज़्यादा वैल्यू होती हैं. उदाहरण के लिए, ऐसा मॉडल जो rain, hail, snow या sleet का आउटपुट दे सकता है.

अपनी समझ को जांचें

अगर आपको व्यावसायिक इमारतों में ऊर्जा की खपत का अनुमान लगाने के लिए, मशीन लर्निंग मॉडल का इस्तेमाल करना है, तो किस तरह का मॉडल इस्तेमाल किया जा सकता है?
रिग्रेशन
ऊर्जा की खपत को किलोवाटघंटे (kWh) में मापा जाता है. यह एक संख्या है, इसलिए रिग्रेशन मॉडल का इस्तेमाल करना चाहिए.
कैटगरी
क्लासिफ़िकेशन मॉडल यह अनुमान लगाते हैं कि कोई चीज़ किसी कैटगरी से जुड़ी है या नहीं. वहीं, रिग्रेशन मॉडल किसी संख्या का अनुमान लगाते हैं. ऊर्जा की खपत, किलोवाट-घंटे (kWh) में मापी जाती है. यह एक संख्या होती है, इसलिए आपको रिग्रेशन मॉडल का इस्तेमाल करना चाहिए.

अनसुपरवाइज़्ड लर्निंग

बिना निगरानी वाले लर्निंग मॉडल, ऐसे डेटा को इस्तेमाल करके अनुमान लगाते हैं जिसमें कोई सही जवाब नहीं होता. बिना निगरानी वाले लर्निंग मॉडल का मकसद, डेटा के सही पैटर्न की पहचान करना है. दूसरे शब्दों में कहें, तो मॉडल में डेटा के हर हिस्से को कैटगरी में बांटने के तरीके के बारे में कोई संकेत नहीं होता, बल्कि उसे अपने नियमों का अनुमान लगाना चाहिए.

आम तौर पर इस्तेमाल किया जाने वाला, बिना निगरानी वाला लर्निंग मॉडल, जिसमें एक तकनीक का इस्तेमाल किया जाता है क्लस्टरिंग. यह मॉडल ऐसे डेटा पॉइंट खोजता है जो प्राकृतिक ग्रुप को तय करते हैं.

क्लस्टर में रंगीन बिंदु दिखाने वाली इमेज.

पहला डायग्राम. एक जैसे डेटा पॉइंट को क्लस्टर करने वाला एमएल मॉडल.

एक इमेज, जिसमें क्लस्टर में रंगीन बिंदु दिख रहे हैं. ये बिंदु एक-दूसरे के आकार में बंद हैं और एक-दूसरे के बॉर्डर में हैं.

दूसरा डायग्राम. ऐसे क्लस्टर के ग्रुप जो प्राकृतिक रूप से अलग-अलग हैं.

क्लस्टरिंग, क्लासिफ़िकेशन से अलग होती है, क्योंकि कैटगरी तय नहीं की जातीं. उदाहरण के लिए, बिना निगरानी वाला मॉडल, तापमान के आधार पर मौसम के डेटासेट को क्लस्टर कर सकता है. इससे, मौसमों को बताने वाले सेगमेंट का पता चलता है. इसके बाद, डेटासेट की समझ के हिसाब से उन क्लस्टर को नाम देने की कोशिश की जा सकती है.

क्लस्टर में रंगीन बिंदुओं को दिखाने वाली इमेज जिन्हें बर्फ़, बारिश, ओले, और नहीं बारिश के तौर पर लेबल किया गया है.

तीसरी इमेज. एक एमएल मॉडल, जो एक जैसे मौसम के पैटर्न को दिखाता है.

अलग-अलग क्लस्टर में रंगीन बिंदुओं को दिखाने वाली इमेज. इन बिंदुओं पर बर्फ़, बारिश, ओले, और कोई बारिश न होने का लेबल दिया गया है. ये बिंदु एक-दूसरे के आकार में दिख रहे हैं और बॉर्डर में लगे हैं.

चौथा डायग्राम. मौसम के अलग-अलग पैटर्न जिन्हें बारिश, बारिश, बारिश, और बर्फ़बारी के तौर पर लेबल किया गया है.

अपनी समझ को जांचें

निगरानी में रखे गए तरीके और बिना निगरानी वाले तरीके में क्या अंतर है?
निगरानी में रखे गए तरीके को ऐसा डेटा दिया जाता है जिसमें सही जवाब होता है.
निगरानी में रखे गए तरीके को ऐसा डेटा दिया जाता है जिसमें सही जवाब होता है. इस मॉडल का काम, सही जवाब देने वाले डेटा के कनेक्शन ढूंढना है. बिना निगरानी वाले तरीके को सही जवाब के बिना डेटा दिया जाता है. इसका काम, डेटा को ग्रुप में बांटना है.
निगरानी में रखा गया तरीका, आम तौर पर क्लस्टरिंग का इस्तेमाल करता है.
बिना निगरानी वाला तरीका, क्लस्टरिंग का इस्तेमाल करता है.
बिना निगरानी वाले तरीके को, डेटा के क्लस्टर को लेबल करने का तरीका पता है.
बिना निगरानी वाले तरीके से, डेटा के क्लस्टर का मतलब नहीं पता चलता. डेटा की आपकी समझ के आधार पर, उनका अनुमान लगाना आपके ऊपर निर्भर करता है.

रीइन्फ़ोर्समेंट लर्निंग

रीइन्फ़ोर्समेंट लर्निंग मॉडल, किसी एनवायरमेंट में की गई कार्रवाइयों के आधार पर इनाम या पाबंदियों का अनुमान लगाकर अनुमान लगाता है. रीइन्फ़ोर्समेंट लर्निंग सिस्टम से ऐसी नीति जनरेट होती है जो ज़्यादा से ज़्यादा इनाम पाने के लिए सबसे अच्छी रणनीति बताती है.

रीइन्फ़ोर्समेंट लर्निंग का इस्तेमाल रोबोट को टास्क पूरा करने की ट्रेनिंग देने के लिए किया जाता है. जैसे, किसी कमरे में घूमना-फिरना और Go का गेम खेलने के लिए AlphaGo जैसे सॉफ़्टवेयर प्रोग्राम का इस्तेमाल करना.

जनरेटिव एआई

जनरेटिव एआई ऐसे मॉडल की कैटगरी है जो उपयोगकर्ता के इनपुट से कॉन्टेंट बनाता है. उदाहरण के लिए, जनरेटिव एआई नई इमेज, म्यूज़िक कंपोज़िशन, और चुटकुले बना सकता है. यह लेखों की खास जानकारी दे सकता है, टास्क करने का तरीक़ा बता सकता है या किसी फ़ोटो में बदलाव कर सकता है.

जनरेटिव एआई कई तरह के इनपुट लेकर कई तरह के आउटपुट बना सकता है, जैसे कि टेक्स्ट, इमेज, ऑडियो, और वीडियो. यह इनका कॉम्बिनेशन भी ले सकती है और बना सकती है. उदाहरण के लिए, कोई मॉडल इनपुट के रूप में कोई इमेज लेकर, आउटपुट के तौर पर कोई इमेज और टेक्स्ट बना सकता है या किसी इमेज और टेक्स्ट को इनपुट के तौर पर ले सकता है और एक आउटपुट के तौर पर वीडियो बना सकता है.

हम जनरेटिव मॉडल की चर्चा उनके इनपुट और आउटपुट से कर सकते हैं. आम तौर पर, इसे "इनपुट का टाइप" से "आउटपुट" टाइप के तौर पर लिखा जाता है. उदाहरण के लिए, यहां जनरेटिव मॉडल के लिए कुछ इनपुट और आउटपुट की आंशिक सूची दी गई है:

  • टेक्स्ट से टेक्स्ट
  • टेक्स्ट-टू-इमेज
  • टेक्स्ट-टू-वीडियो
  • टेक्स्ट से कोड
  • लिखाई को बोली में बदलें
  • इमेज और टेक्स्ट-टू-इमेज

इस टेबल में, जनरेटिव मॉडल के उदाहरण, उनके इनपुट, और उनसे मिलने वाले संभावित आउटपुट के उदाहरण दिए गए हैं:

मॉडल इनपुट आउटपुट का उदाहरण
टेक्स्ट से टेक्स्ट ले मैंस नस्ल का आविष्कार किसने किया? 24 आवर्स ऑफ़ ले मैंस की स्थापना ऑटोमोबाइल क्लब दे लुएस्ट (एसीओ) ने की थी. यह मोटरिंग से जुड़ा संगठन 1906 में बना था. पहली रेस 26 और 27 मई, 1923 को फ़्रांस के ले मैंस शहर के पास 13.426 किलोमीटर (8.345 मील) लंबे रोड सर्किट, सार्थ सर्किट में आयोजित की गई थी. इस रेस की शुरुआत मूल रूप से एसीओ और सार्थे इलाके का प्रचार करने के लिए की गई थी.
सोर्स: Bard
टेक्स्ट-टू-इमेज पोर्टल में तैरता हुआ एक एलियन ऑक्टोपस, जो अखबार पढ़ रहा है. ऑक्टोपस कार्टून की इमेज.
सोर्स: Imagen
टेक्स्ट-टू-वीडियो सैन फ़्रांसिस्को में एक फ़ोटोरियलिस्टिक टेडी बीयर समुद्र में तैर रहा है. टेडी बीयर पानी के अंदर जाता है. टेडी बीयर, पानी के नीचे रंग-बिरंगी मछलियों के साथ तैरता रहता है. पांडा भालू पानी के नीचे तैर रहा है. पानी में तैरते हुए टेडी बीयर का वीडियो.
सोर्स: फ़ेनाकी
टेक्स्ट से कोड ऐसा Python लूप लिखें जो संख्याओं की सूची के ऊपर लूप करता हो और अभाज्य संख्याओं को प्रिंट करता हो.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

सोर्स: Bard
इमेज-टू-टेक्स्ट राजहंस (फ़्लमिंगो) की इमेज. यह राजहंस है. ये कैरिबियन में पाए जाते हैं.
सोर्स: Google DeepMind

जनरेटिव एआई कैसे काम करता है? हाई-लेवल पर, जनरेटिव मॉडल, डेटा के पैटर्न को सीखते हैं. इन पैटर्न का मकसद, नया, लेकिन मिलता-जुलता डेटा तैयार करना होता है. जनरेटिव मॉडल कुछ ऐसे होते हैं:

  • कॉमेडियन, जो लोगों के बर्ताव और बोलने की शैली को देखकर, दूसरों की नकल करना सीखते हैं
  • ऐसे कलाकार जो किसी खास शैली की बहुत सारी पेंटिंग देखकर, किसी खास शैली की पेंटिंग बनाना सीखते हैं
  • ऐसे बैंड कवर करें जो उस ग्रुप के बहुत सारे संगीत को सुनकर एक खास म्यूज़िक ग्रुप की तरह सुनना सीखते हैं

यूनीक और क्रिएटिव आउटपुट बनाने के लिए, जनरेटिव मॉडल को शुरुआत में बिना निगरानी वाले तरीके का इस्तेमाल करके ट्रेनिंग दी जाती है. इस प्रोसेस में, मॉडल उस डेटा की नकल करना सीखता है जिस पर ट्रेनिंग दी गई है. कभी-कभी इस मॉडल को निगरानी में रखा गया या रीइन्फ़ोर्समेंट लर्निंग का इस्तेमाल करके, ऐसे कामों से जुड़े खास डेटा के आधार पर ट्रेनिंग दी जाती है जिन्हें करने के लिए मॉडल को कहा जा सकता है. उदाहरण के लिए, किसी लेख की खास जानकारी देना या किसी फ़ोटो में बदलाव करना.

जनरेटिव एआई एक तेज़ी से विकास करने वाली टेक्नोलॉजी है. इसमें इस्तेमाल के नए उदाहरण लगातार खोजे जा रहे हैं. उदाहरण के लिए, जनरेटिव मॉडल की मदद से, कारोबारों को ई-कॉमर्स प्रॉडक्ट की इमेज को बेहतर बनाने में मदद मिल रही है. इसके लिए, वे ध्यान भटकाने वाले बैकग्राउंड को अपने-आप हटा देते हैं या लो-रिज़ॉल्यूशन वाली इमेज की क्वालिटी को बेहतर बनाते हैं.