मशीन लर्निंग क्या है?

मशीन लर्निंग (एमएल), हमारी इस्तेमाल की जाने वाली कुछ सबसे अहम टेक्नोलॉजी को बेहतर बनाती है. जैसे, अनुवाद करने वाले ऐप्लिकेशन से लेकर बिना ड्राइवर के चलने वाली गाड़ियां. इस कोर्स में, एमएल के मुख्य सिद्धांतों के बारे में बताया गया है.

एमएल, समस्याओं को हल करने, मुश्किल सवालों के जवाब देने, और नया कॉन्टेंट बनाने का एक नया तरीका उपलब्ध कराती है. एमएल से मौसम का अनुमान लगाया जा सकता है, यात्रा में लगने वाले समय का अनुमान लगाया जा सकता है, गानों के सुझाव दिए जा सकते हैं, वाक्यों को अपने-आप पूरा किया जा सकता है, लेखों की खास जानकारी दी जा सकती है, और ऐसी इमेज जनरेट की जा सकती हैं जो पहले कभी नहीं देखी गई हों.

आसान शब्दों में कहें, तो एमएल एक ऐसी प्रोसेस है जिसमें किसी सॉफ़्टवेयर को ट्रेन किया जाता है. इस सॉफ़्टवेयर को मॉडल कहा जाता है. इसे डेटा से काम के अनुमान लगाने या कॉन्टेंट (जैसे, टेक्स्ट, इमेज, ऑडियो या वीडियो) जनरेट करने के लिए ट्रेन किया जाता है.

उदाहरण के लिए, मान लें कि हमें बारिश का अनुमान लगाने वाला ऐप्लिकेशन बनाना है. हम पारंपरिक या एमएल अप्रोच का इस्तेमाल कर सकते हैं. पारंपरिक तरीके का इस्तेमाल करके, हम पृथ्वी के वायुमंडल और सतह का फ़िज़िक्स पर आधारित मॉडल बनाते हैं. इसके लिए, हम फ़्लूड डायनेमिक्स के कई समीकरणों को हल करते हैं. यह बहुत मुश्किल है.

एमएल के तरीके का इस्तेमाल करके, हम एमएल मॉडल को मौसम का बहुत सारा डेटा देते हैं. ऐसा तब तक किया जाता है, जब तक एमएल मॉडल, बारिश की अलग-अलग मात्रा के लिए ज़िम्मेदार मौसम के पैटर्न के बीच गणितीय संबंध को समझ न ले. इसके बाद, हम मॉडल को मौसम का मौजूदा डेटा देंगे. इससे मॉडल, बारिश की मात्रा का अनुमान लगाएगा.

देखें कि आपको कितना समझ आया

मशीन लर्निंग में "मॉडल" क्या होता है?
मॉडल, डेटा से मिला एक गणितीय संबंध होता है. एमएल सिस्टम इसका इस्तेमाल अनुमान लगाने के लिए करता है
मॉडल, कंप्यूटर हार्डवेयर का एक हिस्सा होता है
मॉडल, उस चीज़ का छोटा रूप होता है जिसके बारे में आपको जानकारी चाहिए.

एमएल सिस्टम के टाइप

मशीन लर्निंग सिस्टम को, अनुमान लगाने या कॉन्टेंट जनरेट करने के तरीके के आधार पर, इनमें से एक या ज़्यादा कैटगरी में बांटा जाता है:

  • सुपरवाइज़्ड लर्निंग
  • अनसुपरवाइज़्ड लर्निंग
  • रीइन्फ़ोर्समेंट लर्निंग
  • जनरेटिव एआई

सुपरवाइज़्ड लर्निंग

पर्यवेक्षित लर्निंग वाले मॉडल, सही जवाबों के साथ बहुत सारा डेटा देखने के बाद अनुमान लगा सकते हैं. इसके बाद, वे डेटा में मौजूद उन एलिमेंट के बीच कनेक्शन ढूंढते हैं जिनसे सही जवाब मिलते हैं. यह ठीक वैसा ही है जैसे कोई छात्र-छात्रा, पुराने पेपर पढ़कर नया कॉन्टेंट सीखती है. इन पेपर में सवाल और जवाब दोनों शामिल होते हैं. जब छात्र-छात्रा ने पुरानी परीक्षाओं की तैयारी कर ली हो, तब वह नई परीक्षा देने के लिए तैयार हो जाता है. इन एमएल सिस्टम को "सुपरवाइज़" किया जाता है. इसका मतलब है कि कोई व्यक्ति, एमएल सिस्टम को ऐसा डेटा देता है जिसके सही नतीजे पहले से पता होते हैं.

सुपरवाइज़्ड लर्निंग के दो सबसे सामान्य इस्तेमाल के उदाहरण, रिग्रेशन और क्लासिफ़िकेशन हैं.

रिग्रेशन

रिग्रेशन मॉडल, किसी संख्यात्मक वैल्यू का अनुमान लगाता है. उदाहरण के लिए, बारिश का अनुमान लगाने वाला मौसम मॉडल, एक रिग्रेशन मॉडल है. यह मॉडल, बारिश का अनुमान इंच या मिलीमीटर में लगाता है.

रिग्रेशन मॉडल के ज़्यादा उदाहरणों के लिए, यहां दी गई टेबल देखें:

स्थिति संभावित इनपुट डेटा संख्यात्मक अनुमान
आने वाले समय में घर की कीमत स्क्वेयर फ़ुटेज, पिन कोड, बेडरूम और बाथरूम की संख्या, प्लॉट का साइज़, मॉर्गेज की ब्याज दर, प्रॉपर्टी टैक्स की दर, निर्माण की लागत, और इलाके में बिक्री के लिए उपलब्ध घरों की संख्या. घर की कीमत.
आने वाले समय में यात्रा का समय ट्रैफ़िक की पुरानी स्थितियां (स्मार्टफ़ोन, ट्रैफ़िक सेंसर, टैक्सी सेवा देने वाली कंपनियों के ऐप्लिकेशन, और नेविगेशन की सुविधा देने वाले अन्य ऐप्लिकेशन से इकट्ठा किया गया डेटा), मंज़िल से दूरी, और मौसम की स्थितियां. किसी जगह पर पहुंचने में लगने वाला समय, मिनट और सेकंड में.

कैटगरी

क्लासिफ़िकेशन मॉडल यह अनुमान लगाते हैं कि किसी चीज़ के किसी कैटगरी में शामिल होने की कितनी संभावना है. रिग्रेशन मॉडल का आउटपुट एक संख्या होती है. हालांकि, क्लासिफ़िकेशन मॉडल का आउटपुट एक ऐसी वैल्यू होती है जिससे यह पता चलता है कि कोई चीज़ किसी कैटगरी से जुड़ी है या नहीं. उदाहरण के लिए, क्लासिफ़िकेशन मॉडल का इस्तेमाल यह अनुमान लगाने के लिए किया जाता है कि कोई ईमेल स्पैम है या नहीं. साथ ही, यह अनुमान लगाने के लिए भी किया जाता है कि किसी फ़ोटो में बिल्ली है या नहीं.

क्लासिफ़िकेशन मॉडल को दो ग्रुप में बांटा गया है: बाइनरी क्लासिफ़िकेशन और मल्टीक्लास क्लासिफ़िकेशन. बाइनरी क्लासिफ़िकेशन मॉडल, ऐसी क्लास से वैल्यू आउटपुट करते हैं जिसमें सिर्फ़ दो वैल्यू होती हैं. उदाहरण के लिए, ऐसा मॉडल जो rain या no rain में से कोई एक वैल्यू आउटपुट करता है. मल्टीक्लास क्लासिफ़िकेशन मॉडल, ऐसी क्लास से वैल्यू आउटपुट करते हैं जिसमें दो से ज़्यादा वैल्यू होती हैं. उदाहरण के लिए, ऐसा मॉडल जो rain, hail, snow या sleet में से कोई एक वैल्यू आउटपुट कर सकता है.

देखें कि आपको कितना समझ आया

अगर आपको कमर्शियल इमारतों में ऊर्जा की खपत का अनुमान लगाने के लिए, एमएल मॉडल का इस्तेमाल करना है, तो किस तरह के मॉडल का इस्तेमाल किया जाएगा?
रिग्रेशन
ऊर्जा के इस्तेमाल को किलोवॉट-घंटे (kWh) में मापा जाता है. यह एक संख्या होती है. इसलिए, आपको रिग्रेशन मॉडल का इस्तेमाल करना चाहिए.
कैटगरी
क्लासिफ़िकेशन मॉडल यह अनुमान लगाते हैं कि कोई चीज़ किसी कैटगरी से जुड़ी है या नहीं. वहीं, रिग्रेशन मॉडल किसी संख्या का अनुमान लगाते हैं. ऊर्जा की खपत को किलोवॉट-घंटे (kWh) में मापा जाता है, जो एक संख्या है. इसलिए, आपको रिग्रेशन मॉडल का इस्तेमाल करना चाहिए.

अनसुपरवाइज़्ड लर्निंग

बिना निगरानी वाली लर्निंग मॉडल का मकसद, किसी डेटासेट में काम के पैटर्न की पहचान करना होता है. उदाहरण के लिए, कई अनसुपरवाइज़्ड लर्निंग मॉडल, मिलते-जुलते डेटा को ग्रुप ("क्लस्टर") में व्यवस्थित करने के लिए, क्लस्टरिंग नाम की तकनीक का इस्तेमाल करते हैं.

क्लस्टर में रंगीन बिंदु दिखाने वाली इमेज.

पहली इमेज. एक एमएल मॉडल, जो मिलते-जुलते डेटा पॉइंट को क्लस्टर करता है.

इस इमेज में, रंगीन बिंदुओं के क्लस्टर दिखाए गए हैं. ये क्लस्टर, एक-दूसरे से जुड़े हुए हैं और एक शेप में बंद हैं.

दूसरी इमेज. नेचुरल डिमार्केशन वाले क्लस्टर के ग्रुप.

क्लस्टरिंग, क्लासिफ़िकेशन से अलग होती है. ऐसा इसलिए, क्योंकि इसमें कैटगरी तय करने का काम आपका नहीं होता. उदाहरण के लिए, बिना किसी निगरानी वाले मॉडल में, तापमान के आधार पर मौसम के डेटासेट को क्लस्टर किया जा सकता है. इससे ऐसे सेगमेंट का पता चलता है जो सीज़न के बारे में बताते हैं. इसके बाद, डेटासेट के बारे में अपनी समझ के आधार पर उन क्लस्टर के नाम तय किए जा सकते हैं.

इमेज में रंगीन बिंदुओं के क्लस्टर दिखाए गए हैं. इन्हें बर्फ़, बारिश, ओले, और बारिश नहीं के तौर पर लेबल किया गया है.

तीसरी इमेज. एक एमएल मॉडल, जो मौसम के मिलते-जुलते पैटर्न को क्लस्टर करता है.

इस इमेज में, अलग-अलग रंगों के बिंदुओं को क्लस्टर में दिखाया गया है. इन्हें बर्फ़, बारिश, ओले, और बारिश नहीं के तौर पर लेबल किया गया है. ये सभी एक शेप में बंद हैं और एक-दूसरे से जुड़े हुए हैं.

चौथी इमेज. मौसम के पैटर्न के क्लस्टर, जिन्हें बर्फ़बारी, ओले, बारिश, और बारिश न होने के तौर पर लेबल किया गया है.

देखें कि आपको कितना समझ आया

निगरानी में रखे गए और निगरानी में न रखे गए तरीके में क्या अंतर है?
सुपरवाइज़्ड अप्रोच में, ऐसा डेटा दिया जाता है जिसमें सही जवाब शामिल होता है.
सुपरवाइज़्ड अप्रोच में, ऐसा डेटा दिया जाता है जिसमें सही जवाब शामिल होता है. मॉडल का काम, डेटा में ऐसे कनेक्शन ढूंढना है जिनसे सही जवाब मिल सके. बिना निगरानी वाले तरीके में, मॉडल को सही जवाब के बिना डेटा दिया जाता है. इसका काम, डेटा में ग्रुपिंग ढूंढना है.
निगरानी में रखे गए तरीके में आम तौर पर क्लस्टरिंग का इस्तेमाल किया जाता है.
बिना निगरानी वाले तरीके में क्लस्टरिंग का इस्तेमाल किया जाता है.
बिना निगरानी वाले तरीके को डेटा के क्लस्टर को लेबल करने का तरीका पता होता है.
बिना निगरानी वाले तरीके को यह नहीं पता होता कि डेटा के क्लस्टर का क्या मतलब है. डेटा को समझने के बाद, यह तय करना आपका काम है कि उन्हें कैसे तय किया जाए.

रीइन्फ़ोर्समेंट लर्निंग

रीइन्फ़ोर्समेंट लर्निंग मॉडल, किसी एनवायरमेंट में की गई कार्रवाइयों के आधार पर इनाम या जुर्माना पाकर अनुमान लगाते हैं. रीइन्फ़ोर्समेंट लर्निंग सिस्टम, एक नीति बनाता है. इसमें ज़्यादा से ज़्यादा इनाम पाने के लिए, सबसे अच्छी रणनीति तय की जाती है.

रीइन्फ़ोर्समेंट लर्निंग का इस्तेमाल, रोबोट को टास्क करने की ट्रेनिंग देने के लिए किया जाता है. जैसे, कमरे में घूमना. साथ ही, इसका इस्तेमाल AlphaGo जैसे सॉफ़्टवेयर प्रोग्राम को गो गेम खेलने की ट्रेनिंग देने के लिए किया जाता है.

जनरेटिव एआई

जनरेटिव एआई, मॉडल का एक ऐसा क्लास है जो उपयोगकर्ता के इनपुट से कॉन्टेंट बनाता है. उदाहरण के लिए, जनरेटिव एआई यूनीक इमेज, संगीत की धुनें, और चुटकुले बना सकता है. यह लेखों की खास जानकारी दे सकता है, किसी काम को करने का तरीका बता सकता है या किसी फ़ोटो में बदलाव कर सकता है.

जनरेटिव एआई, अलग-अलग तरह के इनपुट ले सकता है और अलग-अलग तरह के आउटपुट जनरेट कर सकता है. जैसे, टेक्स्ट, इमेज, ऑडियो, और वीडियो. यह इन दोनों को मिलाकर भी जवाब दे सकता है. उदाहरण के लिए, कोई मॉडल इनपुट के तौर पर इमेज ले सकता है और आउटपुट के तौर पर इमेज और टेक्स्ट बना सकता है. इसके अलावा, वह इनपुट के तौर पर इमेज और टेक्स्ट ले सकता है और आउटपुट के तौर पर वीडियो बना सकता है.

जनरेटिव मॉडल के इनपुट और आउटपुट के बारे में चर्चा की जा सकती है. आम तौर पर, इन्हें "इनपुट का टाइप"-से-"आउटपुट का टाइप" के तौर पर लिखा जाता है. उदाहरण के लिए, यहां जनरेटिव मॉडल के लिए कुछ इनपुट और आउटपुट की आंशिक सूची दी गई है:

  • टेक्स्ट से टेक्स्ट में अनुवाद करने की सुविधा
  • टेक्स्ट प्रॉम्प्ट से इमेज जनरेट करना
  • टेक्स्ट से वीडियो बनाने वाला मोड
  • टेक्स्ट से कोड जनरेट करना
  • लिखे गए शब्दों को सुनने की सुविधा
  • इमेज और टेक्स्ट प्रॉम्प्ट से इमेज जनरेट करना

इस टेबल में, जनरेटिव मॉडल, उनके इनपुट, और संभावित आउटपुट के उदाहरण दिए गए हैं:

मॉडल इनपुट आउटपुट का उदाहरण
टेक्स्ट से टेक्स्ट में अनुवाद करने की सुविधा ले मां रेस का आविष्कार किसने किया? 24 आवर्स ऑफ़ ल मॉ की स्थापना, ऑटोमोबाइल क्लब डी ल'ओएस्ट (एसीओ) ने की थी. यह मोटरिंग संगठन 1906 में स्थापित किया गया था. पहली रेस 26 और 27 मई, 1923 को सार्थ सर्किट पर हुई थी. यह 13.426 किलोमीटर (8.345 मील) का रोड सर्किट है. यह फ़्रांस के ल मॉ शहर के पास है. इस रेस को मूल रूप से, ACO और सार्थे इलाके को बढ़ावा देने के लिए शुरू किया गया था.
सोर्स: Bard
टेक्स्ट प्रॉम्प्ट से इमेज जनरेट करना एक एलियन ऑक्टोपस, अख़बार पढ़ते हुए पोर्टल से तैरकर जा रहा है. ऑक्टोपस की कार्टून इमेज.
सोर्स: Imagen
टेक्स्ट से वीडियो बनाने वाला मोड सैन फ़्रांसिस्को में एक टेडी बियर समुद्र में तैर रहा है. यह इमेज, असली जैसी दिख रही है. टेडी बियर को पानी में डुबोया जाता है. टेडी बियर, रंग-बिरंगी मछलियों के साथ पानी के अंदर तैरता रहता है. पानी के अंदर तैरता हुआ पांडा. पानी के अंदर तैरते हुए टेडी बियर का वीडियो.
सोर्स: Phenaki
टेक्स्ट से कोड जनरेट करना संख्याओं की सूची पर लूप करने और अभाज्य संख्याओं को प्रिंट करने के लिए, एक Python लूप लिखें.
for number in numbers:
  # Check if the number is prime.
  is_prime = True
  for i in range(2, number):
    if number % i == 0:
        is_prime = False
        break
  # If the number is prime, print it.
  if is_prime:
    print(number)

सोर्स: Bard
इमेज से टेक्स्ट में बदलने की सुविधा फ़्लमिंगो की इमेज. यह फ़्लेमिंगो की आवाज़ है. ये कैरिबियन में पाए जाते हैं.
सोर्स: Google DeepMind

जनरेटिव एआई कैसे काम करता है? जनरेटिव मॉडल, डेटा में पैटर्न सीखते हैं, ताकि नया लेकिन मिलता-जुलता डेटा तैयार किया जा सके. जनरेटिव मॉडल इस तरह के होते हैं:

  • ऐसे कॉमेडियन जो लोगों के व्यवहार और बोलने के तरीके को देखकर, उनकी नकल करना सीखते हैं
  • ऐसे कलाकार जो किसी खास स्टाइल में पेंटिंग बनाने के लिए, उस स्टाइल की कई पेंटिंग का अध्ययन करते हैं
  • कवर बैंड, जो किसी म्यूज़िक ग्रुप के गाने सुनकर, उस ग्रुप की तरह गाने का तरीका सीखते हैं

यूनीक और क्रिएटिव आउटपुट जनरेट करने के लिए, जनरेटिव मॉडल को शुरुआत में बिना किसी निगरानी वाली अप्रोच का इस्तेमाल करके ट्रेन किया जाता है. इसमें मॉडल, उस डेटा की नकल करना सीखता है जिस पर उसे ट्रेन किया गया है. कभी-कभी, मॉडल को सुपरवाइज़्ड या रीइन्फ़ोर्समेंट लर्निंग का इस्तेमाल करके, उन कामों से जुड़े खास डेटा पर ट्रेन किया जाता है जो मॉडल को करने के लिए कहा जा सकता है. उदाहरण के लिए, किसी लेख के बारे में ख़ास जानकारी देना या किसी फ़ोटो में बदलाव करना.

जनरेटिव एआई की टेक्नोलॉजी तेज़ी से बेहतर हो रही है. साथ ही, इसके इस्तेमाल के नए-नए तरीके लगातार खोजे जा रहे हैं. उदाहरण के लिए, जनरेटिव मॉडल की मदद से कारोबार, ई-कॉमर्स प्रॉडक्ट की इमेज को बेहतर बना रहे हैं. ये मॉडल, इमेज से ध्यान भटकाने वाले बैकग्राउंड को अपने-आप हटा देते हैं या कम रिज़ॉल्यूशन वाली इमेज की क्वालिटी को बेहतर बनाते हैं.