बैकग्राउंड: जनरेटर मॉडल क्या है?

नाम और कोटेशन के मतलब में क्या मतलब है? "generative" आंकड़ों के मॉडल की क्लास की जानकारी देता है जो असरदार मॉडल के उलट है.

अनौपचारिक तौर पर:

  • जनरेट करने लायक मॉडल नए डेटा इंस्टेंस जनरेट कर सकते हैं.
  • अलग-अलग मॉडल, अलग-अलग तरह के डेटा के बीच अंतर करते हैं.

जनरेट करने वाले मॉडल से, उन जानवरों की नई फ़ोटो जनरेट हो सकती हैं जो असली जानवरों की तरह दिखते हैं. वहीं, भेदभाव करने वाला मॉडल किसी बिल्ली के कुत्ते को बता सकता है. जीएएन सिर्फ़ एक तरह का जनरेटर मॉडल है.

औपचारिक रूप से, डेटा इंस्टेंस X और लेबल Y के सेट को देखते हुए:

  • जनरेट करने लायक मॉडल कोई लेबल नहीं होने की संभावना वाले p(X, Y) या सिर्फ़ p(X) को कैप्चर करते हैं.
  • असरदार मॉडल, शर्तों के हिसाब से बने p(Y | X) को कैप्चर करते हैं.

जनरेट किए जा रहे मॉडल में डेटा को उपलब्ध कराना शामिल है. साथ ही, आपको यह भी पता चलता है कि दिया गया कोई उदाहरण कैसा है. उदाहरण के लिए, किसी क्रम में अगले शब्द का अनुमान लगाने वाले मॉडल आम तौर पर, जनरेट किए गए मॉडल होते हैं (आम तौर पर यह GAN से काफ़ी आसान होता है) क्योंकि वे क्रम में इस्तेमाल होने की संभावना तय कर सकते हैं.

एक भेदभाव वाला मॉडल इस सवाल को अनदेखा करता है कि दिए गए इंस्टेंस की संभावना है या नहीं. साथ ही, यह आपको बताता है कि किसी लेबल पर कितना लेबल लागू होने की संभावना है.

ध्यान रखें कि यह एक बहुत ही सामान्य परिभाषा है. जनरेट करने लायक कई तरह के मॉडल हैं. GAN, एक तरह का सामान्य मॉडल है.

मॉडलिंग की संभावना

किसी भी तरह के मॉडल को संभावना दिखाने वाली संख्या नहीं देनी होती. आप उस डिस्ट्रिब्यूशन की नकल करके, डेटा के डिस्ट्रिब्यूशन को मॉडल कर सकते हैं.

उदाहरण के लिए, डिसिज़न ट्री जैसे भेदभाव करने वाली कैटगरी का इस्तेमाल करने वाले इंस्टेंस को, लेबल की संभावना दिए बिना ही लेबल किया जा सकता है. डेटा की कैटगरी तय करने वाला ऐसा मॉडल अब भी एक मॉडल होगा, क्योंकि अनुमानित लेबल का डिस्ट्रिब्यूशन डेटा में मौजूद लेबल का असल डिस्ट्रिब्यूशन होगा.

इसी तरह, एक जनरेटिव मॉडल, कन्वर्ज़न और फ़र्ज़ी" डेटा की मदद से एक डिस्ट्रिब्यूशन मॉडल कर सकता है, जो ऐसा लगता है कि उस डिस्ट्रिब्यूशन से ड्रॉ किया गया है.

जनरेट करने वाले मॉडल हार्ड होते हैं

उम्मीद के मुताबिक बनाए गए मॉडल, एनालॉगिव मॉडल की तुलना में ज़्यादा मुश्किल काम करते हैं. जनरेट किए जाने वाले मॉडल को, ज़्यादा मॉडल बनाना होता है.

इमेज के लिए एक जनरेट किए गए मॉडल से, कोट और कोट जैसी चीज़ें दिख सकती हैं. ऐसा लगता है कि नाव की तरह दिखने वाली चीज़ों के आस-पास पानी और कोट जैसी दिखने वाली चीज़ें होती हैं. ऐसा हो सकता है कि इमेज, माथे पर न दिखें.&quot ये बहुत जटिल डिस्ट्रिब्यूशन हैं.

वहीं दूसरी तरफ़, मॉडल बताने वाला एक मॉडल अलग-अलग पैटर्न के ज़रिए "sailboat" या "sailboat"के बीच का अंतर सीख सकता है. यह ऐसे कई संबंधों को अनदेखा कर सकता है जिन्हें जनरेट करने वाले मॉडल को सही करना चाहिए.

भेदभाव वाले मॉडल, डेटा स्पेस में सीमाएं तय करने की कोशिश करते हैं. हालांकि, सामान्य मॉडल, पूरे स्पेस में डेटा डालने का तरीका बताते हैं. उदाहरण के लिए, यह डायग्राम, हाथ से लिखे गए अंकों में भेदभाव करने वाला और जनरेट करने वाला मॉडल दिखाता है:

दो ग्राफ़, एक लेबल वाला लेबल#39; और दूसरा मॉडल लेबल#33; है. दोनों ग्राफ़ एक ही चार डेटापॉइंट दिखाते हैं. हर पॉइंट को हाथ से लिखे गए अंक की इमेज से लेबल किया जाता है. भेदभाव वाले ग्राफ़ में, एक बिंदु वाली लाइन होती है, जो दो डेटा पॉइंट को बाकी दो से अलग करती है. बिंदु वाली लाइन के ऊपर के इलाके को लेबल किया गया है और #39;y=0'
 लाइन के नीचे के इलाके को 'y=1' के तौर पर लेबल किया गया है. जनरेट करने लायक ग्राफ़ में, दो बिंदुओं वाली लाइन को दो बिंदुओं के आस-पास बनाया जाता है. ऊपरी
          गोले को लेबल किया गया है और#39;y=0' और नीचे वाले गोले को लेबल किया गया है और#39;y=1

पहली इमेज: हाथ से लिखे गए अंकों में भेदभाव वाला और जनरेट करने वाला मॉडल.

भेदभाव वाला मॉडल, डेटा स्पेस में लाइन को हाथ से लिखे हुए 0' और 1's के बीच अंतर बताने की कोशिश करता है. अगर लाइन को सही लाइन में लगा दिया जाता है, तो 0' की जगह को 1' से अलग नहीं किया जा सकता है.

इसके उलट, जनरेटर मॉडल, 1' 0's को समझाने के लिए डेटा बनाने की कोशिश करता है. इसे पूरे डेटा स्पेस में डिस्ट्रिब्यूशन को मॉडल करना होता है.

जीएएन ऐसे रिच मॉडल को ट्रेनिंग देने का एक असरदार तरीका है, जो असली डिस्ट्रिब्यूशन जैसा लगता है. हम कैसे काम करते हैं यह समझने के लिए, GAN की बुनियादी संरचना को समझना ज़रूरी है.

अपनी समझ की जांच करें: जनरेट करने वाले बनाम भेदभाव वाले मॉडल

आपके पास 1000 लोगों के लिए IQ स्कोर हैं. आप नीचे दी गई प्रोसेस की मदद से, IQ स्कोर का बंटवारा मॉडल करते हैं:
  1. छह साइड वाला पासा फेंकें.
  2. रोल को कॉन्सटेंट x से गुणा करें.
  3. इसे 100 बार दोहराएं और सभी नतीजों का औसत लें.
जब तक आपकी प्रक्रिया का नतीजा, असली IQ स्कोर के औसत के बराबर नहीं होता, तब तक आप अलग-अलग मानों को आज़माने की कोशिश करते हैं. क्या आपका मॉडल, जनरेट करने वाला मॉडल है या भेदभाव करने वाला मॉडल?
जनरेट होने वाला मॉडल
सही: हर रोल के लिए आप असरदार तरीके से एक काल्पनिक व्यक्ति का IQ जनरेट करते हैं. इसके अलावा, आपका जनरेट किया गया मॉडल इस बात की जानकारी हासिल करता है कि IQ स्कोर सामान्य रूप से (यानी, बेल कर्व पर) दिए जाते हैं.
भेदभाव वाला मॉडल
गलत: एक अलग-अलग रंग का मॉडल, अलग-अलग तरह के IQ स्कोर में अंतर करने की कोशिश करेगा. उदाहरण के लिए, हो सकता है कि भेदभाव करने वाला कोई मॉडल, IQ को नकली या असली के तौर पर दिखाने की कोशिश करे.
कहने के लिए काफ़ी जानकारी नहीं है.
यह मॉडल असल में हमारे दो तरह के मॉडल में से किसी एक की परिभाषा के मुताबिक है.
जब आप मॉडल को डेटा इंस्टेंस देते हैं, तो यह संभावना दिखाता है. क्या यह मॉडल, सामान्य या अलग-अलग मॉडल है?
जनरेट होने वाला मॉडल
जनरेट करने वाला मॉडल, इंस्टेंस की संभावना और क्लास लेबल की संभावना का अनुमान लगा सकता है.
भेदभाव वाला मॉडल
भेदभाव वाला मॉडल, इस बात की संभावना का अनुमान लगा सकता है कि कोई इंस्टेंस, किसी क्लास से जुड़ा है.
कहने के लिए काफ़ी जानकारी नहीं है.
जनरेट करने वाले और भेदभाव वाले, दोनों मॉडल से संभावना का अनुमान लगाया जा सकता है. हालांकि, ऐसा करने की ज़रूरत नहीं है.