बैकग्राउंड: जनरेटिव मॉडल क्या है?

"जनरेटिव एडवर्सरी नेटवर्क" के नाम में "जनरेटिव" का क्या मतलब है? "जनरेटिव", आंकड़ों के ऐसे मॉडल की क्लास के बारे में बताता है जो डिसक्रिमिनेटिव मॉडल से अलग होते हैं.

अनौपचारिक तौर पर:

जनरेटिव मॉडल, नए डेटा इंस्टेंस जनरेट कर सकते हैं.
भेदभाव करने वाले मॉडल, अलग-अलग तरह के डेटा इंस्टेंस के बीच अंतर करते हैं.

जनरेटिव मॉडल, जानवरों की ऐसी नई फ़ोटो जनरेट कर सकता है जो असल जानवरों जैसी दिखती हैं. वहीं, डिस्क्रीमिनेटिव मॉडल, कुत्ते और बिल्ली में अंतर बता सकता है. जीएएन, जनरेटिव मॉडल का सिर्फ़ एक टाइप है.

ज़्यादा औपचारिक तौर पर, डेटा इंस्टेंस X का सेट और लेबल Y का सेट दिया गया है:

जनरेटिव मॉडल, एक साथ होने की संभावना p(X, Y) को कैप्चर करते हैं. अगर कोई लेबल नहीं है, तो सिर्फ़ p(X) को कैप्चर किया जाता है.
डिसक्रिमिनेटिव मॉडल, शर्त के साथ दी गई संभावना p(Y | X) को कैप्चर करते हैं.

जनरेटिव मॉडल में डेटा का डिस्ट्रिब्यूशन शामिल होता है. साथ ही, यह आपको बताता है कि किसी दिए गए उदाहरण की संभावना कितनी है. उदाहरण के लिए, किसी क्रम में अगले शब्द का अनुमान लगाने वाले मॉडल आम तौर पर जनरेटिव मॉडल होते हैं. ये आम तौर पर जीएएन (GAN) से ज़्यादा आसान होते हैं, क्योंकि ये शब्दों के क्रम में संभावना तय कर सकते हैं.

भेदभाव करने वाला मॉडल, इस सवाल को अनदेखा करता है कि किसी दिए गए इंस्टेंस की संभावना है या नहीं. यह सिर्फ़ आपको यह बताता है कि किसी इंस्टेंस पर लेबल लागू होने की संभावना कितनी है.

ध्यान दें कि यह एक सामान्य परिभाषा है. जनरेटिव मॉडल कई तरह के होते हैं. जीएएन, जनरेटिव मॉडल का सिर्फ़ एक टाइप है.

मॉडलिंग की संभावनाएं

दोनों तरह के मॉडल को, किसी संभावना को दिखाने वाला कोई नंबर नहीं दिखाना होता. डेटा के डिस्ट्रिब्यूशन को मॉडल करने के लिए, उस डिस्ट्रिब्यूशन की नकल की जा सकती है.

उदाहरण के लिए, फ़ैसला लेने वाले पेड़ जैसा कोई भेदभाव करने वाला क्लासिफ़ायर, किसी इंस्टेंस को लेबल कर सकता है. ऐसा करने के लिए, वह उस लेबल को कोई संभावना असाइन नहीं करता. ऐसा क्लासिफ़ायर अब भी एक मॉडल होगा, क्योंकि अनुमानित सभी लेबल का डिस्ट्रिब्यूशन, डेटा में लेबल के असल डिस्ट्रिब्यूशन का मॉडल होगा.

इसी तरह, जनरेटिव मॉडल किसी डिस्ट्रिब्यूशन का मॉडल बना सकता है. इसके लिए, वह ऐसा "नकली" डेटा जनरेट करता है जो असल डिस्ट्रिब्यूशन से लिया गया लगता है.

जनरेटिव मॉडल बनाना मुश्किल है

जनरेटिव मॉडल, मिलते-जुलते डिस्क्रीमिनेटिव मॉडल के मुकाबले ज़्यादा मुश्किल काम करते हैं. जनरेटिव मॉडल को ज़्यादा मॉडल बनाना पड़ता है.

इमेज के लिए जनरेटिव मॉडल, "नाव जैसी दिखने वाली चीज़ें, पानी जैसी दिखने वाली चीज़ों के पास दिख सकती हैं" और "आंखें, माथे पर नहीं दिख सकतीं" जैसे संबंधों को कैप्चर कर सकता है. ये बहुत मुश्किल डिस्ट्रिब्यूशन हैं.

इसके उलट, डिस्क्रीमिनेटिव मॉडल, सिर्फ़ कुछ अहम पैटर्न देखकर, "सैलबोट" या "सैलबोट नहीं" के बीच का अंतर जान सकता है. यह कई ऐसे कनेक्शन को अनदेखा कर सकता है जिन्हें जनरेटिव मॉडल को सही तरीके से समझना चाहिए.

डिस्क्रेमिनेटिव मॉडल, डेटा स्पेस में सीमाएं तय करने की कोशिश करते हैं. वहीं, जनरेटिव मॉडल, पूरे स्पेस में डेटा को कैसे रखा जाता है, यह मॉडल करने की कोशिश करते हैं. उदाहरण के लिए, नीचे दिए गए डायग्राम में, लिखे गए अंकों के लिए डिस्टिंक्टिव और जनरेटिव मॉडल दिखाए गए हैं:

पहली इमेज: हाथ से लिखे गए अंकों के लिए, डिस्टिंक्टिव और जनरेटिव मॉडल.

डिस्क्रीमिनेटिव मॉडल, डेटा स्पेस में लाइन खींचकर, हाथ से लिखे गए 0 और 1 के बीच का अंतर बताने की कोशिश करता है. अगर यह लाइन सही तरीके से तय कर लेता है, तो यह 0 और 1 में अंतर कर सकता है. इसके लिए, यह ज़रूरी नहीं है कि लाइन के दोनों ओर डेटा स्पेस में, इंस्टेंस को सही जगह पर रखा गया हो.

इसके उलट, जनरेटिव मॉडल, डेटास्पेस में अपने असली वर्शन के करीब आने वाले अंक जनरेट करके, 1 और 0 जनरेट करने की कोशिश करता है. इसे पूरे डेटा स्पेस में डिस्ट्रिब्यूशन को मॉडल करना होगा.

जीएएन, ऐसे रिच मॉडल को ट्रेन करने का असरदार तरीका देते हैं, ताकि वे असल डिस्ट्रिब्यूशन से मिलते-जुलते हों. इनके काम करने का तरीका समझने के लिए, हमें जीएएन के बुनियादी स्ट्रक्चर को समझना होगा.

देखें कि आपने कितना समझा है: जनरेटिव बनाम डिस्क्रीमिनेटिव मॉडल

आपके पास 1,000 लोगों के आईक्यू स्कोर हैं. आईक्यू स्कोर के डिस्ट्रिब्यूशन का मॉडल बनाने के लिए, यह तरीका अपनाएं:

छह तरफ़ वाले तीन पासे फेंके जाते हैं.
रोल को किसी कॉन्स्टेंट w से गुणा करें.
इसे 100 बार दोहराएं और सभी नतीजों का औसत निकालें.

w की अलग-अलग वैल्यू आज़माएं, जब तक कि आपके तरीके का नतीजा, असली आईक्यू स्कोर के औसत के बराबर न हो जाए. क्या आपका मॉडल जनरेटिव मॉडल है या डिस्क्रीमिनेटिव मॉडल?

जनरेटिव मॉडल

सही: हर रोल के साथ, आप किसी काल्पनिक व्यक्ति का आईक्यू जनरेट कर रहे हैं. इसके अलावा, आपका जनरेटिव मॉडल इस बात को ध्यान में रखता है कि आईक्यू स्कोर सामान्य तौर पर (यानी बेल कर्व पर) डिस्ट्रिब्यूट होते हैं.

डिसक्रिमिनेटिव मॉडल

गलत: एक मिलता-जुलता भेदभाव करने वाला मॉडल, अलग-अलग तरह के आईक्यू स्कोर के बीच भेदभाव करने की कोशिश करेगा. उदाहरण के लिए, भेदभाव करने वाला मॉडल, किसी आईक्यू को नकली या असली के तौर पर बांटने की कोशिश कर सकता है.

इस बारे में ज़रूरत के मुताबिक जानकारी नहीं है.

यह मॉडल, हमारे दो तरह के मॉडल में से किसी एक के मुताबिक है.

जब किसी मॉडल को डेटा इंस्टेंस दिया जाता है, तो वह संभावित नतीजा दिखाता है. क्या यह मॉडल जनरेटिव मॉडल है या डिस्क्रीमिनेटिव मॉडल?

जनरेटिव मॉडल

जनरेटिव मॉडल, किसी इंस्टेंस की संभावना का अनुमान लगा सकता है. साथ ही, किसी क्लास लेबल की संभावना का भी अनुमान लगा सकता है.

भेदभाव करने वाला मॉडल

डिस्क्रीमिनेटिव मॉडल, इस बात की संभावना का अनुमान लगा सकता है कि कोई इंस्टेंस किसी क्लास से जुड़ा है या नहीं.

इस बारे में ज़रूरत के मुताबिक जानकारी नहीं है.

जनरेटिव और डिस्क्रीमिनेटिव, दोनों मॉडल संभावनाओं का अनुमान लगा सकते हैं (हालांकि, ऐसा करना ज़रूरी नहीं है).

पीछे जाएं

शुरुआती जानकारी

आगे बढ़ें

जीएएन स्ट्रक्चर के बारे में खास जानकारी