इस पेज का अनुवाद Cloud Translation API से किया गया है.

रीयल टाइम में एमएल सिस्टम: साहित्य

इस लेसन में, आप एमएल की समस्याओं को डीबग करेंगे, जो 18वीं सदी के साहित्य से जुड़ी हैं.

असली दुनिया का उदाहरण: 18वीं सदी का साहित्य

18वीं सदी के साहित्य की प्रोफे़सर हैं. वे सिर्फ़ उन लेखकों के राजनैतिक जुड़ाव का अनुमान लगाना चाहते थे जो "माइंड मेटाफ़ॉर्स" लेखक का इस्तेमाल करते हैं.

असली दुनिया का उदाहरण: 18वीं सदी का साहित्य

18वीं सदी के साहित्य की प्रोफे़सर हैं. वे सिर्फ़ उन लेखकों के राजनैतिक जुड़ाव का अनुमान लगाना चाहते थे जो "माइंड मेटाफ़ॉर्स" लेखक का इस्तेमाल करते हैं.
रिसर्च करने वालों की टीम ने कई लेबल वाले डेटा सेट को लेबल करके बड़ा किया है. इसमें कई लेखक और वाक्य इस्तेमाल किए गए हैं. साथ ही, इन्हें वाक्य के हिसाब से, ट्रेन/मान्यता/टेस्ट सेट में बांटा गया है.

असली दुनिया का उदाहरण: 18वीं सदी का साहित्य

18वीं सदी के साहित्य की प्रोफे़सर हैं. वे सिर्फ़ उन लेखकों के राजनैतिक जुड़ाव का अनुमान लगाना चाहते थे जो "माइंड मेटाफ़ॉर्स" लेखक का इस्तेमाल करते हैं.
रिसर्च करने वालों की टीम ने कई लेबल वाले डेटा सेट को लेबल करके बड़ा किया है. इसमें कई लेखक और वाक्य इस्तेमाल किए गए हैं. साथ ही, इन्हें वाक्य के हिसाब से, ट्रेन/मान्यता/टेस्ट सेट में बांटा गया है.
प्रशिक्षित मॉडल ने टेस्ट डेटा की क़ीमत भी पूरी की, लेकिन रिसर्च करने वाले लोगों को लगा कि नतीजे संदिग्ध हैं. क्या गड़बड़ी हुई?

असली दुनिया का उदाहरण: 18वीं सदी का साहित्य

आपके हिसाब से, जांच को सही क्यों माना जा सकता है? देखें कि क्या आपको इस समस्या का पता चला है. इसके बाद, नीचे दिए 'चलाएं' बटन पर क्लिक करें ▶ यह पता लगाने के लिए कि आप सही हैं या नहीं.

असली दुनिया का उदाहरण: 18वीं सदी का साहित्य

डेटा विभाजन A: शोधकर्ता, हर सेट के कुछ लेखकों को ट्रेनिंग सेट में रखते हैं, कुछ पुष्टि करने वाले सेट में, और कुछ को टेस्ट सेट में लागू करते हैं.

ट्रेनिंग, पुष्टि, और टेस्ट सेट में लेखक के उदाहरणों का ब्रेकडाउन दिखाने वाला डायग्राम. हर सेट में, तीनों में से हर एक के उदाहरण दिखाए गए हैं.

असली दुनिया का उदाहरण: 18वीं सदी का साहित्य

डेटा स्प्लिट B: रिसर्च करने वाले, सभी लेखकों के उदाहरण एक ही सेट में रखते हैं.

ट्रेनिंग, पुष्टि, और टेस्ट सेट में लेखक के उदाहरणों का ब्रेकडाउन दिखाने वाला डायग्राम. ट्रेनिंग सेट में Swift के सिर्फ़ उदाहरण हैं, पुष्टि सेट में सिर्फ़ Bele के उदाहरण हैं और टेस्ट सेट में सिर्फ़ Defoe के उदाहरण हैं.

असली दुनिया का उदाहरण: 18वीं सदी का साहित्य

डेटा विभाजन A: शोधकर्ता, हर सेट के कुछ लेखकों को ट्रेनिंग सेट में रखते हैं, कुछ पुष्टि करने वाले सेट में, और कुछ को टेस्ट सेट में लागू करते हैं.
डेटा स्प्लिट B: रिसर्च करने वाले, सभी लेखकों के उदाहरण एक ही सेट में रखते हैं.
नतीजे: डेटा स्प्लिट A पर प्रशिक्षित मॉडल की डेटा स्प्लिट B में प्रशिक्षित मॉडल की तुलना में काफ़ी ज़्यादा सही थी.

असली दुनिया का उदाहरण: 18वीं सदी का साहित्य

नैतिक: इस बात पर ध्यान से विचार करें कि आप किस तरह उदाहरणों को बांटते हैं.

जानें कि डेटा क्या दिखाता है.

इस वीडियो लेक्चर को आवाज़ से डब करने के लिए, मशीन लर्निंग तकनीक का इस्तेमाल किया गया. कृपया आवाज़ को डब करने वाली हमारी टेक्नोलॉजी को बेहतर बनाने में हमारी मदद करें. गड़बड़ी की रिपोर्ट और सुझाव सबमिट करने के लिए, ऊपर दिए गए 'सुझाव भेजें' पर क्लिक करें.

अंग्रेज़ी ऑडियो को बदलने के लिए, पेज के सबसे नीचे बाईं ओर मौजूद ड्रॉप-डाउन मेन्यू से अंग्रेज़ी चुनें.

* हमने इस मॉड्यूल को काफ़ी हद तक और कोट; में माइनर और माइनिंग के साथ शामिल किया: ह्यूमैनिटीज़ और कोट के डेटा पर इंप्लिसिट असेप्शन का असर; Sculley ने किया.

सहायता केंद्र

पीछे जाएं

कैंसर का अनुमान (पांच मिनट)

आगे बढ़ें

दिशा-निर्देश (दो मिनट)