नीचे दिए गए विकल्पों को एक्सप्लोर करें.
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है
ईमेल को दो कैटगरी में बांटने वाले क्लासिफ़िकेशन मॉडल का इस्तेमाल करें:
"स्पैम" या "स्पैम नहीं है". अगर डेटा की कैटगरी तय करने के लिए थ्रेशोल्ड बढ़ाया जाता है, तो
कितनी सटीक है?
ज़रूर बढ़ाएं.
आम तौर पर, डेटा की कैटगरी तय करने की सीमा को बढ़ाने से, ज़्यादा सटीक जानकारी मिलती है.
हालांकि, सटीक होने की यह गारंटी नहीं है कि एक ही तरह से बढ़ोतरी होगी
जैसे-जैसे हम थ्रेशोल्ड बढ़ाते हैं.
शायद इसमें बढ़ोतरी होगी.
आम तौर पर, डेटा क्लासिफ़िकेशन के लिए थ्रेशोल्ड बढ़ाने से, गलत नतीजे कम हो जाते हैं
सकारात्मक. इससे ज़्यादा सटीक नतीजे मिलते हैं.
शायद कम हो जाएगा.
आम तौर पर, क्लासिफ़िकेशन थ्रेशोल्ड को बढ़ाने से, गलत नतीजे कम हो जाते हैं
सकारात्मक. इससे ज़्यादा सटीक नतीजे मिलते हैं.
निश्चित तौर पर कम होगा.
आम तौर पर, क्लासिफ़िकेशन थ्रेशोल्ड को बढ़ाने से, गलत नतीजे कम हो जाते हैं
सकारात्मक. इससे ज़्यादा सटीक नतीजे मिलते हैं.
नीचे दिए गए विकल्पों को एक्सप्लोर करें.
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है
ईमेल को दो कैटगरी में बांटने वाले क्लासिफ़िकेशन मॉडल का इस्तेमाल करें:
"स्पैम" या "स्पैम नहीं है". अगर डेटा की कैटगरी तय करने के लिए थ्रेशोल्ड बढ़ाया जाता है, तो
उन्हें याद कैसे करना है?
हमेशा बढ़ाएं.
डेटा क्लासिफ़िकेशन के लिए थ्रेशोल्ड बढ़ाने से, ये दोनों चीज़ें हो सकती हैं:
- ट्रू पॉज़िटिव की संख्या घट जाएगी या कोई बदलाव नहीं.
- फ़ॉल्स नेगेटिव की संख्या बढ़ जाएगी या कोई बदलाव नहीं.
इसे हमेशा घटाएं या पहले जैसा ही रखें.
हमारे वर्गीकरण थ्रेशोल्ड को बढ़ाने से
सही पॉज़िटिव वैल्यू को घटेगा या पहले जैसा ही रखेगा. इससे
बढ़ाने या बरकरार रखने के लिए, फ़ॉल्स नेगेटिव की संख्या. इसलिए,
रीकॉल या तो स्थिर रहेगी या घट जाएगी.
हमेशा एक जैसा काम करें.
हमारे वर्गीकरण थ्रेशोल्ड को बढ़ाने से
सही पॉज़िटिव वैल्यू को घटेगा या पहले जैसा ही रखेगा. इससे
बढ़ाने या बरकरार रखने के लिए, फ़ॉल्स नेगेटिव की संख्या. इसलिए,
रीकॉल या तो स्थिर रहेगी या घट जाएगी.
नीचे दिए गए विकल्पों को एक्सप्लोर करें.
अभी तक किसी भी व्यक्ति ने चेक इन नहीं किया है
दो मॉडल—A और B—पर विचार करें, जो सभी एक ही डेटासेट का आकलन करते हैं.
इनमें से कौनसा स्टेटमेंट सही है?
यदि मॉडल A की तुलना मॉडल B से बेहतर सटीक है, तो
मॉडल A बेहतर है.
हालांकि, सटीक जानकारी देना अच्छी बात है, लेकिन इसकी कीमत आपको चुकानी पड़ सकती है
रीकॉल में कमी आई है. सामान्य तौर पर, हमें इन बातों पर ध्यान देना चाहिए
दोनों को एक साथ या AUC जैसी खास जानकारी वाली मेट्रिक
जिसके बारे में हम आगे बात करेंगे.
अगर मॉडल A को मॉडल B से बेहतर रीकॉल है, तो मॉडल A है
किया है.
याद रखना अच्छा होता है, लेकिन यह
काफ़ी कमी आई है. सामान्य तौर पर, हमें
किसी मेट्रिक की सटीक वैल्यू और रीकॉल, दोनों को एक साथ देखा जा सकता है. इसके अलावा,
जैसे AUC, जिसके बारे में हम आगे बात करेंगे.
अगर मॉडल A में मॉडल B की तुलना में ज़्यादा सटीक और बेहतर रीकॉल है, तो
तो मॉडल A शायद बेहतर होगा.
सामान्य तौर पर, वह मॉडल जो अन्य मॉडल की तुलना में अन्य
प्रिसिज़न और रीकॉल बेहतर मॉडल हो सकते हैं. बेशक,
हमें यह सुनिश्चित करना होगा कि तुलना
प्रिसिज़न / रीकॉल पॉइंट जो इसके लिए काम का हो
काम आ सकता है. उदाहरण के लिए, मान लें कि स्पैम की पहचान करने वाले हमारे मॉडल
डेटा को कम से कम 90% सटीक होना चाहिए, ताकि वह काम का हो और
ग़ैर-ज़रूरी गलत अलार्म. इस मामले में, तुलना करके
एक मॉडल को दूसरे मॉडल की तुलना में, दूसरे मॉडल के लिए
{15% असल
इनमें से कोई भी मॉडल 90% सटीक होने की ज़रूरी शर्तों को पूरा नहीं करता. हालांकि, इस चेतावनी को ध्यान में रखते हुए
ध्यान दें कि मॉडल का इस्तेमाल करते समय, मॉडल की तुलना करने का यह एक अच्छा तरीका है.
प्रिसिज़न और रीकॉल.