डेटा तैयार करने की सुविधा और फ़ीचर इंजीनियरिंग

यह प्रक्रिया किस तरह की है?

जैसा कि पहले बताया गया था, इस कोर्स में आपके डेटा सेट को बनाने और डेटा में बदलाव करने पर फ़ोकस किया गया है.

आपके डेटासेट में ये शामिल हैं: 1. रॉ डेटा
इकट्ठा करें.  2. सुविधा और लेबल स्रोतों की पहचान करें. 3. नमूने का विश्लेषण करने का तरीका चुनें.
4. डेटा को बांटें. डेटा में बदलाव करने के लिए ये काम किए जाते हैं:
1. अपने डेटा को एक्सप्लोर करें और उसे मिटाएं. 2. फ़ीचर इंजीनियरिंग
करें.

ध्यान रखें:

  • इस आंकड़े में सामान्य प्रोसेस के बारे में जानकारी दी गई है. हो सकता है कि यह हर प्रोजेक्ट के लिए सही न हो. यह कोर्स मुख्य रूप से लीनियर रिग्रेशन और न्यूरल नेट पर लागू होता है.
  • दिखाई जाने वाली प्रक्रिया हमेशा क्रम में नहीं होती है. उदाहरण के लिए, आप इसे बदलने के बाद अपने डेटा को स्प्लिट कर सकते हैं. आपको और डेटा इकट्ठा करने की ज़रूरत पड़ सकती है. हो सकता है कि आपको ट्रेनिंग शुरू होने के बाद भी, सुविधाओं के सेट में बदलाव करने की ज़रूरत पड़े. इससे, आपको यह पता चलेगा कि असल में क्या काम करता है और क्या नहीं.

इसमें कितना समय लगता है?

नीचे दिए गए सवाल के लिए, अपने जवाब की जांच करने के लिए, अपनी पसंद के ऐरो पर क्लिक करें:

अनुमान लगाएं: अपने मशीन लर्निंग प्रोजेक्ट में, आम तौर पर आपको डेटा तैयार करने और बदलाव में कितना समय लगेगा?
प्रोजेक्ट के आधे से ज़्यादा समय
सही: आप डेटा सेट बनाने और डेटा में बदलाव करने के लिए, ज़्यादातर समय मशीन लर्निंग प्रोजेक्ट पर काम करेंगे.
प्रोजेक्ट के आधे से भी कम समय
और प्लान करें! आम तौर पर, मशीन लर्निंग प्रोजेक्ट का 80% हिस्सा डेटा सेट बनाने और डेटा को बदलने में लगता है.