डेटा इकट्ठा करना: अपनी समझ की जांच करना

नीचे दिए गए सवालों के लिए, अपने जवाब की जांच करने के लिए, अपनी पसंद के ऐरो पर क्लिक करें:

मान लें कि आप विज्ञापन से जुड़े किसी मशीन लर्निंग मॉडल पर काम कर रहे हैं और जनवरी में विज्ञापन देने वालों के लिए खर्च का अनुमान लगाना चाहते हैं. डिस्क पर सेव किए जाने वाले डेटा की सीमा तय होती है. इसलिए, आपको उपलब्ध डेटा के सिर्फ़ एक सबसेट का इस्तेमाल करना चाहिए. हाल के सभी डेटा का इस्तेमाल किया जा सकता है, जो दिसंबर के पिछले महीने का है. किसी दूसरे व्यक्ति ने सुझाव दिया है कि आप पिछले साल के डेटा का नमूना लें. क्या बेहतर हो सकता है और क्यों?
पिछले महीने का डेटा (दिसंबर)
हालांकि, यह डेटा हाल ही का है. हालांकि, इस पर दिसंबर की छुट्टियों से पहले विज्ञापन देने वालों के खर्च पर पड़ने वाले असर का असर पड़ सकता है.
पूरे साल का सैंपल लिया गया डेटा
यह डेटा पुराना होने के बावजूद, दिसंबर की छुट्टियों से पहले विज्ञापन देने वाले के खर्च पर इसका असर नहीं पड़ेगा.
जब आप ऐसे वीडियो दिखाना चाहते हैं जिन्हें उपयोगकर्ता देखना चाहते हैं. YouTube पर उनके देखे गए वीडियो का इस्तेमाल, लेबल के तौर पर किया जाता है. क्या यह लेबल सीधे तौर पर दिया गया है या पहले से मौजूद है?
हासिल किया गया
यह लेबल इसलिए लिया गया है, क्योंकि यह अनुमान ठीक वैसा नहीं है जैसा आप बनाना चाहते थे. हो सकता है कि उपयोगकर्ता ने वीडियो खोला हो, लेकिन कुछ समय बाद उसे बंद कर दिया हो. इस इवेंट को एक व्यू के तौर पर गिना जाएगा, भले ही उपयोगकर्ता ने वीडियो नहीं देखा हो. कुछ मामलों में, ऐसा तरीका सिर्फ़ आपके लिए उपलब्ध हो सकता है. हालांकि, आपको ध्यान रखना होगा कि आपके लेबल का टाइप (सीधे तौर पर या उससे हासिल किया गया) और आपके अनुमान किस तरह सीमित किए जाते हैं.
डायरेक्ट
हालांकि, यह लेबल ज़्यादातर मामलों में सटीक अनुमान लगा सकता है, लेकिन यह सटीक अनुमान नहीं है.