তথ্য সংগ্রহ: আপনার বোঝার পরীক্ষা করুন

নিম্নলিখিত প্রশ্নের জন্য, আপনার উত্তর চেক করতে পছন্দসই তীরটিতে ক্লিক করুন:

ধরা যাক আপনি একটি বিজ্ঞাপন-সম্পর্কিত মেশিন লার্নিং মডেলে কাজ করছেন এবং জানুয়ারী মাসের জন্য বিজ্ঞাপনদাতার ব্যয়ের পূর্বাভাস দিতে চান। আপনি ডিস্কে যে পরিমাণ ডেটা সঞ্চয় করতে পারেন তার সীমাবদ্ধতা রয়েছে, তাই আপনাকে অবশ্যই উপলব্ধ ডেটার একটি উপসেট ব্যবহার করতে হবে। আপনি সব সাম্প্রতিক ডেটা ব্যবহার করতে পারেন, যা ডিসেম্বরের আগের মাসের। অন্য কেউ আপনাকে গত বছরের নমুনা ডেটার পরামর্শ দেয়। কোনটি ভাল হতে পারে এবং কেন?
আগের মাসের (ডিসেম্বর) ডেটা
যদিও এই ডেটা আরও সাম্প্রতিক, এটি ডিসেম্বরের ছুটির আগে বিজ্ঞাপনদাতাদের খরচের মৌসুমী প্রভাব দ্বারা প্রভাবিত হতে পারে।
সারা বছর জুড়ে ডেটা নমুনা
যদিও এই ডেটা পুরানো, এটি ডিসেম্বরের ছুটির আগে বিজ্ঞাপনদাতাদের খরচের মৌসুমী প্রভাব দ্বারা প্রভাবিত হওয়ার সম্ভাবনা কম।
ব্যবহারকারীরা দেখতে চান এমন ভিডিও আপনি দেখাতে চান। আপনি একটি লেবেল হিসাবে তারা YouTube এ দেখা ভিডিও ব্যবহার করুন. এই লেবেল সরাসরি বা উদ্ভূত?
প্রাপ্ত
এই লেবেলটি উদ্ভূত হয়েছে কারণ এটি আপনি যে সঠিক ভবিষ্যদ্বাণী করতে চান তা নয়। সম্ভবত ব্যবহারকারী ভিডিওটি খুলেছেন কিন্তু কিছুক্ষণ পরেই এটি বন্ধ করে দিয়েছেন। ব্যবহারকারী ভিডিওটি না দেখলেও এই ইভেন্টটি একটি ভিউ হিসাবে গণনা করা হবে৷ কিছু ক্ষেত্রে, এই ধরনের হিউরিস্টিক আপনার একমাত্র বিকল্প হতে পারে, তবে আপনার লেবেলের ধরন (সরাসরি বা উদ্ভূত) এবং এটি কীভাবে আপনার ভবিষ্যদ্বাণীগুলিকে সীমাবদ্ধ করে সে সম্পর্কে সচেতন হন।
সরাসরি
যদিও সেই লেবেলটির ফলে অনেক সময় সঠিক ভবিষ্যদ্বাণী হতে পারে, তবে এটি আপনি যে সঠিক ভবিষ্যদ্বাণী করতে চান তা নয়।