সাংখ্যিক তথ্য রূপান্তর

আপনাকে সাংখ্যিক ডেটাতে দুটি ধরণের রূপান্তর প্রয়োগ করতে হতে পারে:

  • সাধারণীকরণ - সাংখ্যিক ডেটাকে অন্যান্য সাংখ্যিক ডেটার মতো একই স্কেলে রূপান্তর করা।
  • বাকেটিং - সাংখ্যিক (সাধারণত ক্রমাগত) ডেটাকে শ্রেণীবদ্ধ ডেটাতে রূপান্তর করা।

কেন সাংখ্যিক বৈশিষ্ট্য স্বাভাবিকীকরণ?

আমরা দৃঢ়ভাবে এমন একটি ডেটা সেটকে স্বাভাবিক করার পরামর্শ দিই যেটিতে সাংখ্যিক বৈশিষ্ট্যগুলি রয়েছে যা স্বতন্ত্রভাবে বিভিন্ন ব্যাপ্তি (উদাহরণস্বরূপ, বয়স এবং আয়) কভার করে। যখন বিভিন্ন বৈশিষ্ট্যের বিভিন্ন রেঞ্জ থাকে, গ্রেডিয়েন্ট ডিসেন্ট "বাউন্স" করতে পারে এবং কনভারজেন্সকে ধীর করে দিতে পারে। অ্যাডাগ্রাড এবং অ্যাডামের মতো অপ্টিমাইজাররা প্রতিটি বৈশিষ্ট্যের জন্য একটি পৃথক কার্যকর শেখার হার তৈরি করে এই সমস্যা থেকে রক্ষা করে।

আমরা "শহরের জনসংখ্যা" এর মতো বিস্তৃত পরিসর কভার করে এমন একটি একক সংখ্যাসূচক বৈশিষ্ট্যকে স্বাভাবিক করার পরামর্শ দিই। আপনি যদি "শহরের জনসংখ্যা" বৈশিষ্ট্যটিকে স্বাভাবিক না করেন, তাহলে মডেলটিকে প্রশিক্ষণ দিলে NaN ত্রুটি হতে পারে। দুর্ভাগ্যবশত, Adagrad এবং Adam এর মত অপ্টিমাইজাররা NaN ত্রুটি প্রতিরোধ করতে পারে না যখন একটি বৈশিষ্ট্যের মধ্যে বিস্তৃত মান থাকে।