সেভ করা পৃষ্ঠা গুছিয়ে রাখতে 'সংগ্রহ' ব্যবহার করুন
আপনার পছন্দ অনুযায়ী কন্টেন্ট সেভ করুন ও সঠিক বিভাগে রাখুন।
এমএল অনুশীলনকারীরা মডেল তৈরির চেয়ে ডেটা মূল্যায়ন, পরিষ্কার এবং রূপান্তর করতে অনেক বেশি সময় ব্যয় করে। ডেটা এতই গুরুত্বপূর্ণ যে এই কোর্সটি বিষয়ের জন্য তিনটি সম্পূর্ণ ইউনিট উৎসর্গ করে:
এই ইউনিটটি সাংখ্যিক তথ্যের উপর ফোকাস করে, যার অর্থ পূর্ণসংখ্যা বা ভাসমান-বিন্দু মান যা সংখ্যার মত আচরণ করে। অর্থাৎ, তারা যোজক, গণনাযোগ্য, আদেশকৃত ইত্যাদি। পরবর্তী ইউনিটটি শ্রেণীবদ্ধ ডেটার উপর ফোকাস করে, যে সংখ্যাগুলিকে অন্তর্ভুক্ত করতে পারে যা বিভাগগুলির মতো আচরণ করে। তৃতীয় ইউনিটটি আপনার মডেলকে প্রশিক্ষণ এবং মূল্যায়ন করার সময় উচ্চ-মানের ফলাফল নিশ্চিত করতে কীভাবে আপনার ডেটা প্রস্তুত করতে হয় তার উপর ফোকাস করে।
সংখ্যাসূচক ডেটার উদাহরণগুলির মধ্যে রয়েছে:
তাপমাত্রা
ওজন
একটি প্রকৃতি সংরক্ষণে শীতকালে হরিণের সংখ্যা
বিপরীতে, ইউএস পোস্টাল কোডগুলি, পাঁচ-অঙ্কের বা নয়-সংখ্যার হওয়া সত্ত্বেও, সংখ্যার মতো আচরণ করে না বা গাণিতিক সম্পর্কের প্রতিনিধিত্ব করে না। পোস্টাল কোড 40004 (নেলসন কাউন্টি, কেন্টাকিতে) পোস্টাল কোড 20002 (ওয়াশিংটন, ডিসিতে) এর দ্বিগুণ নয়। এই সংখ্যাগুলি বিভাগগুলিকে প্রতিনিধিত্ব করে, বিশেষত ভৌগলিক অঞ্চলগুলি, এবং শ্রেণীগত ডেটা হিসাবে বিবেচিত হয়৷
[[["সহজে বোঝা যায়","easyToUnderstand","thumb-up"],["আমার সমস্যার সমাধান হয়েছে","solvedMyProblem","thumb-up"],["অন্যান্য","otherUp","thumb-up"]],[["এতে আমার প্রয়োজনীয় তথ্য নেই","missingTheInformationINeed","thumb-down"],["খুব জটিল / অনেক ধাপ","tooComplicatedTooManySteps","thumb-down"],["পুরনো","outOfDate","thumb-down"],["অনুবাদ সংক্রান্ত সমস্যা","translationIssue","thumb-down"],["নমুনা / কোড সংক্রান্ত সমস্যা","samplesCodeIssue","thumb-down"],["অন্যান্য","otherDown","thumb-down"]],["2024-11-07 UTC-তে শেষবার আপডেট করা হয়েছে।"],[[["This module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models."],["Machine learning practitioners spend significant time on data preparation tasks like cleaning and transformation."],["The module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training."],["Learners should have a basic understanding of machine learning concepts before starting this module."],["Categorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements."]]],[]]