تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
يقضي خبراء الذكاء الاصطناعي وقتًا أطول بكثير في تقييم البيانات وتنظيفها وتحويلها مقارنةً بوقتهم الذي يقضونه في إنشاء النماذج.
البيانات مهمة جدًا بحيث تخصص هذه الدورة ثلاث وحدات كاملة للموضوع:
تركّز هذه الوحدة على
البيانات الرقمية،
أي الأعداد الصحيحة أو قيم النقطة العائمة
التي تتصرف مثل الأرقام. وهذا يعني أنّها قابلة للإضافة والعدّ والترتيب وغيرها. تركز الوحدة التالية على
البيانات الفئوية، التي يمكنها
تضمين أرقامًا تعمل مثل الفئات. تركّز الوحدة الثالثة على كيفية
إعداد بياناتك لضمان الحصول على نتائج عالية الجودة عند تدريب
النموذج وتقييمه.
تشمل أمثلة البيانات الرقمية ما يلي:
درجة الحرارة
الوزن
عدد الغزلان التي تأوى لفصل الشتاء في محمية طبيعية
في المقابل، قد تتضمن الرموز البريدية في الولايات المتحدة،
تتكون من خمسة أرقام أو تسعة أرقام، فلا تتصرف مثل الأرقام أو تمثل
العلاقات الرياضية. الرمز البريدي 40004 (في مقاطعة نيلسون، كنتاكي) هو
وليس ضعف كمية الرمز البريدي 20002 (في واشنطن العاصمة). تمثّل هذه الأرقام
فئات، وتحديدًا المناطق الجغرافية، وتُعدّ
بيانات فئوية.
تاريخ التعديل الأخير: 2025-07-27 (حسب التوقيت العالمي المتفَّق عليه)
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],["تاريخ التعديل الأخير: 2025-07-27 (حسب التوقيت العالمي المتفَّق عليه)"],[[["\u003cp\u003eThis module focuses on preparing numerical data, such as temperature or weight, for use in machine learning models.\u003c/p\u003e\n"],["\u003cp\u003eMachine learning practitioners spend significant time on data preparation tasks like cleaning and transformation.\u003c/p\u003e\n"],["\u003cp\u003eThe module covers techniques like feature scaling, outlier detection, and binning to improve data quality for model training.\u003c/p\u003e\n"],["\u003cp\u003eLearners should have a basic understanding of machine learning concepts before starting this module.\u003c/p\u003e\n"],["\u003cp\u003eCategorical data, like postal codes, will be addressed in a separate module due to its distinct characteristics and handling requirements.\u003c/p\u003e\n"]]],[],null,[]]