تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
أهداف التعلُّم
في هذه الوحدة، ستتعلم ما يلي:
التحقيق في المشاكل المحتملة الكامنة في مجموعات البيانات الأولية أو التي تمت معالجتها، بما في ذلك
مشكلات الجمع والجودة.
تحديد التحيزات والاستنتاجات غير الصالحة والاستنتاجات.
العثور على المشكلات الشائعة في تحليل البيانات، بما في ذلك الارتباط
والصلة وعدم الصلة.
يفحص مخطط المشكلات الشائعة وسوء التصورات
خيارات العرض والتصميم المضللة.
تحفيز تعلُّم الآلة
على الرغم من أنه ليس بهذه الروعة كبُنى النماذج وغيرها من أعمال النماذج في مرحلة ما بعد إطلاق التطبيق،
يعد استكشاف البيانات والتوثيق والمعالجة المسبقة أمرًا بالغ الأهمية
مجال تعلُّم الآلة. يمكن أن يندرج ممارسو تعلُّم الآلة ضمن فئة Nithya Sambasivan et al. يسمى
تتاليات البيانات
في دراسة ACM لعام 2021
إذا لم يفهموا جيدًا ما يلي:
الظروف التي يتم بموجبها جمع بياناتهم
جودة البيانات وخصائصها وقيودها
ما يمكن وما لا يمكن أن تعرضه البيانات
إن تدريب النماذج على البيانات السيئة
أن تكتشف فقط في وقت المخرجات المنخفضة الجودة أن هناك مشكلات
مع البيانات. وبالمثل، يمكن أن يؤدي الفشل في استيعاب قيود البيانات،
والتحيزات في جمع البيانات، أو الخلط بين السببية،
يمكن أن يؤدي إلى نتائج واعدة وغير مُحقَّقة بشكل مفرط، مما قد يؤدي إلى
فقدان الثقة.
تتناول هذه الدورة فخاخ البيانات الشائعة والخفية التي يستخدمها التعلم الآلي
قد يواجهها الممارسون في عملهم.
تاريخ التعديل الأخير: 2024-07-26 (حسب التوقيت العالمي المتفَّق عليه)
[[["يسهُل فهم المحتوى.","easyToUnderstand","thumb-up"],["ساعَدني المحتوى في حلّ مشكلتي.","solvedMyProblem","thumb-up"],["غير ذلك","otherUp","thumb-up"]],[["لا يحتوي على المعلومات التي أحتاج إليها.","missingTheInformationINeed","thumb-down"],["الخطوات معقدة للغاية / كثيرة جدًا.","tooComplicatedTooManySteps","thumb-down"],["المحتوى قديم.","outOfDate","thumb-down"],["ثمة مشكلة في الترجمة.","translationIssue","thumb-down"],["مشكلة في العيّنات / التعليمات البرمجية","samplesCodeIssue","thumb-down"],["غير ذلك","otherDown","thumb-down"]],["تاريخ التعديل الأخير: 2024-07-26 (حسب التوقيت العالمي المتفَّق عليه)"],[[["This module teaches you to identify potential issues in datasets, including biases and invalid inferences, ultimately helping you build better ML models."],["Understanding data limitations and collection conditions is crucial to avoid \"data cascades\" that lead to poor model performance and wasted resources."],["The module explores common data analysis pitfalls, such as mistaking correlation for causation, and emphasizes the importance of proper data exploration and preprocessing in machine learning workflows."],["By recognizing common problems in charts and data visualizations, you'll be able to avoid misperceptions and ensure accurate data representation."]]],[]]