1. تحديد النقاط الرئيسية
لقد استقررت على مجموعة من الأسئلة التي تريد تضمينها في "بطاقة البيانات"، وهي أسئلة ترى أنّها مهمة للقراء. ومع ذلك، لا يقتصر الأمر على الإجابة عن هذه الأسئلة وتسميتها "بطاقة بيانات". يجب التفكير مليًا في كيفية تحسين "بطاقة البيانات" النهائية لتوفير أفضل تجربة للقارئ.
عندما يقرأ المستخدمون "بطاقات البيانات"، يريدون اتّخاذ قرارات محدّدة جدًا، مثل ما يلي:
- هل مجموعة البيانات هذه مناسبة لحالة الاستخدام؟
- هل يمكنني السماح للآخرين باستخدام مجموعة البيانات هذه؟
- كيف يمكنني استخدام مجموعة البيانات هذه بأمان بدون زيادة المخاطر على نماذجي؟
إذا كان بإمكان القرّاء الوصول إلى المعلومات الصحيحة بكفاءة، سيكونون بارعين للغاية في اتخاذ قرارات متعلقة بمجموعة البيانات ضمن سياقاتهم. تعتمد أهمية المعلومات أو فائدتها على نوع القرار الذي يجب أن يتخذه القارئ وخلفيته. على سبيل المثال، عند تحديد ما إذا كان سيتم استخدام مجموعة بيانات، قد يراجع مسؤول الامتثال التراخيص المرتبطة بها، بينما يراجع المهندس مجموعة الأدوات التقنية. يطرح كلا القارئَين الأسئلة نفسها، ولكن يتوقّعان إجابات مختلفة.
يجب أن تصف "بطاقات البيانات" مجموعة البيانات بشكل شامل حتى يتمكّن القرّاء من اتّخاذ القرارات بثقة. تساعدك هذه الأوصاف الشاملة في تحديد ما تريد أن يستفيده القراء من "بطاقة البيانات"، وتحديد نوع المعلومات الدقيقة والشاملة والمنظَّمة التي يجب توثيقها فيها. بالطبع، التحدي هو أنّه من المستحيل تحديد جميع القرارات المحتملة التي يحتاج قارئو "بطاقة البيانات" إلى اتّخاذها.
2. تخطيط "بطاقة البيانات"
- لتحديد القرارات التي يجب أن يتّخذها قارئو "بطاقة البيانات" ومقدار التفاصيل التي يجب أن تتضمّنها "بطاقة البيانات"، أجب عن السؤال لكل فئة في الجدول التالي:
القرّاء | القرارات | الأهداف | مدى الصلة بالموضوع | Nuance |
من هو الجمهور الأساسي؟ | ما هي القرارات التي سيتخذونها بشأن مجموعة البيانات؟ | ما الذي يريدونه من "بطاقة البيانات"؟ | ما المحتوى المحدّد الذي يحتاجون إليه من "بطاقة البيانات" لتحقيق أهدافهم؟ | بالنظر إلى ما تعرفه عن القارئ، ما مدى التفصيل أو الدقة التي يجب أن يتضمّنها المحتوى؟ |
مثال: مهندسو برامج الإنتاج | مثال: هل يمكنني استخدام مجموعة البيانات لاختبار نموذج تعلُّم آلة (ML) في مرحلة الإنتاج؟ | مثال: أريد الحصول على نظرة عامة حول مجموعة البيانات. أريد معرفة كيفية تنفيذ ذلك. | مثال: الاستخدامات المقصودة وغير المناسبة، والاستخدام السابق والنتائج على النماذج السابقة | مثال: دقيق للغاية التركيز على الاستخدام التقني وسهولة الاستخدام لأغراض الدمج في أنظمة الإنتاج |
يمكنك استخدام جدولك لتقييم "بطاقة البيانات" والتأكّد من أنّ القرّاء الذين يهمّهم المحتوى سيجدون "بطاقة البيانات" مفيدة. على الرغم من توفّر العديد من الطرق لتقييم "بطاقة البيانات"، فإنّ إحدى الطرق التي ننصح بها تتضمّن تقييم مدى خطورة المشاكل المتعلّقة بسهولة الاستخدام.
على الرغم من أنّ التعريفات الدقيقة يمكن أن تختلف، فإنّ مقياس الخطورة التالي يقدّم تقييمًا لمدى تعطُّل شيء ما وتأثير المشكلة بدون مراعاة تحديد الأولويات. في هذا السياق، نشير إلى سهولة استخدام "بطاقة البيانات"، والتي يمكن أن تؤثر في ثقة القارئ في "بطاقة البيانات" ومدى فائدتها إذا لم يتم حلّ المشاكل المتعلّقة بها.
- لتقييم مدى فائدة حالة "بطاقة البيانات" لكل مجموعة جمهور في جدولك السابق، أجِب عن الأسئلة في مقياس الخطورة التالي:
الانتهاك | درجة الفداحة | حلّ المشكلة |
ما هي الإجابات غير المفيدة للقارئ؟ | ما مدى إلحاح إصلاح هذه المشكلة على مقياس من 1 إلى 5؟ (ضَع علامة في مربّع الاختيار المناسب):
| ما هو الحل؟ |
3- الهدف هو تحقيق الحد الأدنى من المتطلبات
في أغلب الأحيان، يحدث أحد الأمرين التاليين عند إنشاء "بطاقة بيانات" للمرة الأولى:
- فالمعلومات الكثيرة تربك القراء.
- فالمعلومات القليلة جدًا تربك القرّاء.
بصفتك منشئ "بطاقة بيانات"، عليك تنظيم المعلومات الواردة فيها وتحديد أولوياتها. يوفّر مستند الشفافية الجيد سياقًا كافيًا للقراء لفهم المعلومات بوضوح. إذا لم يكن الأمر كذلك، سيتم إخبارهم بالمكان الذي يجب الانتقال إليه بعد ذلك.
عليك تقديم معلومات تجعل مجموعة البيانات سهلة الفهم والاستخدام. في بعض الأحيان، تزداد درجة تعقيد مجموعة البيانات، ما يؤثر في كثافة المعلومات والتفسيرات التي تحتاج إلى تلخيصها في "بطاقة البيانات".
بغض النظر عن مستوى خبرة القراء، يمكن لأي شخص أن يشعر بتخمة المعلومات، لذا من المهم تقديم المعلومات الصحيحة، والتي تشمل ما يلي:
- نوع المعلومات التي يجب تقديمها
- مقدار المعلومات التي يمكنك تقديمها
- التفاصيل الواردة فيه
يجب أن تلخّص إجاباتك كل شيء قدر الإمكان بدون تفصيل كل شيء، وأن تعكس السياق اللازم ليتمكّن القراء من الحصول على إحصاءات حول مجموعة البيانات.
الاستدلالات
لقد أنشأنا مجموعة من الإرشادات التي يمكنك استخدامها لتقييم التجربة العامة لقراءة "بطاقة البيانات". نرى أنّ هذه الإرشادات هي أهداف يجب أن تستوفيها "بطاقات البيانات" لكي تكون ناجحة ويتم استخدامها بشكل مناسب وعلى نطاق واسع. يتضمّن الجدول التالي هذه الأهداف وأوصافها:
الهدف | الوصف |
مُتسق | يجب أن تكون بطاقات البيانات قابلة للمقارنة مع بعضها البعض بغض النظر عن طريقة عرض البيانات أو نطاقها، وذلك لتسهيل تفسير المطالبات والتحقّق من صحتها ضمن سياق الاستخدام. على الرغم من أنّ نشر "بطاقات البيانات" لمرة واحدة سهل نسبيًا، نرى أنّ الفِرق والمؤسسات تحتاج إلى الحفاظ على إمكانية المقارنة عند توسيع نطاق الاستخدام. |
شامل | بدلاً من إنشاء "بطاقة بيانات" كخطوة أخيرة في دورة حياة مجموعة البيانات، يجب أن يكون من السهل إنشاء "بطاقة بيانات" في الوقت نفسه مع مجموعة البيانات. بالإضافة إلى ذلك، يجب توزيع مسؤولية إكمال الحقول في "بطاقة البيانات" وتعيينها للشخص الأنسب. ويتطلّب ذلك استخدام طرق موحّدة تتجاوز "بطاقة البيانات"، ويتم تطبيقها على التقارير المختلفة التي يتم إنشاؤها في دورة حياة مجموعة البيانات. |
مفهومة وموجزة | تختلف مستويات إتقان القراءة لدى المستخدمين، ما يؤثر في تفسيرهم لـ "بطاقة البيانات". في السيناريوهات التي تختلف فيها كفاءة الجهات المعنية، يصبح الأفراد الذين لديهم أقوى نموذج ذهني لمجموعة البيانات هم صانعو القرار الفعليون. أخيرًا، يمكن أن تؤدي المهام الأكثر إلحاحًا أو صعوبة إلى الحد من مشاركة الجهات المعنية غير التقليدية في اتخاذ القرارات، والتي تُترك "للخبير". ويؤدي ذلك إلى إغفال وجهات نظر مهمة تعكس الاحتياجات المحددة للأطراف المعنية في المراحل اللاحقة والموازية. يجب أن تنقل "بطاقة البيانات" المعلومات إلى القارئ بأقل مستوى من الكفاءة، وأن تتيح للقراء الأكثر كفاءة العثور على مزيد من المعلومات حسب الحاجة. يجب أن يساهم المحتوى والتصميم في تعزيز عملية التفكير لدى القارئ بدون إرباكه، وأن يشجّعا تعاون الجهات المعنية للوصول إلى نموذج ذهني مشترك لمجموعة البيانات من أجل اتخاذ القرارات. |
4. تسجيل نتائج مقاييسك الإرشادية
- لمراجعة الإجابات عن "بطاقة البيانات"، استخدِم بطاقة الأداء التالية التي أنشأناها لتسجيل كل قاعدة إرشادية. في النهاية، يمكنك احتساب النتيجة الإجمالية لـ "بطاقة البيانات"، ما يساعدك في تتبُّع تقدّمك. يمكنك أيضًا تضمين تعليقات لتسجيل سياق إضافي وبنود عمل مطلوبة لتحسين كل قاعدة إرشادية.
الاستدلال | المعايير | التعليقات | النتيجة |
قيِّم بطاقة البيانات المكتملة بنفسك استنادًا إلى الإرشادات التجريبية التالية. | معايير الإرشادات | دوِّن ملاحظات خاصة حول المجالات التي يمكن تحسين بطاقة البيانات فيها. | أرقام فقط، النتيجة الذاتية (0-10) |
مفهوم |
| . | . |
شاملة |
| . | . |
متسقة |
| . | . |
موجزة |
| . | . |
إجمالي النتيجة = (إجمالي النقاط/120) | . | . | /120 |
5- تحليل مدروس
نحن نعلم أنّ البيانات هي معلومات عن أشخاص أو ثقافات أو أنشطة تجارية تم جمعها بطريقة منظَّمة لغرض محدّد. ومع ذلك، وكما ذكرنا مرارًا وتكرارًا، فإنّها جميعًا دقيقة، وتتداخل مع عدة جوانب بدرجات متفاوتة. وبالتالي، يتيح لك التحليل الذي تجريه على مجموعة البيانات إمكانية الاطّلاع على الأفكار التي تمّت مراعاتها عند إنشاء مجموعة البيانات نفسها، ما يساعدك على فهم تفاصيلها المعقّدة.
على سبيل المثال، يمكن أن يستكشف التحليل المتقاطع للأشخاص مجموعات العوامل البشرية ضمن مجموعة بيانات لتحديد النتائج المحتملة غير المتناسبة، مثل عندما يحقّق نموذج تم تدريبه على مجموعة بيانات أداءً أفضل لمجموعة فرعية من غيرها. يحلّل التحليل المجزّأ مجموعة البيانات استنادًا إلى عوامل مختلفة للكشف عن أنماط مهمة للمجموعات الفرعية أو المجموعات المهمّشة التي عادةً ما يتم إخفاؤها من خلال بيانات مجمّعة أكبر، وذلك حتى يتمكّن القرّاء من توقّع النتائج.
من خلال ذلك، نجد أنّ التقاطع والتحليلات المجزّأة (IDA) هما طريقتان فعّالتان لعرض مجموعة من النتائج المحتملة في ظل ظروف مختلفة في "بطاقة البيانات" من خلال إنشاء علاقات واضحة في مجموعة البيانات. يمكن أن تقدّم أداة "تحليل البيانات الذكي" للقراء أدلة مهمة حول التمثيل في مجموعة البيانات، مثل كيفية ارتباط التصنيفات بالكيانات الحساسة، والثغرات في مجموعة البيانات، مثل احتواء مجموعة البيانات على صور فوتوغرافية تم التقاطها خلال النهار فقط، والعلاقة بين المتغيرات التي يمكن أن تؤدي بعد ذلك إلى تعلُّم نماذج الذكاء الاصطناعي ارتباطات زائفة أو اختيار بدائل. تصبح هذه التحليلات أكثر فائدةً عندما تكون مرتبطة بظروف واقعية تعكس التجربة التي قد يواجهها المستخدمون المتأثرون مع منتج أو خدمة تستخدم مجموعة البيانات الخاصة بك.
على سبيل المثال، يساعد عرض نتائج تحليل IDA في "بطاقة البيانات" القرّاء على بناء فهم استباقي لكيفية أداء نموذج تعلُّم الآلة على المجموعات الفرعية، المعروفة أيضًا باسم الشرائح، في مجموعة البيانات. على الرغم من أنّ ذلك يتطلّب من صنّاع مجموعات البيانات أن يكونوا أكثر اجتهادًا في تحليلاتهم لمجموعة البيانات وطريقة عرضها في "بطاقة البيانات"، يمكن أن يؤدي ذلك في النهاية إلى تحقيق نتائج أفضل للمنتج بالنسبة إلى الجهات المعنية.
يمكن أن تساعد IDA القرّاء في فهم كيفية استخدام مجموعة البيانات في نماذجهم بشكل أفضل. إذا واجهت صعوبة، يمكنك الاستعانة بخبراء وفرق منتجات وأشخاص لديهم تجارب مشابهة للمساعدة في وضع إطار لتحليلاتك. غالبًا ما تكون الأفكار الرئيسية في سياقات تحتاج إلى شرح للقراء أو تتطلّب دعمًا إضافيًا حتى يتمكّن القراء من تفسيرها بشكل مناسب.
6. تحليل بياناتك
لتحليل مجموعة البيانات، اتّبِع الخطوات التالية:
- استكشاف البيانات قبل بدء التحليل: يمكنك تطوير فهم بديهي للانحرافات وعدم التوازن في مجموعة البيانات باستخدام أداة، مثل التحقّق من صحة البيانات في TensorFlow (TFDV) أو أداة تفسير التعلّم (LIT). استخدِم النتائج لإثراء تصميم التحليل.
- صمِّم تحليلك بعناية. تتأثر نتائج التحليل بشكل كبير بأهداف التقييم، وإمكانية الوصول إلى الخبرات والموارد اللازمة لإجراء التحليل، ووقت ومكان إجراء التحليل، وسياقات نماذج الذكاء الاصطناعي التي يتم فيها إجراء التحليل.
- ابدأ بالعوامل ذات الصلة بالاستخدام المقصود. يجب التركيز على العوامل الديمغرافية والاجتماعية الثقافية والسلوكية والشكلية التي يمكن أن تؤثّر بشكل كبير في حالات الاستخدام المقصودة عند إنشاء مجموعات الاهتمامات، ثم التوسّع من هناك.
- الإبلاغ عن المحتوى بدون إضافة تعليق: يُرجى العِلم أنّ العوامل والافتراضات التي تؤثر في تحليلات العدالة موجودة في البُنى الاجتماعية المحددة تاريخيًا وثقافيًا والتي يصعب تحديدها كميًا. احرص على عدم إضافة تعليقات قد تربك القارئ. بدلاً من ذلك، قدِّم طرقًا لإعادة إنتاج التحليلات التي يمكن أن تساعد القرّاء في معايرة النتائج في سياقهم الخاص.
- خطِّط للمستقبل: ضع في اعتبارك العوامل الإضافية التي قد تظهر في المستقبل من خلال النظر إلى التمثيل في مجموعة البيانات، أو الحفاظ على ثبات القيم في سيناريوهات مختلفة، أو الجمع بين التحليل ومجموعة من قيم العوامل الإضافية ذات الصلة بمجموعة البيانات.
- توفير المزيد من السياق للنتائج التي لا يمكن إعادة إنتاجها: إذا لم تتمكّن الجهات المعنية من إعادة إنتاج المقاييس، قدِّم سياقًا كافيًا حول التحليل. إذا كان بإمكان القارئ استخدام هذه المعلومات لتقييم مزايا مجموعة البيانات وعيوبها، يمكن أن يؤدي ذلك إلى بناء الثقة في مجموعة البيانات.
7. تهانينا
تهانينا! تتوفّر بعض الطرق لتقديم الإجابات الصحيحة في "بطاقة البيانات". أنت الآن جاهز لتدقيقها.