1. تصنيف الأطراف المعنية
قبل البدء في جهود الشفافية بشأن توثيق مجموعات البيانات وإنشاء "بطاقات بيانات"، من المهم تحديد الأطراف المعنية ودعوتهم من جميع مراحل دورة حياة مجموعة البيانات. يسهّل ذلك إنشاء "بطاقات البيانات" لأنّه يزوّدك بكل ما تحتاج إليه لتقديم اعتبارات أقوى أثناء إنشاء المحتوى.
لمساعدتك في استكشاف وفهم كيفية تفاعل الجهات المعنية المتعددة الوظائف في عملية دورة حياة مجموعة البيانات، أنشأنا تصنيفًا يتيح لك الكشف عن الافتراضات التي يتم وضعها غالبًا بشأن الجهات المعنية الفردية. يتم تقسيم تصنيفنا إلى ثلاث مجموعات من الجهات المعنية المشاركة في دورة حياة مجموعة البيانات: المنتجون والوكلاء والمستخدمون.
يمثّل هذا التصنيف سلسلة متصلة من الاحتياجات والتوقعات المتغيرة باستمرار من مجموعات البيانات ومستنداتها. لا يوجد حل واحد يناسب الجميع.
المنتجون
المنتجون هم منشئو مجموعات البيانات والمستندات، وهم المسؤولون عن جمع مجموعات البيانات وملكيتها وإطلاقها وصيانتها.
في الأساس، يمكنك اعتبار المنتجين هم المسؤولون عن إنتاج مجموعات البيانات ونشرها وإطلاقها واستخدامها و/أو نجاحها.
يمكن أن يكون المنتجون أيضًا الأفراد أو المجموعات الذين تم توظيفهم لجمع البيانات أو تصنيفها، وتقديم المشورة بشأن الأساليب أو التفسير في نقاط مختلفة خلال دورة حياة البيانات.
استنادًا إلى السياق، يمكن أن يمثّل المنتجون أيضًا أعضاء فريقك الحاليين والمستقبليين أو شركائك أو عملائك أو منصات استضافة البيانات، وكلّهم مسؤولون عن صيانة مجموعات البيانات أو صيانتها ونشرها ومراقبتها.
الوكلاء
الجهات المعنية هي الأطراف التي تقرأ مستندات مجموعة البيانات أو "بطاقة البيانات" والمستندات الأخرى ذات الصلة بنماذج تعلُّم الآلة، ولديها القدرة على استخدام مجموعات البيانات أو أنظمة الذكاء الاصطناعي الموصوفة أو تحديد كيفية استخدامها أو استخدام الآخرين لها.
اعتمادًا على مجالاتهم، يمكن أن يكون لدى الوكلاء دور تشغيلي أو دور مراجع، مثل باحث في مؤسسة أكاديمية يريد قياس الاستخدام المناسب لمجموعة بيانات أو عالم بيانات في فريق منتج يريد تحديد مدى ملاءمة مجموعة البيانات بشكل عام في ما يتعلق بتكامل المنتج.
هذا التمييز مهم لأنّ المراجعين يشملون الجهات المعنية التي قد لا تستخدم مجموعة البيانات بشكل مباشر أبدًا، ولكنها تظل تتفاعل مع "بطاقة البيانات"، مثل المستشارين في المجال والصحفيين الاستقصائيين وممثلي المجتمع والكيانات القانونية. قد يمتلك العملاء أو لا يمتلكون الخبرة الفنية اللازمة للتعامل مع المعلومات المقدَّمة في مستندات مجموعات البيانات النموذجية، ولكن غالبًا ما يمكنهم الاستعانة بخبراء عند الحاجة.
المستخدِمون
المستخدِمون هم الأفراد والممثّلون الذين يتفاعلون مع المنتجات التي تعتمد على نماذج تم تدريبها على مجموعات البيانات.
قد يوافق المستخدمون على تقديم بياناتهم كجزء من تجربة المنتج، ولكنهم يحتاجون عادةً إلى مجموعة مختلفة تمامًا من التفسيرات وعناصر التحكّم المستندة إلى تجارب المنتج، حتى عندما يتعلق الأمر بمجموعات البيانات.
ملخّص
يلخّص الجدول التالي مجموعات الجهات المعنية حسب أوصافها ومسؤولياتها وأمثلتها ومهامها الشائعة:
مجموعة الأطراف المعنية | الوصف | المسؤوليات | أمثلة | المهام الشائعة |
المنتِجون | إنشاء مجموعات بيانات و/أو مستندات | تصميم مجموعات البيانات وإنشاؤها واختبار جودتها وتوثيقها وإطلاقها واستخدامها وصيانتها وتحديثها | الباحثون وعلماء البيانات والمحلّلون ومهندسو البرامج ومدراء المنتجات والبرامج | اعتماد مجموعات البيانات والإفصاح عنها وتوافقها مع المستقبل والإنصاف والأمان والتحسينات |
الوكلاء | تقييم مجموعة البيانات واستخدامها في عملهم أو منتجاتهم أو مؤسساتهم أو منتدياتهم | استخدام "بطاقة البيانات"، ولكن قد لا يتفاعل مع مجموعة البيانات نفسها | مهندسو تعلُّم الآلة أو المنتجات والباحثون ومورّدو الجهات الخارجية وخبراء الموضوع والصناعة والاستشاريون وخبراء السياسات ومقدّمو خدمات البيانات والقادة أو المدراء | إدارة التعقيد وتحمّل المسؤولية والموازنة بين الخيارات والنشر في مرحلة الإنتاج والأرشفة |
المستخدمون | التفاعل مع المنتجات والأجهزة والتطبيقات التي أنشأها وكلاء يستخدمون مجموعات بيانات المنتج | المساهمة في بياناتهم من خلال المنتجات، وتقديم إشارات مفيدة للمنتجين والوكلاء | المساهمون في البيانات ومستخدمو المنتجات وممثلو المجموعات النموذجية للمستخدمين | استخدام المنتجات وفهم البيانات والخصوصية وتقديم الملاحظات وإثارة المخاوف |
2. تحديد الأطراف المعنية
بعد أن أصبحت على دراية بأسلوبنا في التصنيف، يمكنك مراجعة دورة حياة مجموعة البيانات لتحديد الجهات المعنية من خلال نشاط الربط الأساسي هذا. أثناء تنفيذ النشاط، دوِّن ملاحظات حول المستخدمين الذين قد يتفاعلون مع مجموعة البيانات أو مستنداتها. ضَع في اعتبارك أيضًا كيف يمكن للأطراف المعنية المساهمة في "بطاقات البيانات".
لتحديد الأطراف المعنية، اتّبِع الخطوات التالية:
- أدرِج المنتجين الذين سينشئون بطاقات البيانات.
- أدرِج العملاء الذين سيقرأون بطاقات البيانات ويستخدمونها.
- أدرِج المستخدمين الذين سيستخدمون مجموعة البيانات أو سيتأثّرون بها الموضّحة في "بطاقة البيانات".
- استخدِم النموذج التالي لإنشاء خريطة للأطراف المعنية وأدوارهم في إنشاء "بطاقات البيانات" والغرض من "بطاقات البيانات". تمنحك هذه الخريطة فكرة عن احتياجات مستندات مجموعة البيانات، كما تتيح لك تحديد الأولويات والمسؤوليات خلال عملية إعداد مستندات مجموعة البيانات.
3- رحلات معلومات الوكيل (AIJ)
بعد تحديد الأطراف المعنية، يمكنك تحديد المعلومات الأساسية التي يجب نقلها إلى العملاء، وهم الأطراف المعنية الرئيسية، في "بطاقة البيانات" حتى تتمكّن من إعدادهم لتحقيق النجاح.
عادةً ما يُطلق على التجربة التي يمر بها الشخص عند التفاعل مع التكنولوجيا اسم رحلة المستخدم. مع ذلك، نحن نتحدث عن وكيل يحتاج إلى الحصول على معلومات كافية حول مجموعة بيانات لاتخاذ قرار مدروس، لذا نسمّي هذه التجارب رحلة معلومات الوكيل (AIJ).
يهدف تقييم الأثر إلى فهم ما يلي:
- المهام التي قد يحتاج فيها العملاء إلى مجموعة بيانات
- المعلومات التي يحتاج إليها الموظفون لإكمال مهامهم
- العملية التي يستنتج من خلالها الوكلاء المعلومات.
تشمل "الصور من إنشاء الذكاء الاصطناعي" ما يلي:
مثال
على سبيل المثال، لنفترض أنّ أحد وكلائك هو عالم بيانات. قد تبدو "مهمة الذكاء الاصطناعي" لعالم بيانات على النحو التالي:
بصفتي عالم بيانات، أريد معرفة بنية مجموعة البيانات، لذا أطرح السؤال التالي:
... ما هو تنسيق البيانات؟
... ما هي طريقة عرض مجموعة البيانات؟
... كم عدد السمات في مجموعة البيانات؟
... كم عدد الميزات التي تم تصميمها؟
... ما هي الميزات التي ترتبط ارتباطًا وثيقًا؟
... إذا كانت هناك أي تبعيات في البنية؟
في ما يلي مثال آخر على موظف قد يعمل في قسم سياسات المنتجات ويضع إرشادات متعلقة بإنتاج المنتجات وتطويرها:
بصفتي مساعدًا في وضع السياسات، أريد معرفة كيف يمكن إساءة استخدام البيانات، لذا أسأل...
... ما هو الاستخدام المقصود لمجموعة البيانات؟
... ما هو التطبيق الذي أدّى إلى إنشاء مجموعة البيانات؟
... ما هي الاستخدامات المعروفة الخطيرة أو المحفوفة بالمخاطر لمجموعة البيانات؟
... ما هي المخاطر التي تواجه مجموعات معيّنة؟
... كيف تؤثّر الاستخدامات المقصودة لمجموعة البيانات هذه في الدوائر الانتخابية؟
... كيف يمكن طلب إعادة النظر في القرار؟
4. كتابة AIJ
- اكتب بعض الصور من إنشاء الذكاء الاصطناعي استنادًا إلى الطلبات التالية:
- لاحظ كيف أنّك لا تضع الأطراف المعنية في اعتبارك فحسب، بل أيضًا بعض الأسئلة الأولية التي تعتقد أنّهم يريدون الحصول على إجابات عنها من خلال قراءة "بطاقة البيانات". وهذا يعني أنّك أصبحت أقرب خطوة إلى مجموعة الأسئلة النهائية التي يجب تضمينها في "بطاقة البيانات".
5- البصريات
ربما لاحظت استخدام مصطلحات المنظور والعدسة والنطاق لتحديد إطارات عمل التقييم المستند إلى الذكاء الاصطناعي. على الرغم من أنّنا عرّفنا هذه المصطلحات سابقًا، إلا أنّها في الواقع جزء من استعارة إرشادية نسمّيها البصريات. لقد أنشأنا هذه النماذج لمساعدتك في التفكير في كيفية فهم برامج الدردشة لمجموعة البيانات الخاصة بك.
النطاقات
في علم البصريات، تستخدم المناظير العدسات والمرايا لرصد المواد ومراقبتها وتكبيرها وعكسها وحتى اختبارها. في سياق مجموعات البيانات، يشكّل هذا التشبيه أداة رائعة لأنّه يتيح لك التركيز على الأسئلة وتحديد إطارها للكشف عن الجوانب الواضحة وغير الواضحة والمرئية وغير المرئية.
نشير إلى ذلك باسم النطاقات، وهي وسيلة لطرح سلسلة من الأسئلة على التوالي لفهم مجموعات البيانات. من خلال ترتيب النطاقات ذات التفاصيل المختلفة، يمكنك إنشاء محتوى يساعد وكلاءك في التوصّل إلى فهم متماسك لمجموعات البيانات من خلال تقارير الشفافية.
يحتوي الجدول التالي على ثلاثة أنواع من النطاقات في إطارنا، بالإضافة إلى وصف ومثال والغرض من كل نوع:
المستوى | الوصف | مثال | Purpose |
تلسكوبي | أسئلة حول السمات الشائعة في مجموعات البيانات المتعددة يضعون علامات على الخصائص. | هل تحتوي مجموعة البيانات هذه على معلومات تحديد الهوية الشخصية؟ | قدِّم سياقًا للمعلومات الإضافية التي تساعد موظفي الدعم في التنقّل في "بطاقة البيانات" أو مستند الشفافية. |
Periscopic | أسئلة حول السمات الخاصة بمجموعة بيانات المنتج وهي تصف الملاحظات. | كم عدد الميزات التي تحتوي على معلومات تحديد الهوية الشخصية؟ | يتم حجزها بشكل عام لتقديم معلومات تشغيلية، مثل شكل مجموعة البيانات وحجمها، أو معلومات وظيفية، مثل المصادر أو النوايا. |
مجهري | أسئلة حول الجوانب غير القابلة للملاحظة في مجموعات البيانات، مثل القرارات والعمليات والتأثيرات ويطلبون تفسيرات. | كيف تم إخفاء هوية معلومات تحديد الهوية الشخصية في مجموعة البيانات هذه؟ | الحصول على تفسيرات مفصّلة للقرارات أو تلخيص مستندات العمليات الأطول التي تحكم الردود على الأسئلة ذات الصلة من منظور واسع ومن منظور ضيق |
من المهم مراعاة هذه الأنواع الثلاثة من النطاقات خلال عملية إنشاء "بطاقة البيانات". لا يصف "بطاقة البيانات" التي تحتوي على تلسكوبات فقط سوى المعلومات الواضحة حول مجموعة البيانات، ولا يضيف أي قيمة مميزة. يمكن أن تصبح "بطاقة البيانات" التي تحتوي على مناظير فقط تقنية بشكل مفرط بدون أي تفاصيل حول السياق أو الصلة أو الأهمية. قد تؤدي بطاقة البيانات التي تحتوي على رسوم بيانية دقيقة فقط إلى تشتيت انتباه العملاء بسهولة وإغفال الصورة الكبيرة.
لهذا السبب، نجد أنّ تفسيرات "بطاقة البيانات" تتأثر بشكل كبير بتوفّر أو عدم توفّر مستويات النطاقات هذه. تتيح هذه الأسئلة للوكلاء والمنتجين تقييم المخاطر والتخطيط لتخفيفها، وتحديد فرص إنشاء مجموعات بيانات أفضل عند الاقتضاء. توفّر التلسكوبات والمناظير الغواصة والمجاهر معًا تفاصيل مفيدة حتى يتمكّن العديد من الجهات المعنية من التنقّل في "بطاقة البيانات" بدون الشعور بالارتباك والضياع.
مثال
في قسم رحلات معلومات الوكيل (AIJ)، رأيت بعض الأمثلة على رحلات معلومات الوكيل، بما في ذلك رحلة معلومات عالم البيانات. إذا نظرت عن كثب إلى هذا المثال، قد تجد أنّه يمكنك تجميع بعض هذه الأسئلة حسب النطاقات، بما في ذلك الأسئلة التالية:
بصفتي عالم بيانات، أريد معرفة بنية مجموعة البيانات، لذا أطرح السؤال التالي:
تلسكوبي
... ما هو تنسيق البيانات؟
... ما هي طريقة عرض مجموعة البيانات؟
Periscopic
... كم عدد السمات في مجموعة البيانات؟
... كم عدد الميزات التي تم تصميمها؟
مجهري
... ما هي الميزات التي ترتبط ارتباطًا وثيقًا؟
... إذا كانت هناك أي تبعيات في البنية؟
من المحتمل جدًا أنّك قد طرحت بعض الأسئلة المتعلّقة بالتلسكوب والمنظار الدقيق والمجهر مع وضع عملائك في الاعتبار.
6. إعادة هيكلة ملفات AIJ باستخدام النطاقات
- لإعادة هيكلة طلبات AIJ باستخدام النطاقات، استخدِم نموذج الطلب التالي:
7. تهانينا
تهانينا! بدأت في إنشاء "بطاقة بيانات". أنت الآن جاهز لتقييم أسئلتك.