1. ประเภทของผู้มีส่วนเกี่ยวข้อง
ก่อนที่จะเริ่มพยายามสร้างความโปร่งใสในการจัดทำเอกสารชุดข้อมูลและสร้างการ์ดข้อมูล คุณควรระบุและเชิญผู้มีส่วนเกี่ยวข้องจากทั่วทั้งวงจรของชุดข้อมูล ซึ่งจะช่วยให้สร้างการ์ดข้อมูลได้ง่ายขึ้น เนื่องจากมีทุกอย่างที่คุณต้องการเพื่อพิจารณาอย่างรอบคอบยิ่งขึ้นขณะสร้างเนื้อหา
เราได้สร้างการจัดประเภทที่จะช่วยให้คุณค้นพบสมมติฐานที่มักใช้กับผู้มีส่วนเกี่ยวข้องแต่ละราย เพื่อช่วยให้คุณสำรวจและทำความเข้าใจวิธีที่ผู้มีส่วนเกี่ยวข้องแบบข้ามฟังก์ชันมีส่วนร่วมในกระบวนการวงจรข้อมูล การแบ่งประเภทของเราแบ่งออกเป็นกลุ่มผู้มีส่วนเกี่ยวข้อง 3 กลุ่มที่เกี่ยวข้องกับวงจรของชุดข้อมูล ได้แก่ ผู้ผลิต ตัวแทน และผู้ใช้
การจัดประเภทนี้แสดงถึงความต่อเนื่องของความต้องการและความคาดหวังที่เปลี่ยนแปลงอยู่ตลอดเวลาจากชุดข้อมูลและเอกสารประกอบ ไม่มีวิธีแก้ปัญหาที่ใช้ได้กับทุกสถานการณ์
โปรดิวเซอร์
ผู้ผลิตคือผู้สร้างชุดข้อมูลและเอกสารประกอบ และมีหน้าที่รับผิดชอบในการรวบรวม การเป็นเจ้าของ การเปิดตัว และการบำรุงรักษาชุดข้อมูล
โดยพื้นฐานแล้ว คุณสามารถคิดว่าผู้ผลิตคือผู้ที่รับผิดชอบในการผลิตและเผยแพร่ชุดข้อมูล รวมถึงการเปิดตัว การนำไปใช้ และ/หรือความสำเร็จ
นอกจากนี้ ผู้ผลิตยังอาจเป็นบุคคลหรือกลุ่มที่ได้รับการคัดเลือกให้รวบรวมหรือติดป้ายกำกับข้อมูล และให้คำแนะนำเกี่ยวกับวิธีการหรือการตีความในจุดต่างๆ ระหว่างวงจรข้อมูล
ผู้ผลิตอาจหมายถึงสมาชิกในทีม พาร์ทเนอร์ ลูกค้า หรือแพลตฟอร์มโฮสติ้งข้อมูลทั้งในปัจจุบันและอนาคต ซึ่งทั้งหมดมีหน้าที่รับผิดชอบในการบํารุงรักษาหรือดูแลชุดข้อมูล การติดตั้งใช้งาน และการตรวจสอบ
ตัวแทน
ผู้ใช้คือผู้มีส่วนเกี่ยวข้องที่อ่านเอกสารประกอบชุดข้อมูลหรือการ์ดข้อมูล รวมถึงเอกสารประกอบอื่นๆ ที่เกี่ยวข้องกับโมเดลแมชชีนเลิร์นนิง (ML) และมีสิทธิ์ใช้หรือกำหนดวิธีที่ตนเองหรือผู้อื่นอาจใช้ชุดข้อมูลหรือระบบ AI ที่อธิบายไว้
เอเจนต์อาจมีบทบาทในการปฏิบัติงานหรือบทบาทผู้ตรวจสอบ ทั้งนี้ขึ้นอยู่กับโดเมนของเอเจนต์ เช่น นักวิจัยในสภาพแวดล้อมทางวิชาการที่ต้องการวัดการใช้งานชุดข้อมูลที่เหมาะสม หรือนักวิทยาศาสตร์ข้อมูลในทีมผลิตภัณฑ์ที่ต้องการพิจารณาความเหมาะสมโดยรวมของชุดข้อมูลที่เกี่ยวข้องกับการผสานรวมผลิตภัณฑ์
ความแตกต่างนี้มีความสำคัญเนื่องจากผู้ตรวจสอบรวมถึงผู้มีส่วนเกี่ยวข้องที่อาจไม่เคยใช้ชุดข้อมูลโดยตรง แต่ยังคงมีส่วนร่วมกับการ์ดข้อมูล เช่น ที่ปรึกษาในอุตสาหกรรม นักข่าวสืบสวน ตัวแทนชุมชน และนิติบุคคล ตัวแทนอาจมีความเชี่ยวชาญด้านเทคนิคในการไปยังส่วนต่างๆ ของข้อมูลที่นำเสนอในเอกสารประกอบชุดข้อมูลทั่วไปหรือไม่ก็ได้ แต่โดยทั่วไปแล้วจะมีสิทธิ์เข้าถึงความเชี่ยวชาญตามที่จำเป็น
ผู้ใช้
ผู้ใช้คือบุคคลและตัวแทนที่โต้ตอบกับผลิตภัณฑ์ที่ใช้โมเดลซึ่งได้รับการฝึกในชุดข้อมูล
ผู้ใช้อาจยินยอมให้ข้อมูลของตนเป็นส่วนหนึ่งของประสบการณ์การใช้งานผลิตภัณฑ์ แต่โดยทั่วไปแล้วผู้ใช้มักต้องการคำอธิบายและการควบคุมที่แตกต่างกันอย่างมากซึ่งอิงตามประสบการณ์การใช้งานผลิตภัณฑ์ แม้กระทั่งเมื่อพูดถึงชุดข้อมูล
สรุป
ตารางต่อไปนี้สรุปกลุ่มผู้มีส่วนเกี่ยวข้องตามคำอธิบาย ความรับผิดชอบ ตัวอย่าง และงานทั่วไป
กลุ่มผู้มีส่วนเกี่ยวข้อง | คำอธิบาย | ความรับผิดชอบ | ตัวอย่าง | งานทั่วไป |
โปรดิวเซอร์ | สร้างชุดข้อมูลและ/หรือเอกสารประกอบ | ออกแบบ สร้าง ทดสอบคุณภาพ จัดทำเอกสาร เปิดตัว นำไปใช้ บำรุงรักษา และอัปเดตชุดข้อมูล | นักวิจัย นักวิทยาศาสตร์ข้อมูลและนักวิเคราะห์ วิศวกรซอฟต์แวร์ รวมถึงผู้จัดการผลิตภัณฑ์และโปรแกรม | การนำชุดข้อมูลไปใช้ การเปิดเผยข้อมูล การเตรียมพร้อมสำหรับอนาคต ความเป็นธรรมและความปลอดภัย และการปรับปรุง |
ตัวแทน | ประเมินและใช้ชุดข้อมูลสำหรับงาน ผลิตภัณฑ์ องค์กร หรือชุมชนของตน | ใช้การ์ดข้อมูล แต่อาจไม่โต้ตอบกับชุดข้อมูลโดยตรง | วิศวกร ML หรือวิศวกรผลิตภัณฑ์ นักวิจัย ผู้ให้บริการบุคคลที่สาม ผู้เชี่ยวชาญเฉพาะด้าน อุตสาหกรรม ที่ปรึกษา ผู้เชี่ยวชาญด้านนโยบาย ผู้ให้บริการข้อมูล และผู้นำหรือผู้จัดการ | จัดการความซับซ้อน รับผิดชอบ ทำการแลกเปลี่ยน ปรับใช้กับเวอร์ชันที่ใช้งานจริง เก็บถาวร |
ผู้ใช้ | โต้ตอบกับผลิตภัณฑ์ อุปกรณ์ และแอปที่สร้างโดยเอเจนต์ที่ใช้ชุดข้อมูลของผู้ผลิต | อาจมีส่วนร่วมในการส่งข้อมูลผ่านผลิตภัณฑ์ และให้สัญญาณที่เป็นประโยชน์แก่โปรดิวเซอร์และเอเจนซี | ผู้มีส่วนร่วมด้านข้อมูล ผู้ใช้ผลิตภัณฑ์ และตัวแทนของกลุ่มประชากรตามรุ่นผู้ใช้ | ใช้ผลิตภัณฑ์ ทำความเข้าใจข้อมูลและความเป็นส่วนตัว แสดงความคิดเห็น และแจ้งข้อกังวล |
2. ทำแผนที่ผู้มีส่วนเกี่ยวข้อง
เมื่อคุ้นเคยกับประเภทข้อมูลของเราแล้ว คุณสามารถตรวจสอบวงจรข้อมูลของคุณเพื่อระบุผู้มีส่วนเกี่ยวข้องผ่านกิจกรรมการแมปพื้นฐานนี้ ขณะทำกิจกรรม ให้จดบันทึกว่าใครอาจโต้ตอบกับชุดข้อมูลหรือเอกสารประกอบ นอกจากนี้ ให้พิจารณาว่าผู้มีส่วนเกี่ยวข้องอาจมีส่วนร่วมในการ์ดข้อมูลได้อย่างไร
หากต้องการระบุผู้มีส่วนเกี่ยวข้อง ให้ทำตามขั้นตอนต่อไปนี้
- ระบุรายชื่อผู้ผลิตที่จะสร้างการ์ดข้อมูล
- ระบุรายชื่อเอเจนต์ที่จะอ่านและใช้การ์ดข้อมูล
- ระบุรายชื่อผู้ใช้ที่จะใช้หรือได้รับผลกระทบจากชุดข้อมูลที่อธิบายไว้ในการ์ดข้อมูล
- ใช้เทมเพลตต่อไปนี้เพื่อสร้างแผนที่ของผู้มีส่วนเกี่ยวข้อง บทบาทในการสร้างการ์ดข้อมูล และวัตถุประสงค์ของการ์ดข้อมูล แผนภาพนี้จะช่วยให้คุณทราบถึงความต้องการในขั้นตอนต่อๆ ไปของการจัดทำเอกสารชุดข้อมูล รวมถึงความสามารถในการกำหนดลำดับความสำคัญและความรับผิดชอบตลอดกระบวนการจัดทำเอกสารชุดข้อมูล
3. เส้นทางการให้ข้อมูลตัวแทน (AIJ)
เมื่อระบุผู้มีส่วนเกี่ยวข้องแล้ว คุณจะพิจารณาได้ว่าสิ่งใดที่จำเป็นต้องสื่อสารกับตัวแทน ซึ่งเป็นผู้มีส่วนเกี่ยวข้องหลักใน Data Card เพื่อให้ตัวแทนพร้อมรับความสำเร็จ
โดยปกติแล้ว ประสบการณ์ที่บุคคลได้รับเมื่อโต้ตอบกับเทคโนโลยีจะเรียกว่าเส้นทางของผู้ใช้ อย่างไรก็ตาม เรากำลังพูดถึงเอเจนต์ที่ต้องรวบรวมข้อมูลเกี่ยวกับชุดข้อมูลให้เพียงพอเพื่อประกอบการตัดสินใจอย่างรอบคอบ เราจึงเรียกประสบการณ์เหล่านี้ว่าเส้นทางข้อมูลของเอเจนต์ (AIJ)
เป้าหมายของ AIJ คือการทำความเข้าใจสิ่งต่อไปนี้
- งานที่ตัวแทนอาจต้องการชุดข้อมูล
- ข้อมูลที่ตัวแทนต้องใช้เพื่อทำงานให้เสร็จสมบูรณ์
- กระบวนการที่เอเจนต์อนุมานข้อมูล
AIJ มีดังนี้
ตัวอย่าง
เช่น สมมติว่าตัวแทนของคุณคนหนึ่งเป็นนักวิทยาศาสตร์ข้อมูล AIJ สำหรับนักวิทยาศาสตร์ข้อมูลอาจมีลักษณะดังนี้
ในฐานะนักวิทยาศาสตร์ข้อมูล ฉันต้องการทราบโครงสร้างของชุดข้อมูล จึงถามว่า...
... รูปแบบข้อมูลคืออะไร
... ชุดข้อมูลมีรูปแบบใด
... มีฟีเจอร์กี่รายการในชุดข้อมูล
... มีการออกแบบฟีเจอร์กี่รายการ
... ฟีเจอร์ใดที่สัมพันธ์กันอย่างมาก
... หากมีทรัพยากรที่ขึ้นต่อกันในโครงสร้าง
ต่อไปนี้เป็นอีกตัวอย่างหนึ่งสำหรับตัวแทนที่อาจทำงานในนโยบายผลิตภัณฑ์และกำหนดหลักเกณฑ์ที่เกี่ยวข้องกับการผลิตและการพัฒนาผลิตภัณฑ์
ในฐานะผู้ช่วยด้านนโยบาย ฉันอยากทราบวิธีที่อาจมีการนำข้อมูลไปใช้ในทางที่ผิด จึงขอถามว่า...
... จุดประสงค์ในการใช้ชุดข้อมูลคืออะไร
... แอปพลิเคชันใดที่แจ้งให้สร้างชุดข้อมูล
... การใช้งานชุดข้อมูลที่ทราบว่าอันตรายหรือมีความเสี่ยงคืออะไร
... กลุ่มใดบ้างที่มีความเสี่ยง
... การใช้งานชุดข้อมูลนี้ตามที่ตั้งใจไว้ส่งผลต่อกลุ่มผู้มีสิทธิเลือกอย่างไร
... จะขอรับการชดเชยได้อย่างไร
4. เขียน AIJ ของคุณ
- เขียน AIJ 2-3 รายการโดยอิงตามพรอมต์ต่อไปนี้
- โปรดสังเกตว่าคุณไม่เพียงคำนึงถึงผู้มีส่วนเกี่ยวข้องเท่านั้น แต่ยังคำนึงถึงคำถามเบื้องต้นบางอย่างที่คุณคิดว่าผู้มีส่วนเกี่ยวข้องอยากได้คำตอบจากการอ่านการ์ดข้อมูลด้วย ซึ่งหมายความว่าคุณเข้าใกล้ชุดคำถามสุดท้ายที่คุณควรใส่ไว้ในการ์ดข้อมูลมากขึ้น
5. ทัศนศาสตร์
คุณอาจสังเกตเห็นการใช้คำว่ามุมมอง เลนส์ และขอบเขตเพื่อกำหนดกรอบ AIJ แม้ว่าเราจะกำหนดคำเหล่านี้ไว้ก่อนหน้านี้แล้ว แต่จริงๆ แล้วคำเหล่านี้เป็นส่วนหนึ่งของคำอุปมาที่ใช้เป็นแนวทางซึ่งเราเรียกว่าออปติก เราสร้างขึ้นเพื่อช่วยให้คุณคิดถึงวิธีที่เอเจนต์อาจทำความเข้าใจชุดข้อมูลของคุณ
ขอบเขต
ในด้านเลนส์ กล้องส่องใช้เลนส์และกระจกเพื่อส่อง สังเกต ขยาย สะท้อน และแม้กระทั่งทดสอบวัสดุ ในบริบทของชุดข้อมูล การเปรียบเทียบนี้เป็นเมตาฟอริกที่ยอดเยี่ยมเนื่องจากคุณมุ่งเน้นและกำหนดคำถามเพื่อเปิดเผยแง่มุมที่ชัดเจน ไม่ชัดเจน มองเห็นได้ และมองไม่เห็น
เราเรียกสิ่งนี้ว่าขอบเขต ซึ่งเป็นวิธีถามคำถามหลายๆ ข้อติดต่อกันเพื่อทำความเข้าใจชุดข้อมูล การซ้อนขอบเขตที่มีระดับความละเอียดต่างกันจะช่วยให้คุณสร้างเนื้อหาที่ช่วยให้ตัวแทนเข้าใจชุดข้อมูลได้อย่างสอดคล้องกันผ่านรายงานเพื่อความโปร่งใส
ตารางต่อไปนี้แสดงขอบเขต 3 ประเภทในเฟรมเวิร์กของเรา พร้อมคำอธิบาย ตัวอย่าง และวัตถุประสงค์ของแต่ละประเภท
ขอบเขต | คำอธิบาย | ตัวอย่าง | Purpose |
แบบยืดหดได้ | คำถามเกี่ยวกับแอตทริบิวต์ที่พบได้ทั่วไปในชุดข้อมูลหลายชุด โดยจะติดแท็กลักษณะเฉพาะ | ชุดข้อมูลนี้มีข้อมูลส่วนบุคคลที่ระบุตัวบุคคลนั้นได้ (PII) ไหม | แนะนำและกำหนดบริบทสำหรับข้อมูลเพิ่มเติมที่จะช่วยให้ตัวแทนของคุณไปยังการ์ดข้อมูลหรืออาร์ติแฟกต์ความโปร่งใสได้ |
Periscopic | คำถามเกี่ยวกับแอตทริบิวต์ที่เฉพาะเจาะจงกับชุดข้อมูลของผู้ผลิต โดยจะอธิบายการสังเกต | มีฟีเจอร์กี่รายการที่มี PII | โดยทั่วไปจะสงวนไว้สำหรับการระบุข้อมูลการดำเนินงาน เช่น รูปร่างและขนาดของชุดข้อมูล หรือข้อมูลการทำงาน เช่น แหล่งที่มาหรือความตั้งใจ |
เล็กมาก | คำถามเกี่ยวกับแง่มุมของชุดข้อมูลที่สังเกตไม่ได้ เช่น การตัดสินใจ กระบวนการ และผลกระทบ โดยผู้ใช้ต้องการคำอธิบาย | PII ได้รับการลบข้อมูลระบุตัวบุคคลในชุดข้อมูลนี้อย่างไร | ขอคำอธิบายโดยละเอียดเกี่ยวกับคำตัดสิน หรือสรุปเอกสารกระบวนการที่ยาวขึ้นซึ่งควบคุมคำตอบสำหรับคำถามที่เกี่ยวข้องในมุมมองแบบ Periscopic และ Telescopic |
คุณควรพิจารณาสขอบเขตทั้ง 3 ประเภทนี้ตลอดกระบวนการสร้างการ์ดข้อมูล การ์ดข้อมูลที่มีเพียงกล้องโทรทรรศน์จะอธิบายเฉพาะข้อมูลที่ชัดเจนเกี่ยวกับชุดข้อมูลและไม่ได้เพิ่มคุณค่าที่แตกต่าง การ์ดข้อมูลที่มีเฉพาะภาพสโคปอาจมีรายละเอียดทางเทคนิคมากเกินไปโดยไม่มีรายละเอียดเกี่ยวกับบริบท ความเกี่ยวข้อง หรือความสําคัญ การ์ดข้อมูลที่มีเพียงกล้องจุลทรรศน์อาจทําให้ตัวแทนหลงทางในรายละเอียดและมองข้ามภาพรวมได้ง่าย
ด้วยเหตุนี้ เราจึงพบว่าการตีความ Data Card ได้รับอิทธิพลอย่างมากจากการมีหรือไม่มีขอบเขตระดับต่างๆ เหล่านี้ คำถามเหล่านี้ช่วยให้เอเจนต์และโปรดิวเซอร์ประเมินความเสี่ยง วางแผนการลดความเสี่ยง และระบุโอกาสในการสร้างชุดข้อมูลที่ดีขึ้น (หากเกี่ยวข้อง) กล้องโทรทรรศน์ กล้องปริทรรศน์ และกล้องจุลทรรศน์จะให้รายละเอียดที่เป็นประโยชน์เพื่อให้ผู้มีส่วนเกี่ยวข้องจำนวนมากสามารถไปยังส่วนต่างๆ ของการ์ดข้อมูลได้โดยไม่สับสนและหลงทาง
ตัวอย่าง
ในส่วนเส้นทางข้อมูลตัวแทน (AIJ) คุณได้เห็นตัวอย่าง AIJ บางส่วน รวมถึง AIJ สำหรับนักวิทยาศาสตร์ข้อมูล หากพิจารณาตัวอย่างนั้นอย่างละเอียด คุณอาจพบว่าสามารถจัดกลุ่มคำถามบางคำถามตามขอบเขตได้ ซึ่งรวมถึงคำถามต่อไปนี้
ในฐานะนักวิทยาศาสตร์ข้อมูล ฉันต้องการทราบโครงสร้างของชุดข้อมูล จึงถามว่า...
เทเลสโคป
... รูปแบบข้อมูลคืออะไร
... ชุดข้อมูลมีรูปแบบใด
Periscopic
... มีฟีเจอร์กี่รายการในชุดข้อมูล
... มีการออกแบบฟีเจอร์กี่รายการ
Microscopic
... ฟีเจอร์ใดที่สัมพันธ์กันอย่างมาก
... หากมีทรัพยากรที่ขึ้นต่อกันในโครงสร้าง
คุณอาจเคยคิดคำถามที่เจาะลึก ครอบคลุม และเฉพาะเจาะจงโดยคำนึงถึงตัวแทนอยู่แล้ว
6. ปรับโครงสร้าง AIJ ด้วยขอบเขต
- หากต้องการปรับโครงสร้าง AIJ โดยใช้ขอบเขต ให้ใช้พรอมต์ตัวอย่างต่อไปนี้
7. ขอแสดงความยินดี
ยินดีด้วย คุณเริ่มสร้างการ์ดข้อมูล ตอนนี้คุณพร้อมที่จะประเมินคำถามแล้ว