1. การกำหนดประเด็นสำคัญ
คุณได้เลือกชุดคำถามที่ต้องการรวมไว้ในการ์ดข้อมูล ซึ่งเป็นคำถามที่คุณคิดว่าสำคัญสำหรับผู้อ่าน อย่างไรก็ตาม การสร้างการ์ดข้อมูลไม่ได้ง่ายเพียงแค่ตอบคำถามเหล่านี้ เราต้องพิจารณาอย่างรอบคอบเพื่อให้มั่นใจว่าการ์ดข้อมูลสุดท้ายได้รับการเพิ่มประสิทธิภาพเพื่อประสบการณ์การอ่านที่ดีที่สุด
เมื่ออ่านการ์ดข้อมูล ผู้ใช้ต้องการตัดสินใจที่เฉพาะเจาะจงมาก เช่น
- ชุดข้อมูลนี้เหมาะกับกรณีการใช้งานของฉันไหม
- ฉันอนุญาตให้ผู้อื่นใช้ชุดข้อมูลนี้ได้ไหม
- ฉันจะใช้ชุดข้อมูลนี้อย่างปลอดภัยโดยไม่เพิ่มความเสี่ยงให้กับโมเดลได้อย่างไร
หากผู้อ่านเข้าถึงข้อมูลที่ถูกต้องได้อย่างมีประสิทธิภาพ ผู้อ่านจะมีความเชี่ยวชาญอย่างยิ่งในการตัดสินใจเกี่ยวกับชุดข้อมูลภายในบริบทของตน ความสำคัญหรือประโยชน์ของข้อมูลขึ้นอยู่กับประเภทของการตัดสินใจที่ผู้อ่านต้องทำและพื้นฐานของผู้อ่าน ตัวอย่างเช่น เมื่อตัดสินใจว่าจะใช้ชุดข้อมูลหรือไม่ เจ้าหน้าที่ดูแลการปฏิบัติตามข้อกำหนดอาจดูใบอนุญาตที่เชื่อมโยงกับชุดข้อมูลนั้น แต่วิศวกรจะดูที่สแต็กเทคโนโลยี ผู้อ่านทั้ง 2 กลุ่มถามคำถามเดียวกัน แต่คาดหวังคำตอบที่แตกต่างกัน
การ์ดข้อมูลควรอธิบายชุดข้อมูลอย่างครอบคลุมเพื่อให้ผู้อ่านตัดสินใจได้อย่างมั่นใจ คำอธิบายที่ครอบคลุมเหล่านี้จะช่วยให้คุณตัดสินใจได้ว่าต้องการให้ผู้อ่านได้รับอะไรจาก Data Card และกำหนดประเภทข้อมูลที่ถูกต้อง ครอบคลุม และจัดระเบียบเพื่อบันทึกไว้ใน Data Card แน่นอนว่าความท้าทายคือคุณไม่สามารถระบุการตัดสินใจที่เป็นไปได้ทั้งหมดที่ผู้อ่านการ์ดข้อมูลของคุณต้องทำ
2. วางแผนการ์ดข้อมูล
- หากต้องการพิจารณาการตัดสินใจที่ผู้อ่านการ์ดข้อมูลต้องทำและรายละเอียดที่การ์ดข้อมูลควรมี ให้ตอบคำถามสำหรับแต่ละหมวดหมู่ในตารางต่อไปนี้
ผู้อ่าน | การตัดสินใจ | เป้าหมาย | ความเกี่ยวข้อง | Nuance |
กลุ่มเป้าหมายหลักคือใคร | ผู้ใช้จะตัดสินใจเกี่ยวกับชุดข้อมูลอย่างไร | ผู้ใช้ต้องการอะไรจากการ์ดข้อมูล | ผู้ใช้ต้องการเนื้อหาใดจาก Data Card เพื่อให้บรรลุเป้าหมาย | คุณคิดว่าเนื้อหาของคุณควรมีรายละเอียดหรือความซับซ้อนมากน้อยเพียงใดเมื่อพิจารณาจากสิ่งที่ทราบเกี่ยวกับผู้อ่าน |
ตัวอย่าง: วิศวกรซอฟต์แวร์ด้านการผลิต | ตัวอย่าง: ฉันควรใช้ชุดข้อมูลเพื่อทดสอบโมเดลแมชชีนเลิร์นนิง (ML) ที่ใช้งานจริงไหม | ตัวอย่าง: สรุปภาพรวมของชุดข้อมูลให้ฉันหน่อย ช่วยบอกวิธีติดตั้งใช้งานหน่อย | ตัวอย่าง: การใช้งานตามวัตถุประสงค์และการใช้งานที่ไม่เหมาะสม การใช้งานที่ผ่านมา และผลลัพธ์ในรุ่นที่ผ่านมา | ตัวอย่าง: มีความแตกต่างกันอย่างมาก เน้นการใช้งานทางเทคนิคและความสามารถในการใช้งานเพื่อวัตถุประสงค์ในการผสานรวมเข้ากับระบบการผลิต |
คุณสามารถใช้ตารางเพื่อประเมินการ์ดข้อมูลและตรวจสอบว่าผู้อ่านที่มีลำดับความสำคัญสูงเห็นว่าการ์ดข้อมูลมีประโยชน์ แม้ว่าจะมีหลายวิธีในการประเมินการ์ดข้อมูล แต่เราขอแนะนำวิธีหนึ่งที่เกี่ยวข้องกับการให้คะแนนความรุนแรงของความสามารถในการใช้งาน
แม้ว่าคำจำกัดความที่แน่นอนอาจแตกต่างกัน แต่ระดับความรุนแรงต่อไปนี้จะให้คะแนนว่าสิ่งใดใช้งานไม่ได้และผลกระทบของปัญหาโดยไม่คำนึงถึงการจัดลำดับความสำคัญ ในบริบทนี้ เราหมายถึงความสามารถในการใช้งานของการ์ดข้อมูล ซึ่งหากไม่ได้รับการแก้ไข อาจส่งผลต่อความน่าเชื่อถือที่ผู้อ่านมีต่อการ์ดข้อมูลและความมีประโยชน์ของการ์ดข้อมูล
- หากต้องการประเมินว่าสถานะของการ์ดข้อมูลมีประโยชน์ต่อกลุ่มเป้าหมายแต่ละกลุ่มในตารางจากก่อนหน้านี้มากน้อยเพียงใด ให้ตอบคำถามในระดับความรุนแรงต่อไปนี้
การละเมิด | ระดับความรุนแรง | แก้ไข |
คำตอบใดที่ไม่มีประโยชน์ต่อผู้อ่าน | คุณคิดว่าควรแก้ไขปัญหานี้โดยด่วนเพียงใดในระดับ 1-5 (เลือกช่องทำเครื่องหมายที่เกี่ยวข้อง)
| วิธีแก้ปัญหา |
3. ตั้งเป้าหมายให้พอดี
โดยส่วนใหญ่แล้ว เมื่อคุณสร้างการ์ดข้อมูลแรก มักจะเกิดสิ่งใดสิ่งหนึ่งต่อไปนี้
- ข้อมูลมากเกินไปจะทำให้ผู้อ่านสับสน
- ข้อมูลน้อยเกินไปจะทำให้ผู้อ่านสับสน
ในฐานะครีเอเตอร์ของการ์ดข้อมูล คุณต้องดูแลจัดการและจัดลำดับความสำคัญของข้อมูลในการ์ด อาร์ติแฟกต์ความโปร่งใสที่ดีจะให้บริบทที่เพียงพอเพื่อให้ผู้อ่านเข้าใจได้อย่างชัดเจน หากไม่ถูกต้อง ระบบจะแจ้งให้ผู้ใช้ทราบว่าจะต้องไปที่ใดต่อ
คุณต้องการให้ข้อมูลที่ทำให้ชุดข้อมูลเข้าใจและใช้งานได้ง่าย บางครั้งความซับซ้อนของชุดข้อมูลจะเพิ่มขึ้น ซึ่งส่งผลต่อความหนาแน่นของข้อมูลและคำอธิบายที่คุณต้องสรุปในการ์ดข้อมูล
ไม่ว่าผู้อ่านจะมีความเชี่ยวชาญในระดับใด ทุกคนก็อาจได้รับข้อมูลมากเกินไป ดังนั้นคุณจึงควรนำเสนอข้อมูลที่ถูกต้อง ซึ่งรวมถึงข้อมูลต่อไปนี้
- ประเภทข้อมูลที่คุณควรระบุ
- คุณมีข้อมูลมากน้อยเพียงใด
- รายละเอียดในนั้น
คำตอบของคุณควรสรุปทุกอย่างให้ดีที่สุดโดยไม่ต้องลงรายละเอียดทุกอย่าง และสะท้อนบริบทที่จำเป็นเพื่อให้ผู้อ่านได้รับข้อมูลเชิงลึกเกี่ยวกับชุดข้อมูล
ฮิวริสติก
เราได้สร้างชุดฮิวริสติกที่คุณใช้ให้คะแนนประสบการณ์การอ่านการ์ดข้อมูลโดยรวมได้ เรามองว่าฮิวริสติกเหล่านี้เป็นวัตถุประสงค์ที่การ์ดข้อมูลต้องบรรลุเพื่อให้ประสบความสำเร็จและได้รับการนำไปใช้ในทางปฏิบัติและในวงกว้างอย่างเหมาะสม ตารางต่อไปนี้แสดงวัตถุประสงค์และคำอธิบาย
วัตถุประสงค์ | คำอธิบาย |
ความสอดคล้อง | การ์ดข้อมูลต้องเปรียบเทียบกันได้ไม่ว่าจะเป็นรูปแบบข้อมูลหรือโดเมนใดก็ตาม เพื่อให้การอ้างสิทธิ์ตีความและตรวจสอบได้ง่ายภายในบริบทของการใช้งาน แม้ว่าการติดตั้งใช้งานการ์ดข้อมูลแบบครั้งเดียวจะค่อนข้างง่าย แต่เราพบว่าทีมและองค์กรจำเป็นต้องรักษาความสามารถในการเปรียบเทียบไว้เมื่อขยายการใช้งาน |
ครอบคลุม | การ์ดข้อมูลควรสร้างได้ง่ายพร้อมกับชุดข้อมูล แทนที่จะสร้างเป็นขั้นตอนสุดท้ายในวงจรของชุดข้อมูล นอกจากนี้ ควรกระจายความรับผิดชอบในการกรอกข้อมูลใน Data Card และมอบหมายให้บุคคลที่เหมาะสมที่สุด ซึ่งต้องใช้วิธีการที่ได้มาตรฐานซึ่งขยายขอบเขตไปไกลกว่าการ์ดข้อมูล และใช้กับรายงานต่างๆ ที่สร้างขึ้นในวงจรของชุดข้อมูล |
เข้าใจง่ายและกระชับ | ผู้อ่านมีความเชี่ยวชาญในระดับต่างๆ ซึ่งส่งผลต่อการตีความการ์ดข้อมูล ในสถานการณ์ที่ความเชี่ยวชาญของผู้มีส่วนเกี่ยวข้องแตกต่างกัน บุคคลที่มีโมเดลทางความคิดที่แข็งแกร่งที่สุดของชุดข้อมูลจะกลายเป็นผู้มีอำนาจตัดสินใจโดยพฤตินัย สุดท้ายนี้ งานที่เร่งด่วนหรือท้าทายมากขึ้นอาจลดการมีส่วนร่วมของผู้มีส่วนเกี่ยวข้องที่ไม่ใช่แบบดั้งเดิมในการตัดสินใจ ซึ่งจะเหลือไว้ให้ "ผู้เชี่ยวชาญ" ซึ่งอาจทำให้ละเลยมุมมองที่สำคัญซึ่งสะท้อนถึงความต้องการที่เฉพาะเจาะจงของผู้มีส่วนได้ส่วนเสียทั้งในระดับล่างและระดับข้าง การ์ดข้อมูลควรสื่อสารกับผู้อ่านที่มีความเชี่ยวชาญน้อยที่สุดได้อย่างมีประสิทธิภาพ และช่วยให้ผู้อ่านที่มีความเชี่ยวชาญมากขึ้นค้นหาข้อมูลเพิ่มเติมได้ตามต้องการ เนื้อหาและการออกแบบควรช่วยให้กระบวนการพิจารณาของผู้ใช้ก้าวหน้าไปโดยไม่ทำให้ผู้ใช้รู้สึกว่ามีข้อมูลมากเกินไป และกระตุ้นให้ผู้มีส่วนเกี่ยวข้องร่วมมือกันเพื่อสร้างโมเดลทางความคิดร่วมกันของชุดข้อมูลสำหรับการตัดสินใจ |
4. ให้คะแนนฮิวริสติก
- หากต้องการตรวจสอบคำตอบของการ์ดข้อมูล ให้ใช้ตารางสรุปสถิติต่อไปนี้ที่เราสร้างขึ้นเพื่อให้คะแนนฮิวริสติกแต่ละรายการ ในตอนท้าย คุณสามารถนับคะแนนรวมของการ์ดข้อมูล ซึ่งจะช่วยให้คุณติดตามความคืบหน้าได้ นอกจากนี้ คุณยังใส่ความคิดเห็นเพื่อบันทึกบริบทเพิ่มเติมและรายการการดำเนินการที่จำเป็นในการปรับปรุงฮิวริสติกแต่ละรายการได้ด้วย
ฮิวริสติก | เกณฑ์ | ความคิดเห็น | คะแนน |
ให้คะแนนการ์ดข้อมูลที่กรอกเสร็จแล้วด้วยตนเองตามฮิวริสติกต่อไปนี้ | เกณฑ์สำหรับฮิวริสติก | โปรดจดบันทึกส่วนที่ควรปรับปรุงการ์ดข้อมูล | ตัวเลขเท่านั้น คะแนนที่ให้ตัวเอง (0-10) |
เข้าใจได้ |
| . | . |
ครอบคลุม |
| . | . |
สอดคล้องกัน |
| . | . |
กระชับ |
| . | . |
คะแนนรวม = (คะแนนรวม/120) | . | . | /120 |
5. การวิเคราะห์อย่างรอบคอบ
เราทราบดีว่าข้อมูลคือข้อมูลเกี่ยวกับผู้คน วัฒนธรรม หรือธุรกิจที่บันทึกไว้ในรูปแบบที่มีโครงสร้างเพื่อวัตถุประสงค์ที่เฉพาะเจาะจง อย่างไรก็ตาม ดังที่กล่าวซ้ำๆ ว่าทั้งหมดนี้มีความแตกต่างกัน โดยมีมิติข้อมูลหลายอย่างที่เกี่ยวข้องกันในระดับต่างๆ ดังนั้น การวิเคราะห์ที่คุณทําในชุดข้อมูลจะช่วยให้คุณเข้าใจแนวคิดที่ใช้ในการสร้างชุดข้อมูล ซึ่งจะช่วยให้คุณเข้าใจความซับซ้อนของชุดข้อมูล
ตัวอย่างเช่น การวิเคราะห์แบบตัดกันของบุคคลสามารถสำรวจการผสมผสานของปัจจัยด้านมนุษย์ภายในชุดข้อมูลเพื่อระบุผลลัพธ์ที่อาจไม่สมส่วน เช่น เมื่อโมเดลที่ฝึกในชุดข้อมูลทํางานได้ดีกว่าสําหรับกลุ่มย่อยหนึ่งๆ การวิเคราะห์แบบแยกย่อยจะแบ่งชุดข้อมูลตามปัจจัยต่างๆ เพื่อเผยให้เห็นรูปแบบที่สำคัญสำหรับกลุ่มย่อยหรือประชากรชายขอบซึ่งมักจะถูกบดบังด้วยข้อมูลรวมขนาดใหญ่ เพื่อให้ผู้อ่านคาดการณ์ผลลัพธ์ได้
ด้วยเหตุนี้ เราจึงพบว่าการวิเคราะห์แบบแยกย่อย (IDA) และการวิเคราะห์แบบตัดกันเป็นวิธีที่มีประสิทธิภาพในการสื่อสารผลลัพธ์ที่เป็นไปได้หลายอย่างภายใต้สถานการณ์ต่างๆ ในการ์ดข้อมูลผ่านการสร้างความสัมพันธ์ที่ชัดเจนในชุดข้อมูล IDA สามารถให้เบาะแสที่สำคัญแก่ผู้อ่านเกี่ยวกับการแสดงในชุดข้อมูล เช่น ความสัมพันธ์ระหว่างป้ายกำกับกับเอนทิตีที่ละเอียดอ่อน ช่องว่างในชุดข้อมูล เช่น ชุดข้อมูลมีเฉพาะรูปถ่ายที่ถ่ายในเวลากลางวัน และความสัมพันธ์ระหว่างตัวแปรที่อาจทำให้โมเดล AI เรียนรู้ความสัมพันธ์ที่ไม่ถูกต้องหรือเลือกใช้พร็อกซี การวิเคราะห์เหล่านี้จะมีประโยชน์มากยิ่งขึ้นเมื่ออยู่ในสถานการณ์จริงที่สะท้อนถึงประสบการณ์ที่ผู้ใช้ที่ได้รับผลกระทบอาจได้รับจากผลิตภัณฑ์หรือบริการที่ใช้ชุดข้อมูลของคุณ
ตัวอย่างเช่น การนำเสนอผลลัพธ์ของ IDA ในการ์ดข้อมูลจะช่วยให้ผู้อ่านสร้างสัญชาตญาณเกี่ยวกับประสิทธิภาพของโมเดล ML ในชุดข้อมูลย่อย หรือที่เรียกว่าสไลซ์ ในชุดข้อมูลของคุณได้ แม้ว่าวิธีนี้จะกำหนดให้ผู้สร้างชุดข้อมูลต้องวิเคราะห์ชุดข้อมูลและการนำเสนอใน Data Card อย่างละเอียดมากขึ้น แต่ในท้ายที่สุดแล้ววิธีนี้จะช่วยให้ผู้มีส่วนเกี่ยวข้องได้รับผลลัพธ์ของผลิตภัณฑ์ที่ดีขึ้น
IDA ช่วยให้ผู้อ่านเข้าใจวิธีใช้ชุดข้อมูลในโมเดลได้ดียิ่งขึ้น หากพบปัญหา ให้ปรึกษาผู้เชี่ยวชาญ ทีมผลิตภัณฑ์ และบุคคลที่มีประสบการณ์จริงเพื่อช่วยกำหนดกรอบการวิเคราะห์ IDA มักมีรากฐานมาจากบริบทที่ต้องอธิบายให้ผู้อ่านเข้าใจหรือต้องมีการสนับสนุนเพิ่มเติมเพื่อให้ผู้อ่านตีความได้อย่างเหมาะสม
6. วิเคราะห์ข้อมูลของคุณ
หากต้องการวิเคราะห์ชุดข้อมูล ให้ทำตามขั้นตอนต่อไปนี้
- สำรวจก่อนเริ่มการวิเคราะห์ พัฒนาสัญชาตญาณเกี่ยวกับความเบ้และความไม่สมดุลในชุดข้อมูลด้วยเครื่องมือ เช่น TensorFlow Data Validation (TFDV) หรือเครื่องมือการตีความการเรียนรู้ (LIT) ใช้ผลลัพธ์เพื่อเป็นแนวทางในการออกแบบการวิเคราะห์
- ออกแบบการวิเคราะห์อย่างรอบคอบ ผลลัพธ์ของการวิเคราะห์จะได้รับผลกระทบอย่างมากจากเป้าหมายของการประเมิน การเข้าถึงความเชี่ยวชาญและแหล่งข้อมูลเพื่อทำการวิเคราะห์ เวลาและสถานที่ที่คุณทำการวิเคราะห์ รวมถึงบริบทของโมเดล AI ที่ใช้ในการวิเคราะห์
- เริ่มต้นด้วยปัจจัยที่เกี่ยวข้องกับการใช้งานตามวัตถุประสงค์ พิจารณาปัจจัยด้านประชากรศาสตร์ สังคมและวัฒนธรรม พฤติกรรม และสัณฐานวิทยา ซึ่งอาจส่งผลต่อกรณีการใช้งานที่ต้องการมากที่สุดเมื่อคุณสร้างกลุ่มความสนใจ แล้วขยายจากตรงนั้น
- รายงาน ไม่ต้องแสดงความคิดเห็น โปรดทราบว่าปัจจัยและสมมติฐานที่มีผลต่อการวิเคราะห์ความเป็นธรรมมีอยู่ในโครงสร้างทางสังคมที่เฉพาะเจาะจงในประวัติศาสตร์และวัฒนธรรม ซึ่งยากที่จะหาค่าเชิงปริมาณ โปรดระมัดระวังในการเพิ่มความคิดเห็นที่อาจทำให้ผู้อ่านสับสน แต่ให้ระบุวิธีทำซ้ำการวิเคราะห์ที่จะช่วยให้ผู้อ่านปรับเทียบผลลัพธ์ในบริบทของตนเองได้
- วางแผนสำหรับอนาคต พิจารณาปัจจัยเพิ่มเติมที่อาจปรากฏในอนาคตโดยดูการแสดงในชุดข้อมูล รักษาค่าให้คงที่ในสถานการณ์ต่างๆ หรือรวมการวิเคราะห์ของคุณกับช่วงค่าของปัจจัยเพิ่มเติมที่เกี่ยวข้องกับชุดข้อมูล
- ให้บริบทเพิ่มเติมสำหรับผลลัพธ์ที่ทำซ้ำไม่ได้ หากผู้มีส่วนเกี่ยวข้องในระดับล่างไม่สามารถสร้างเมตริกซ้ำได้ ให้ระบุบริบทที่เพียงพอเกี่ยวกับการวิเคราะห์ หากผู้อ่านใช้ข้อมูลนี้เพื่อพิจารณาข้อดีและข้อเสียของชุดข้อมูลได้ ก็จะสร้างความน่าเชื่อถือในชุดข้อมูลได้
7. ขอแสดงความยินดี
ยินดีด้วย คุณมีวิธีต่างๆ ในการให้คำตอบที่ถูกต้องในการ์ดข้อมูล ตอนนี้คุณก็พร้อมที่จะตรวจสอบแล้ว