ประเมินคุณภาพพรอมต์

การดูแลคุณภาพและความน่าเชื่อถือของพรอมต์เป็นสิ่งสำคัญเมื่อ ใช้ Prompt API

หากต้องการประเมินคุณภาพพรอมต์ คุณควรพัฒนาชุดอินพุตและเอาต์พุตที่คาดไว้ที่ครอบคลุมสำหรับกรณีการใช้งานของคุณ

หากต้องการประเมินว่าพรอมต์เป็นไปตามเกณฑ์คุณภาพของโมเดล Gemini Nano แต่ละเวอร์ชันหรือไม่ เราขอแนะนำให้ใช้เวิร์กโฟลว์ต่อไปนี้

เรียกใช้ชุดข้อมูลการประเมินและบันทึกเอาต์พุต
ประเมินผลลัพธ์ด้วยตนเองหรือใช้ LLM-as-a-judge
1. หากการประเมินไม่เป็นไปตามเกณฑ์คุณภาพ ให้ทำซ้ำพรอมต์ เช่น ขอให้ LLM ที่มีประสิทธิภาพมากขึ้นอย่าง Gemini Pro ปรับปรุงพรอมต์ โดยอิงตามเอาต์พุตที่ต้องการเทียบกับเอาต์พุตจริง

การออกแบบพรอมต์ช่วยเพิ่มประสิทธิภาพของงาน และการทำซ้ำพรอมต์เป็นสิ่งสำคัญ เราขอแนะนำให้ทำตามขั้นตอนข้างต้นอย่างน้อย 3-5 ครั้ง โปรดทราบว่าแนวทางนี้มีข้อจำกัด เนื่องจากการเพิ่มประสิทธิภาพจะให้ผลตอบแทนที่ลดลงในที่สุด

หรือหากต้องการปรับปรุงพรอมต์อย่างรวดเร็วในวงกว้าง คุณสามารถใช้เครื่องมือเพิ่มประสิทธิภาพที่อิงตามข้อมูล ซึ่งกำหนดเป้าหมายโมเดลในอุปกรณ์ได้ เช่น gemma-3n-e4b-it

ความปลอดภัย

เราได้ใช้การป้องกันหลายชั้นเพื่อจำกัดผลลัพธ์ที่เป็นอันตรายหรือไม่พึงประสงค์ เพื่อให้มั่นใจว่า Gemini Nano จะแสดงผลลัพธ์ที่ปลอดภัยสำหรับผู้ใช้ ดังนี้

ความปลอดภัยของโมเดลเนทีฟ: โมเดล Gemini ทั้งหมด รวมถึง Gemini Nano ได้รับการฝึก ให้ตระหนักถึงความปลอดภัยตั้งแต่เริ่มต้น ซึ่งหมายความว่าการพิจารณาด้านความปลอดภัยนั้นฝังอยู่ในแกนหลักของโมเดล ไม่ใช่แค่เพิ่มเข้ามาภายหลัง
ตัวกรองความปลอดภัยในอินพุตและเอาต์พุต: ทั้งพรอมต์อินพุตและผลลัพธ์ ที่สร้างโดยรันไทม์ของ Gemini Nano จะได้รับการประเมินเทียบกับตัวกรองความปลอดภัย ก่อนที่จะแสดงผลลัพธ์ในแอป ซึ่งจะช่วยป้องกันไม่ให้เนื้อหาที่ไม่ปลอดภัย หลุดรอดออกมาโดยไม่ทำให้คุณภาพลดลง

อย่างไรก็ตาม เนื่องจากแต่ละแอปมีเกณฑ์ของตนเองสำหรับสิ่งที่ถือว่าเป็นเนื้อหาที่ปลอดภัยสำหรับผู้ใช้ คุณจึงควรประเมินความเสี่ยงด้านความปลอดภัยสำหรับกรณีการใช้งานเฉพาะของแอปและทดสอบตามนั้น

แหล่งข้อมูลเพิ่มเติม

AI ของคุณเก่งแค่ไหน การประเมิน Gen AI ในทุกขั้นตอน อธิบาย - บล็อกโพสต์ที่อธิบายวิธีใช้บริการประเมิน Gen AI
ภาพรวมบริการประเมิน Gen AI - เอกสารที่อธิบายวิธีประเมินโมเดล Generative AI เพื่อรองรับงานต่างๆ เช่น การเปรียบเทียบโมเดล การปรับปรุงพรอมต์ และการปรับแต่ง
เรียกใช้ไปป์ไลน์การประเมินตามการคำนวณ - เอกสารประกอบ เกี่ยวกับวิธีประเมินประสิทธิภาพของโมเดล