แนวคิดการตรวจจับตาข่าย

ข้อมูลตาข่ายจะมี 2 ส่วนดังนี้

  • 4 มิติ 368 จุด: แต่ละจุดมีรหัสที่ไม่ซ้ํากันตั้งแต่ 0 ถึง 467 เชื่อมโยงอยู่กับตําแหน่งคงที่ในใบหน้าที่ตรวจพบ สําหรับแต่ละจุด

    • x และ y คือพิกัดพิกเซลของใบหน้าที่ตรวจพบ
    • z คือข้อมูลความลึกที่ปรับขนาดเป็นรูปภาพ ดังนั้นค่า z จะเป็นค่าลบมากขึ้นเมื่อหน้าอยู่ใกล้กับกล้องมากขึ้น จุดเริ่มต้นคือความลึก โดยเฉลี่ยที่ 468 จุด
  • ข้อมูลสามเหลี่ยม: ส่วนนี้จะใช้แสดงพื้นที่รูปสามเหลี่ยมเชิงตรรกะในใบหน้าที่ตรวจพบ สามเหลี่ยมแต่ละรูปมีจุด 3 มิติ 3 จุด เช่น จุด #0, #37 และ #164 จะสร้างพื้นที่เล็กๆ รูปสามเหลี่ยมระหว่างจมูกและริมฝีปาก

ตัวอย่างข้อมูลตาข่าย คลิกเพื่อดูรูปภาพแบบซูมได้