การติดป้ายกํากับรูปภาพ

API การติดป้ายกำกับรูปภาพของ ML Kit ช่วยให้คุณตรวจจับและดึงข้อมูลเกี่ยวกับเอนทิตีในรูปภาพจากหมวดหมู่ที่หลากหลายได้ โมเดลการติดป้ายกำกับรูปภาพเริ่มต้นสามารถระบุวัตถุ สถานที่ กิจกรรม สายพันธุ์สัตว์ ผลิตภัณฑ์ และอื่นๆ ทั่วไปได้

นอกจากนี้ คุณยังใช้โมเดลการจัดประเภทรูปภาพที่กำหนดเองเพื่อปรับการตรวจจับให้เหมาะกับกรณีการใช้งานที่เฉพาะเจาะจงได้ด้วย ดูข้อมูลเพิ่มเติมได้ที่การใช้โมเดล LiteRT ที่กำหนดเอง

ความสามารถหลัก

  • ตัวแยกประเภทฐานอเนกประสงค์ที่มีประสิทธิภาพ จดจำหมวดหมู่มากกว่า 400 รายการที่อธิบายวัตถุที่พบได้บ่อยที่สุดในรูปภาพ
  • ปรับให้เหมาะกับกรณีการใช้งานของคุณด้วยโมเดลที่กำหนดเอง ใช้โมเดลที่ฝึกไว้ล่วงหน้าอื่นๆ จาก TensorFlow Hub หรือโมเดลที่กำหนดเองซึ่งฝึกด้วย TensorFlow, AutoML หรือ LiteRT
  • API ระดับสูงที่ใช้งานง่าย ไม่จำเป็นต้องจัดการอินพุต/เอาต์พุตของโมเดลระดับต่ำ การประมวลผลรูปภาพก่อนและหลัง หรือการสร้างไปป์ไลน์การประมวลผล ML Kit จะดึงป้ายกำกับจากโมเดล LiteRT และแสดงป้ายกำกับเหล่านั้นเป็นคำอธิบายแบบข้อความ

โปรดทราบว่า API นี้มีไว้สำหรับโมเดลการจัดประเภทรูปภาพที่อธิบายรูปภาพทั้งหมด สำหรับการจัดประเภทวัตถุอย่างน้อย 1 รายการในรูปภาพ เช่น รองเท้าหรือ เฟอร์นิเจอร์ API การตรวจจับและการติดตามวัตถุอาจ เหมาะสมกว่า

โมเดลการจัดประเภทรูปภาพที่รองรับ

API การติดป้ายกำกับรูปภาพรองรับโมเดลการจัดประเภทรูปภาพต่างๆ ดังนี้

โมเดลการจัดประเภทรูปภาพที่รองรับ
โมเดลฐาน โดยค่าเริ่มต้น API จะใช้โมเดลการติดป้ายกำกับรูปภาพอเนกประสงค์ที่มีประสิทธิภาพ ซึ่งจดจำเอนทิตีมากกว่า 400 รายการที่ครอบคลุมคอนเซ็ปต์ที่พบได้บ่อยที่สุดในรูปภาพ
โมเดล LiteRT ที่กำหนดเอง API ยอมรับโมเดลการจัดประเภทรูปภาพที่กำหนดเองจากแหล่งที่มาที่หลากหลาย เพื่อกำหนดเป้าหมายคอนเซ็ปต์ที่เฉพาะเจาะจงกับแอปพลิเคชัน ซึ่งอาจเป็นโมเดลที่ฝึกไว้ล่วงหน้า ที่ดาวน์โหลดจาก TensorFlow Hub หรือโมเดลของคุณเองที่ฝึก ด้วย AutoML, LiteRT หรือ TensorFlow เอง คุณสามารถรวมโมเดลไว้กับแอปหรือโฮสต์ด้วย Cloud Storage และดาวน์โหลดได้ในขณะรันไทม์

การใช้โมเดลฐาน

โมเดลฐานของ ML Kit จะแสดงรายการเอนทิตีที่ระบุผู้คน สิ่งของ สถานที่ กิจกรรม และอื่นๆ เอนทิตีแต่ละรายการจะมีคะแนนที่บ่งบอกถึงความมั่นใจของโมเดล ML ในความเกี่ยวข้อง ข้อมูลนี้ช่วยให้คุณทำงานต่างๆ ได้ เช่น การสร้างข้อมูลเมตาอัตโนมัติและการกลั่นกรองเนื้อหา โมเดลเริ่มต้นที่มาพร้อมกับ ML Kit จดจำเอนทิตีต่างๆ ได้มากกว่า 400 รายการ

iOS Android

ป้ายกำกับตัวอย่าง

โมเดลฐานใน API การติดป้ายกำกับรูปภาพรองรับป้ายกำกับมากกว่า 400 รายการ เช่น ตัวอย่างต่อไปนี้

หมวดหมู่ป้ายกำกับตัวอย่าง
ผู้คน Crowd
Selfie
Smile
กิจกรรม Dancing
Eating
Surfing
สิ่งของ Car
Piano
Receipt
สัตว์ Bird
Cat
Dog
พืช Flower
Fruit
Vegetable
สถานที่ Beach
Lake
Mountain

ตัวอย่างผลการแข่ง

นี่คือตัวอย่างเอนทิตีที่ระบบจดจำได้ในรูปภาพประกอบ

Photo: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
ป้ายกำกับ 0
ข้อความ สนามกีฬา
ความมั่นใจ 0.9205354
ป้ายกำกับ 1
ข้อความ กีฬา
ความมั่นใจ 0.7531109
ป้ายกำกับ 2
ข้อความ กิจกรรม
ความมั่นใจ 0.66905296
ป้ายกำกับ 3
ข้อความ ยามว่าง
ความมั่นใจ 0.59904146
ป้ายกำกับ 4
ข้อความ ฟุตบอล
ความมั่นใจ 0.56384534
ป้ายกำกับ 5
ข้อความ สุทธิ
ความมั่นใจ 0.54679185
ป้ายกำกับ 6
ข้อความ พืช
ความมั่นใจ 0.524364

การใช้โมเดล LiteRT ที่กำหนดเอง

โมเดลการติดป้ายกำกับรูปภาพฐานของ ML Kit สร้างขึ้นเพื่อการใช้งานอเนกประสงค์ โดยได้รับการฝึกให้จดจำหมวดหมู่ 400 รายการที่อธิบายวัตถุที่พบได้บ่อยที่สุดในรูปภาพ แอปของคุณอาจต้องใช้โมเดลการจัดประเภทรูปภาพเฉพาะทางที่จดจำหมวดหมู่จำนวนน้อยลงในรายละเอียดมากขึ้น เช่น โมเดลที่แยกความแตกต่างระหว่างสายพันธุ์ดอกไม้หรือประเภทอาหาร

API นี้ช่วยให้คุณปรับให้เหมาะกับกรณีการใช้งานที่เฉพาะเจาะจงได้โดยรองรับโมเดลการจัดประเภทรูปภาพที่กำหนดเองจากแหล่งที่มาที่หลากหลาย ดูข้อมูลเพิ่มเติมได้ที่ โมเดลที่กำหนดเองด้วย ML Kit คุณสามารถรวมโมเดลที่กำหนดเองไว้กับแอปหรือดาวน์โหลดแบบไดนามิกจาก Cloud Storage

iOS Android

การประมวลผลรูปภาพอินพุตล่วงหน้า

หากจำเป็น การติดป้ายกำกับรูปภาพจะใช้การปรับขนาดและการยืดรูปภาพแบบ Bilinear เพื่อปรับขนาดรูปภาพและสัดส่วนภาพของรูปภาพอินพุตให้เป็นไปตามข้อกำหนดของโมเดลพื้นฐาน