
API การติดป้ายกำกับรูปภาพของ ML Kit ช่วยให้คุณตรวจจับและดึงข้อมูลเกี่ยวกับเอนทิตีในรูปภาพจากหมวดหมู่ที่หลากหลายได้ โมเดลการติดป้ายกำกับรูปภาพเริ่มต้นสามารถระบุวัตถุ สถานที่ กิจกรรม สายพันธุ์สัตว์ ผลิตภัณฑ์ และอื่นๆ ทั่วไปได้
นอกจากนี้ คุณยังใช้โมเดลการจัดประเภทรูปภาพที่กำหนดเองเพื่อปรับการตรวจจับให้เหมาะกับกรณีการใช้งานที่เฉพาะเจาะจงได้ด้วย ดูข้อมูลเพิ่มเติมได้ที่การใช้โมเดล LiteRT ที่กำหนดเอง
ความสามารถหลัก
- ตัวแยกประเภทฐานอเนกประสงค์ที่มีประสิทธิภาพ จดจำหมวดหมู่มากกว่า 400 รายการที่อธิบายวัตถุที่พบได้บ่อยที่สุดในรูปภาพ
- ปรับให้เหมาะกับกรณีการใช้งานของคุณด้วยโมเดลที่กำหนดเอง ใช้โมเดลที่ฝึกไว้ล่วงหน้าอื่นๆ จาก TensorFlow Hub หรือโมเดลที่กำหนดเองซึ่งฝึกด้วย TensorFlow, AutoML หรือ LiteRT
- API ระดับสูงที่ใช้งานง่าย ไม่จำเป็นต้องจัดการอินพุต/เอาต์พุตของโมเดลระดับต่ำ การประมวลผลรูปภาพก่อนและหลัง หรือการสร้างไปป์ไลน์การประมวลผล ML Kit จะดึงป้ายกำกับจากโมเดล LiteRT และแสดงป้ายกำกับเหล่านั้นเป็นคำอธิบายแบบข้อความ
โปรดทราบว่า API นี้มีไว้สำหรับโมเดลการจัดประเภทรูปภาพที่อธิบายรูปภาพทั้งหมด สำหรับการจัดประเภทวัตถุอย่างน้อย 1 รายการในรูปภาพ เช่น รองเท้าหรือ เฟอร์นิเจอร์ API การตรวจจับและการติดตามวัตถุอาจ เหมาะสมกว่า
โมเดลการจัดประเภทรูปภาพที่รองรับ
API การติดป้ายกำกับรูปภาพรองรับโมเดลการจัดประเภทรูปภาพต่างๆ ดังนี้
| โมเดลการจัดประเภทรูปภาพที่รองรับ | |
|---|---|
| โมเดลฐาน | โดยค่าเริ่มต้น API จะใช้โมเดลการติดป้ายกำกับรูปภาพอเนกประสงค์ที่มีประสิทธิภาพ ซึ่งจดจำเอนทิตีมากกว่า 400 รายการที่ครอบคลุมคอนเซ็ปต์ที่พบได้บ่อยที่สุดในรูปภาพ |
| โมเดล LiteRT ที่กำหนดเอง | API ยอมรับโมเดลการจัดประเภทรูปภาพที่กำหนดเองจากแหล่งที่มาที่หลากหลาย เพื่อกำหนดเป้าหมายคอนเซ็ปต์ที่เฉพาะเจาะจงกับแอปพลิเคชัน ซึ่งอาจเป็นโมเดลที่ฝึกไว้ล่วงหน้า ที่ดาวน์โหลดจาก TensorFlow Hub หรือโมเดลของคุณเองที่ฝึก ด้วย AutoML, LiteRT หรือ TensorFlow เอง คุณสามารถรวมโมเดลไว้กับแอปหรือโฮสต์ด้วย Cloud Storage และดาวน์โหลดได้ในขณะรันไทม์ |
การใช้โมเดลฐาน
โมเดลฐานของ ML Kit จะแสดงรายการเอนทิตีที่ระบุผู้คน สิ่งของ สถานที่ กิจกรรม และอื่นๆ เอนทิตีแต่ละรายการจะมีคะแนนที่บ่งบอกถึงความมั่นใจของโมเดล ML ในความเกี่ยวข้อง ข้อมูลนี้ช่วยให้คุณทำงานต่างๆ ได้ เช่น การสร้างข้อมูลเมตาอัตโนมัติและการกลั่นกรองเนื้อหา โมเดลเริ่มต้นที่มาพร้อมกับ ML Kit จดจำเอนทิตีต่างๆ ได้มากกว่า 400 รายการ
ป้ายกำกับตัวอย่าง
โมเดลฐานใน API การติดป้ายกำกับรูปภาพรองรับป้ายกำกับมากกว่า 400 รายการ เช่น ตัวอย่างต่อไปนี้
| หมวดหมู่ | ป้ายกำกับตัวอย่าง |
|---|---|
| ผู้คน | CrowdSelfieSmile |
| กิจกรรม | DancingEatingSurfing |
| สิ่งของ | CarPianoReceipt |
| สัตว์ | BirdCatDog |
| พืช | FlowerFruitVegetable |
| สถานที่ | BeachLakeMountain |
ตัวอย่างผลการแข่ง
นี่คือตัวอย่างเอนทิตีที่ระบบจดจำได้ในรูปภาพประกอบ
| ป้ายกำกับ 0 | |
|---|---|
| ข้อความ | สนามกีฬา |
| ความมั่นใจ | 0.9205354 |
| ป้ายกำกับ 1 | |
| ข้อความ | กีฬา |
| ความมั่นใจ | 0.7531109 |
| ป้ายกำกับ 2 | |
| ข้อความ | กิจกรรม |
| ความมั่นใจ | 0.66905296 |
| ป้ายกำกับ 3 | |
| ข้อความ | ยามว่าง |
| ความมั่นใจ | 0.59904146 |
| ป้ายกำกับ 4 | |
| ข้อความ | ฟุตบอล |
| ความมั่นใจ | 0.56384534 |
| ป้ายกำกับ 5 | |
| ข้อความ | สุทธิ |
| ความมั่นใจ | 0.54679185 |
| ป้ายกำกับ 6 | |
| ข้อความ | พืช |
| ความมั่นใจ | 0.524364 |
การใช้โมเดล LiteRT ที่กำหนดเอง
โมเดลการติดป้ายกำกับรูปภาพฐานของ ML Kit สร้างขึ้นเพื่อการใช้งานอเนกประสงค์ โดยได้รับการฝึกให้จดจำหมวดหมู่ 400 รายการที่อธิบายวัตถุที่พบได้บ่อยที่สุดในรูปภาพ แอปของคุณอาจต้องใช้โมเดลการจัดประเภทรูปภาพเฉพาะทางที่จดจำหมวดหมู่จำนวนน้อยลงในรายละเอียดมากขึ้น เช่น โมเดลที่แยกความแตกต่างระหว่างสายพันธุ์ดอกไม้หรือประเภทอาหาร
API นี้ช่วยให้คุณปรับให้เหมาะกับกรณีการใช้งานที่เฉพาะเจาะจงได้โดยรองรับโมเดลการจัดประเภทรูปภาพที่กำหนดเองจากแหล่งที่มาที่หลากหลาย ดูข้อมูลเพิ่มเติมได้ที่ โมเดลที่กำหนดเองด้วย ML Kit คุณสามารถรวมโมเดลที่กำหนดเองไว้กับแอปหรือดาวน์โหลดแบบไดนามิกจาก Cloud Storage
การประมวลผลรูปภาพอินพุตล่วงหน้า
หากจำเป็น การติดป้ายกำกับรูปภาพจะใช้การปรับขนาดและการยืดรูปภาพแบบ Bilinear เพื่อปรับขนาดรูปภาพและสัดส่วนภาพของรูปภาพอินพุตให้เป็นไปตามข้อกำหนดของโมเดลพื้นฐาน