Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

การติดป้ายกํากับรูปภาพ

API การติดป้ายกำกับรูปภาพของ ML Kit ช่วยให้คุณตรวจจับและดึงข้อมูลเกี่ยวกับเอนทิตีในรูปภาพจากหมวดหมู่ที่หลากหลายได้ โมเดลการติดป้ายกำกับรูปภาพเริ่มต้นสามารถระบุวัตถุ สถานที่ กิจกรรม สายพันธุ์สัตว์ ผลิตภัณฑ์ และอื่นๆ ทั่วไปได้

นอกจากนี้ คุณยังใช้โมเดลการจัดประเภทรูปภาพที่กำหนดเองเพื่อปรับการตรวจจับให้เหมาะกับกรณีการใช้งานที่เฉพาะเจาะจงได้ด้วย ดูข้อมูลเพิ่มเติมได้ที่การใช้โมเดล LiteRT ที่กำหนดเอง

ความสามารถหลัก

ตัวแยกประเภทฐานอเนกประสงค์ที่มีประสิทธิภาพ จดจำหมวดหมู่มากกว่า 400 รายการที่อธิบายวัตถุที่พบได้บ่อยที่สุดในรูปภาพ
ปรับให้เหมาะกับกรณีการใช้งานของคุณด้วยโมเดลที่กำหนดเอง ใช้โมเดลที่ฝึกไว้ล่วงหน้าอื่นๆ จาก TensorFlow Hub หรือโมเดลที่กำหนดเองซึ่งฝึกด้วย TensorFlow, AutoML หรือ LiteRT
API ระดับสูงที่ใช้งานง่าย ไม่จำเป็นต้องจัดการอินพุต/เอาต์พุตของโมเดลระดับต่ำ การประมวลผลรูปภาพก่อนและหลัง หรือการสร้างไปป์ไลน์การประมวลผล ML Kit จะดึงป้ายกำกับจากโมเดล LiteRT และแสดงป้ายกำกับเหล่านั้นเป็นคำอธิบายแบบข้อความ

โปรดทราบว่า API นี้มีไว้สำหรับโมเดลการจัดประเภทรูปภาพที่อธิบายรูปภาพทั้งหมด สำหรับการจัดประเภทวัตถุอย่างน้อย 1 รายการในรูปภาพ เช่น รองเท้าหรือ เฟอร์นิเจอร์ API การตรวจจับและการติดตามวัตถุอาจ เหมาะสมกว่า

โมเดลการจัดประเภทรูปภาพที่รองรับ

API การติดป้ายกำกับรูปภาพรองรับโมเดลการจัดประเภทรูปภาพต่างๆ ดังนี้

โมเดลการจัดประเภทรูปภาพที่รองรับ
โมเดลฐาน	โดยค่าเริ่มต้น API จะใช้โมเดลการติดป้ายกำกับรูปภาพอเนกประสงค์ที่มีประสิทธิภาพ ซึ่งจดจำเอนทิตีมากกว่า 400 รายการที่ครอบคลุมคอนเซ็ปต์ที่พบได้บ่อยที่สุดในรูปภาพ
โมเดล LiteRT ที่กำหนดเอง	API ยอมรับโมเดลการจัดประเภทรูปภาพที่กำหนดเองจากแหล่งที่มาที่หลากหลาย เพื่อกำหนดเป้าหมายคอนเซ็ปต์ที่เฉพาะเจาะจงกับแอปพลิเคชัน ซึ่งอาจเป็นโมเดลที่ฝึกไว้ล่วงหน้า ที่ดาวน์โหลดจาก TensorFlow Hub หรือโมเดลของคุณเองที่ฝึก ด้วย AutoML, LiteRT หรือ TensorFlow เอง คุณสามารถรวมโมเดลไว้กับแอปหรือโฮสต์ด้วย Cloud Storage และดาวน์โหลดได้ในขณะรันไทม์

โมเดลการจัดประเภทรูปภาพที่รองรับ

โมเดลฐาน

โดยค่าเริ่มต้น API จะใช้โมเดลการติดป้ายกำกับรูปภาพอเนกประสงค์ที่มีประสิทธิภาพ ซึ่งจดจำเอนทิตีมากกว่า 400 รายการที่ครอบคลุมคอนเซ็ปต์ที่พบได้บ่อยที่สุดในรูปภาพ

โมเดล LiteRT ที่กำหนดเอง

API ยอมรับโมเดลการจัดประเภทรูปภาพที่กำหนดเองจากแหล่งที่มาที่หลากหลาย เพื่อกำหนดเป้าหมายคอนเซ็ปต์ที่เฉพาะเจาะจงกับแอปพลิเคชัน ซึ่งอาจเป็นโมเดลที่ฝึกไว้ล่วงหน้า ที่ดาวน์โหลดจาก TensorFlow Hub หรือโมเดลของคุณเองที่ฝึก ด้วย AutoML, LiteRT หรือ TensorFlow เอง คุณสามารถรวมโมเดลไว้กับแอปหรือโฮสต์ด้วย Cloud Storage และดาวน์โหลดได้ในขณะรันไทม์

การใช้โมเดลฐาน

โมเดลฐานของ ML Kit จะแสดงรายการเอนทิตีที่ระบุผู้คน สิ่งของ สถานที่ กิจกรรม และอื่นๆ เอนทิตีแต่ละรายการจะมีคะแนนที่บ่งบอกถึงความมั่นใจของโมเดล ML ในความเกี่ยวข้อง ข้อมูลนี้ช่วยให้คุณทำงานต่างๆ ได้ เช่น การสร้างข้อมูลเมตาอัตโนมัติและการกลั่นกรองเนื้อหา โมเดลเริ่มต้นที่มาพร้อมกับ ML Kit จดจำเอนทิตีต่างๆ ได้มากกว่า 400 รายการ

iOS Android

ป้ายกำกับตัวอย่าง

โมเดลฐานใน API การติดป้ายกำกับรูปภาพรองรับป้ายกำกับมากกว่า 400 รายการ เช่น ตัวอย่างต่อไปนี้

หมวดหมู่	ป้ายกำกับตัวอย่าง
ผู้คน	`Crowd` `Selfie` `Smile`
กิจกรรม	`Dancing` `Eating` `Surfing`
สิ่งของ	`Car` `Piano` `Receipt`
สัตว์	`Bird` `Cat` `Dog`
พืช	`Flower` `Fruit` `Vegetable`
สถานที่	`Beach` `Lake` `Mountain`

ตัวอย่างผลการแข่ง

นี่คือตัวอย่างเอนทิตีที่ระบบจดจำได้ในรูปภาพประกอบ

Photo: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0

ป้ายกำกับ 0
ข้อความ	สนามกีฬา
ความมั่นใจ	0.9205354
ป้ายกำกับ 1
ข้อความ	กีฬา
ความมั่นใจ	0.7531109
ป้ายกำกับ 2
ข้อความ	กิจกรรม
ความมั่นใจ	0.66905296
ป้ายกำกับ 3
ข้อความ	ยามว่าง
ความมั่นใจ	0.59904146
ป้ายกำกับ 4
ข้อความ	ฟุตบอล
ความมั่นใจ	0.56384534
ป้ายกำกับ 5
ข้อความ	สุทธิ
ความมั่นใจ	0.54679185
ป้ายกำกับ 6
ข้อความ	พืช
ความมั่นใจ	0.524364

การใช้โมเดล LiteRT ที่กำหนดเอง

โมเดลการติดป้ายกำกับรูปภาพฐานของ ML Kit สร้างขึ้นเพื่อการใช้งานอเนกประสงค์ โดยได้รับการฝึกให้จดจำหมวดหมู่ 400 รายการที่อธิบายวัตถุที่พบได้บ่อยที่สุดในรูปภาพ แอปของคุณอาจต้องใช้โมเดลการจัดประเภทรูปภาพเฉพาะทางที่จดจำหมวดหมู่จำนวนน้อยลงในรายละเอียดมากขึ้น เช่น โมเดลที่แยกความแตกต่างระหว่างสายพันธุ์ดอกไม้หรือประเภทอาหาร

API นี้ช่วยให้คุณปรับให้เหมาะกับกรณีการใช้งานที่เฉพาะเจาะจงได้โดยรองรับโมเดลการจัดประเภทรูปภาพที่กำหนดเองจากแหล่งที่มาที่หลากหลาย ดูข้อมูลเพิ่มเติมได้ที่ โมเดลที่กำหนดเองด้วย ML Kit คุณสามารถรวมโมเดลที่กำหนดเองไว้กับแอปหรือดาวน์โหลดแบบไดนามิกจาก Cloud Storage

iOS Android

การประมวลผลรูปภาพอินพุตล่วงหน้า

หากจำเป็น การติดป้ายกำกับรูปภาพจะใช้การปรับขนาดและการยืดรูปภาพแบบ Bilinear เพื่อปรับขนาดรูปภาพและสัดส่วนภาพของรูปภาพอินพุตให้เป็นไปตามข้อกำหนดของโมเดลพื้นฐาน