จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ

การติดป้ายกํากับรูปภาพ

เมื่อใช้ ML Kit'image-labeling API คุณจะตรวจหาและดึงข้อมูลเกี่ยวกับเอนทิตีในรูปภาพในกลุ่มหมวดหมู่ต่างๆ ได้ รูปแบบการติดป้ายกํากับรูปภาพเริ่มต้นสามารถระบุออบเจ็กต์ทั่วไป สถานที่ กิจกรรม สายพันธุ์สัตว์ ผลิตภัณฑ์ และอื่นๆ

คุณยังใช้โมเดลการแยกประเภทรูปภาพที่กําหนดเองเพื่อปรับแต่งการตรวจจับตามกรณีการใช้งานที่เจาะจงได้ด้วย ดูการใช้โมเดล TensorFlow Lite ที่กําหนดเองสําหรับข้อมูลเพิ่มเติม

ความสามารถหลัก

  • ตัวแยกประเภทพื้นฐานทั่วไปที่มีประสิทธิภาพ จดจําหมวดหมู่ได้มากกว่า 400 หมวดหมู่ที่อธิบายออบเจ็กต์ที่พบเห็นบ่อยที่สุดในรูปภาพ
  • ปรับแต่งกรณีการใช้งานด้วยโมเดลที่กําหนดเอง ใช้โมเดลก่อนการฝึกอื่นๆ จาก TensorFlow Hub หรือรูปแบบที่กําหนดเองที่ผ่านการฝึกอบรม ด้วย TensorFlow, Sym Vision Edge หรือเครื่องมือสร้างโมเดล TensorFlow Lite
  • API ระดับสูงที่ใช้งานง่าย ไม่จําเป็นต้องจัดการกับอินพุต/เอาต์พุตของโมเดลในระดับต่ํา การประมวลผลข้อมูลทั้งก่อนและหลังและการสร้างรูปภาพ หรือสร้างไปป์ไลน์การประมวลผล ML Kit จะดึงป้ายกํากับจากโมเดล TensorFlow Lite และแสดงเป็นคําอธิบายข้อความ

โปรดทราบว่า API นี้มีไว้สําหรับรูปแบบการแยกประเภทรูปภาพที่อธิบายรูปภาพขนาดเต็ม หากต้องการจัดประเภทออบเจ็กต์อย่างน้อย 1 รายการในรูปภาพ เช่น รองเท้าหรือเฟอร์นิเจอร์ การใช้ API ตรวจจับออบเจ็กต์และการติดตาม API อาจเหมาะสมกว่า

รูปแบบการจัดประเภทรูปภาพที่รองรับ

API การติดป้ายกํากับรูปภาพรองรับการจัดประเภทรูปภาพแบบต่างๆ ดังนี้

รูปแบบการจัดประเภทรูปภาพที่รองรับ
โมเดลฐาน โดยค่าเริ่มต้น API จะใช้โมเดลการติดป้ายกํากับรูปภาพอเนกประสงค์ที่มีประสิทธิภาพซึ่งจดจําเอนทิตีมากกว่า 400 รายการ ซึ่งครอบคลุมแนวคิดที่พบได้บ่อยที่สุดในรูปภาพ
โมเดล TensorFlow Lite ที่กําหนดเอง หากต้องการกําหนดเป้าหมายแนวคิดเฉพาะแอปพลิเคชัน API จะยอมรับรูปแบบการจัดประเภทรูปภาพที่กําหนดเองจากแหล่งที่มาที่หลากหลาย โมเดลเหล่านี้อาจเป็นโมเดลก่อนการฝึกที่ดาวน์โหลดจาก TensorFlow Hub หรือโมเดลของคุณเองที่ผ่านการฝึกด้วย reCAPTCHA Vision Edge, TensorFlow Lite Model Maker หรือ TensorFlow เอง โมเดลอาจรวมอยู่กับแอปหรือโฮสต์ไว้กับ Firebase Machine Learning และดาวน์โหลดได้ในช่วงรันไทม์

การใช้โมเดลฐาน

โมเดลฐานของ ML Kit จะแสดงรายการเอนทิตีที่ระบุบุคคล สิ่งของ สถานที่ กิจกรรม และอื่นๆ แต่ละเอนทิตีจะมีคะแนนซึ่งระบุถึงความเชื่อมั่นของโมเดล ML คุณสามารถใช้ข้อมูลนี้ทํางานต่างๆ เช่น สร้างข้อมูลเมตาโดยอัตโนมัติและดูแลเนื้อหาได้ รูปแบบเริ่มต้นที่ให้ ML Kit ระบุกว่า 400 เอนทิตี

iOS Android

ตัวอย่างป้ายกํากับ

โมเดลฐานใน API การติดป้ายกํากับรูปภาพรองรับป้ายกํากับมากกว่า 400 ป้าย เช่น

หมวดหมู่ตัวอย่างป้ายกํากับ
ผู้คน Crowd
Selfie
Smile
กิจกรรม Dancing
Eating
Surfing
สิ่งของ Car
Piano
Receipt
สัตว์ Bird
Cat
Dog
พืช Flower
Fruit
Vegetable
สถานที่ Beach
Lake
Mountain

ตัวอย่างผลการแข่ง

ต่อไปนี้เป็นตัวอย่างของเอนทิตีที่ได้รับการยอมรับในรูปภาพที่แนบมา

รูปภาพ: Clément Bucco-Lechat / Wikimedia Commons / CC BY-SA 3.0
ป้ายกํากับ 0
Text สนามกีฬา
ความมั่นใจ 0.9205354
ป้ายกำกับ 1
Text กีฬา
ความมั่นใจ 0.7531109
ป้ายกํากับ 2
Text เหตุการณ์
ความมั่นใจ 0.66905296
ป้ายกํากับ 3
Text ยามว่าง
ความมั่นใจ 0.59904146
ป้ายกํากับ 4
Text ฟุตบอล
ความมั่นใจ 0.56384534
ป้ายกํากับ 5
Text สุทธิ
ความมั่นใจ 0.54679185
ป้ายกํากับ 6
Text พืช
ความมั่นใจ 0.524364

การใช้โมเดล TensorFlow Lite ที่กําหนดเอง

โมเดลการติดป้ายกํากับอิมเมจเริ่มต้นของ ML Kit' สร้างขึ้นเพื่อการใช้งานทั่วไป ระบบจะฝึกให้จดจําหมวดหมู่ 400 หมวดหมู่ที่อธิบายออบเจ็กต์ที่พบบ่อยที่สุดในรูปภาพ แอปของคุณอาจต้องใช้รูปแบบการแยกประเภทรูปภาพเฉพาะซึ่งช่วยจดจําหมวดหมู่ที่แคบลงอย่างละเอียด เช่น รูปแบบที่แยกประเภทดอกไม้หรืออาหารประเภทต่างๆ

API นี้ช่วยให้คุณปรับแต่งให้เข้ากับกรณีการใช้งานหนึ่งๆ โดยการรองรับโมเดลการจัดประเภทรูปภาพที่กําหนดเองจากแหล่งที่มาที่หลากหลาย โปรดดูข้อมูลเพิ่มเติมที่รูปแบบที่กําหนดเองด้วย ML Kit โมเดลที่กําหนดเองจะพ่วงกับแอปของคุณหรือดาวน์โหลดแบบไดนามิกจากระบบคลาวด์ได้โดยใช้บริการทําให้โมเดล Firebase ใช้งานได้&#39

iOS Android

การประมวลผลข้อมูลรูปภาพล่วงหน้า

หากจําเป็น การติดป้ายกํากับรูปภาพจะใช้การปรับขนาดและการขยายรูปภาพแบบ 2 ทิศทางเพื่อปรับขนาดรูปภาพและสัดส่วนภาพอินพุตให้พอดีกับข้อกําหนดของโมเดลที่ใช้โฆษณาแทน