इमेज को लेबल करें

ML Kit की इमेज को लेबल करने वाले एपीआई की मदद से, कई कैटगरी के ग्रुप में मौजूद इमेज में मौजूद इकाइयों की पहचान की जा सकती है और उनसे जुड़ी जानकारी हासिल की जा सकती है. इमेज लेबल करने का डिफ़ॉल्ट मॉडल, सामान्य चीज़ों, जगहों, गतिविधियों, जानवरों की प्रजातियों, प्रॉडक्ट वगैरह की पहचान कर सकता है.

किसी ख़ास इस्तेमाल के हिसाब से पहचान करने के लिए, कस्टम इमेज क्लासिफ़िकेशन मॉडल भी इस्तेमाल किया जा सकता है. ज़्यादा जानकारी के लिए, पसंद के मुताबिक बनाया गया TensorFlow Lite मॉडल इस्तेमाल करना देखें.

मुख्य सुविधाएं

  • अलग-अलग कामों के लिए इस्तेमाल की जाने वाली कैटगरी में बदलाव करने वाला दमदार यह सुविधा, 400 से ज़्यादा कैटगरी की पहचान करती है. ये कैटगरी, फ़ोटो में सबसे ज़्यादा मिलने वाली चीज़ों के बारे में जानकारी देती हैं.
  • कस्टम मॉडल की मदद से, अपने इस्तेमाल के हिसाब से बदलाव करें TensorFlow Hub के साथ, पहले से ट्रेन किए गए दूसरे मॉडल इस्तेमाल करें. इसके अलावा, अपने कस्टम मॉडल का इस्तेमाल करें, जिसे TensorFlow, AutoML Vision Edge या TensorFlow Lite Model Maker की मदद से ट्रेनिंग दी गई हो.
  • इस्तेमाल में आसान हाई-लेवल एपीआई लो-लेवल के मॉडल इनपुट/आउटपुट, इमेज के पहले और बाद की प्रोसेसिंग या प्रोसेसिंग पाइपलाइन बनाने से जुड़ने की ज़रूरत नहीं होती. ML Kit, TensorFlow Lite मॉडल से लेबल हटाता है और उन्हें टेक्स्ट की जानकारी के तौर पर उपलब्ध कराता है.

ध्यान दें कि यह एपीआई, इमेज क्लासिफ़िकेशन मॉडल के लिए है, जो पूरी इमेज की जानकारी देते हैं. किसी इमेज में एक या एक से ज़्यादा ऑब्जेक्ट, जैसे कि जूते या फ़र्नीचर के हिस्सों की कैटगरी तय करने के लिए, ऑब्जेक्ट की पहचान और ट्रैकिंग एपीआई बेहतर हो सकता है.

इमेज क्लासिफ़िकेशन के मॉडल

इमेज लेबलिंग एपीआई, इमेज की कैटगरी तय करने वाले अलग-अलग मॉडल के साथ काम करता है:

इमेज क्लासिफ़िकेशन के मॉडल
बेसिक मॉडल डिफ़ॉल्ट रूप से, यह एपीआई अलग-अलग कामों के लिए इमेज को लेबल करने वाले बेहतरीन मॉडल का इस्तेमाल करता है. यह मॉडल 400 से ज़्यादा इकाइयों की पहचान करता है. ये इकाइयां, फ़ोटो के ऐसे कॉन्सेप्ट को कवर करती हैं जो आम तौर पर सबसे ज़्यादा मिलते हैं.
पसंद के मुताबिक TensorFlow Lite मॉडल ऐप्लिकेशन के खास सिद्धांतों को टारगेट करने के लिए, यह एपीआई कई तरह के सोर्स से पसंद के मुताबिक इमेज क्लासिफ़िकेशन मॉडल स्वीकार करता है. इनमें TensorFlow Hub से डाउनलोड किए गए, पहले से ट्रेन किए गए मॉडल हो सकते हैं. इसके अलावा, इनमें AutoML Vision Edge, TensorFlow Lite Model Maker या TensorFlow से ट्रेनिंग ली गई आपके मॉडल भी शामिल हो सकते हैं. मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Firebase मशीन लर्निंग के साथ होस्ट किया जा सकता है. साथ ही, इन्हें रन-टाइम पर डाउनलोड भी किया जा सकता है.

बेस मॉडल का इस्तेमाल करना

एमएल किट का बेस मॉडल ऐसी इकाइयों की सूची दिखाता है जो लोगों, चीज़ों, जगहों, गतिविधियों वगैरह की पहचान करती हैं. हर इकाई के लिए एक स्कोर होता है, जिससे पता चलता है कि मशीन लर्निंग मॉडल कितने काम का है. इस जानकारी की मदद से, अपने-आप मेटाडेटा जनरेट होने और कॉन्टेंट मॉडरेशन जैसे काम किए जा सकते हैं. एमएल किट के साथ दिए गए डिफ़ॉल्ट मॉडल में 400 से ज़्यादा अलग-अलग इकाइयों की पहचान की जाती है.

iOS Android

लेबल के उदाहरण

इमेज लेबलिंग एपीआई के बेस मॉडल में 400 से ज़्यादा लेबल काम करते हैं, जैसे कि नीचे दिए गए उदाहरण:

कैटगरीलेबल के उदाहरण
लोग Crowd
Selfie
Smile
गतिविधियां Dancing
Eating
Surfing
चीज़ें Car
Piano
Receipt
जानवर Bird
Cat
Dog
पौधे Flower
Fruit
Vegetable
जगहें Beach
Lake
Mountain

परिणामों के उदाहरण

यहां उन इकाइयों का उदाहरण दिया गया है जिन्हें साथ वाली फ़ोटो में पहचाना गया था.

फ़ोटो: Clément Bucco-Lechat / Wikimediacom / CC BY-SA 3.0
लेबल 0
टेक्स्ट स्टेडियम
कॉन्फ़िडेंस 0.9205354
लेबल 1
टेक्स्ट खेल
कॉन्फ़िडेंस 0.7531109
लेबल 2
टेक्स्ट इवेंट
कॉन्फ़िडेंस 0.66905296
लेबल 3
टेक्स्ट फ़ुर्सत के पल
कॉन्फ़िडेंस 0.59904146
लेबल 4
टेक्स्ट सॉकर (फ़ुटबॉल)
कॉन्फ़िडेंस 0.56384534
लेबल 5
टेक्स्ट कुल
कॉन्फ़िडेंस 0.54679185
लेबल 6
टेक्स्ट पौधा
कॉन्फ़िडेंस 0.524364

पसंद के मुताबिक बनाया गया TensorFlow Lite मॉडल इस्तेमाल करना

एमएल किट की बेस इमेज लेबलिंग मॉडल को, अलग-अलग कामों के लिए बनाया गया है. यह ट्रेनिंग ऐसी 400 कैटगरी की पहचान करने के लिए की गई है जो फ़ोटो में सबसे ज़्यादा खोजी जाने वाली चीज़ों की जानकारी देती हैं. आपको इमेज की कैटगरी तय करने वाले ऐसे खास मॉडल की ज़रूरत पड़ सकती है जो कैटगरी की सीमित संख्या के बारे में ज़्यादा जानकारी देता हो. उदाहरण के लिए, ऐसा मॉडल जो फूलों की प्रजातियों या अलग-अलग तरह की खाने की चीज़ों के बीच अंतर कर पाता है.

इस एपीआई की मदद से, कई तरह के सोर्स से कस्टम इमेज क्लासिफ़िकेशन मॉडल की सुविधा देकर, इस्तेमाल के किसी खास उदाहरण के हिसाब से बनाया जा सकता है. ज़्यादा जानने के लिए, कृपया एमएल किट वाले कस्टम मॉडल देखें. कस्टम मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या Firebase मशीन लर्निंग की मॉडल डिप्लॉयमेंट सेवा का इस्तेमाल करके, क्लाउड से डाइनैमिक तौर पर डाउनलोड किया जा सकता है.

iOS Android

इनपुट इमेज की प्री-प्रोसेसिंग

ज़रूरत पड़ने पर, इमेज लेबलिंग में इमेज के साइज़ और आसपेक्ट रेशियो (लंबाई-चौड़ाई का अनुपात) को अडजस्ट करने के लिए, बिलिनेयर इमेज स्केलिंग और स्ट्रेचिंग का इस्तेमाल किया जाता है, ताकि वे बुनियादी मॉडल की ज़रूरतों के हिसाब से हों.