ऑब्जेक्ट की पहचान और ट्रैकिंग

ML किट की ऑन-डिवाइस ऑब्जेक्ट पहचान और ट्रैकिंग एपीआई की मदद से, किसी इमेज या लाइव कैमरा फ़ीड में ऑब्जेक्ट का पता लगाया जा सकता है और उन्हें ट्रैक किया जा सकता है.

इसके अलावा, एपीआई में बने खुरदड़ कैटगरी तय करने वाले तरीके का इस्तेमाल करके या अपनी पसंद के मुताबिक बनाए गए इमेज क्लासिफ़िकेशन मॉडल का इस्तेमाल करके, पहचानी गई चीज़ों की कैटगरी तय की जा सकती है. ज़्यादा जानकारी के लिए, कस्टम TensorFlow लाइट मॉडल का इस्तेमाल करना देखें.

ऑब्जेक्ट का पता लगाने और उसे ट्रैक करने से डिवाइस पर काम होता है. इसलिए, यह विज़ुअल सर्च पाइपलाइन के सामने वाले हिस्से पर भी ठीक से काम करता है. ऑब्जेक्ट का पता लगाने और उन्हें फ़िल्टर करने के बाद, उन्हें किसी क्लाउड बैकएंड पर भेजा जा सकता है, जैसे कि Cloud Vision प्रॉडक्ट सर्च.

iOS Android

मुख्य सुविधाएं

  • तेज़ ऑब्जेक्ट का पता लगाना और ट्रैकिंग ऑब्जेक्ट का पता लगाएं और इमेज में उनकी जगह ढूंढें. एक से ज़्यादा इमेज फ़्रेम में ऑब्जेक्ट ट्रैक करें.
  • ऑप्टिमाइज़ किया गया डिवाइस मॉडल ऑब्जेक्ट का पता लगाने और उसे ट्रैक करने के मॉडल को मोबाइल डिवाइस के लिए ऑप्टिमाइज़ किया गया है. इसका इस्तेमाल रीयल-टाइम ऐप्लिकेशन में भी किया जा सकता है.
  • प्रमुख ऑब्जेक्ट की पहचान इमेज में सबसे प्रमुख ऑब्जेक्ट को अपने आप तय करें.
  • असभ्य वर्गीकरण ऑब्जेक्ट को विस्तृत श्रेणियों में वर्गीकृत करें, जिनका उपयोग आप उन ऑब्जेक्ट को फ़िल्टर करने के लिए कर सकते हैं, जिनमें आपकी रुचि नहीं है. ये कैटगरी काम करती हैं: घर के सामान, फ़ैशन के सामान, खाना, पौधे, और जगहें.
  • कस्टम मॉडल के साथ क्लासिफ़िकेशन खास ऑब्जेक्ट कैटगरी की पहचान करने या उन्हें फ़िल्टर करने के लिए, कस्टम इमेज क्लासिफ़िकेशन मॉडल का इस्तेमाल करें. अपने कस्टम मॉडल का बेहतर प्रदर्शन करने के लिए, इमेज के बैकग्राउंड को छोड़ दें.

परिणामों के उदाहरण

सभी इमेज में, सबसे अहम ऑब्जेक्ट को ट्रैक करना

नीचे दिया गया उदाहरण एक के बाद एक तीन फ़्रेम का ट्रैकिंग डेटा दिखाता है. इसमें आम तौर पर, मशीन लर्निंग (एमएल किट) से मिलने वाले, डेटा की कैटगरी तय करने वाले डिफ़ॉल्ट टूल की जानकारी दी गई है.

ट्रैकिंग आईडी 0
सीमाएं (95, 45), (496, 45), (496, 240), (95, 240)
कैटगरी जगह
कॉन्फ़िडेंस क्लासिफ़िकेशन 0.9296875
ट्रैकिंग आईडी 0
सीमाएं (84, 46), (478, 46), (478, 247), (84, 247)
कैटगरी जगह
कॉन्फ़िडेंस क्लासिफ़िकेशन 0.8710938
ट्रैकिंग आईडी 0
सीमाएं (53, 45), (519, 45), (519, 240), (53, 240)
कैटगरी जगह
कॉन्फ़िडेंस क्लासिफ़िकेशन 0.8828125

फ़ोटो: क्रिश्चियन फ़ेरर [CC BY-SA 4.0]

स्टैटिक इमेज में कई ऑब्जेक्ट

नीचे दिए गए उदाहरण में, इमेज में पाए गए चार ऑब्जेक्ट के लिए डेटा दिखाया गया है. इसमें एमएल किट से मिलने वाला डिफ़ॉल्ट रूप से अनुमानित क्लासिफ़ायर दिया गया है.

ऑब्जेक्ट 0
सीमाएं (1, 97), (332, 97), (332, 332), (1, 332)
कैटगरी FASHION_GOOD
कॉन्फ़िडेंस क्लासिफ़िकेशन 0.95703125
ऑब्जेक्ट 1
सीमाएं (186, 80), (337, 80), (337, 226), (186, 226)
कैटगरी FASHION_GOOD
कॉन्फ़िडेंस क्लासिफ़िकेशन 0.84375
ऑब्जेक्ट 2
सीमाएं (296, 80), (472, 80), (472, 388), (296, 388) (
कैटगरी FASHION_GOOD
कॉन्फ़िडेंस क्लासिफ़िकेशन 0.94921875
ऑब्जेक्ट 3
सीमाएं (439, 83), (615, 83), (615, 306), (439, 306)
कैटगरी FASHION_GOOD
कॉन्फ़िडेंस क्लासिफ़िकेशन 0.9375

कस्टम TensorFlow लाइट मॉडल का इस्तेमाल करना

कैटगरी का डिफ़ॉल्ट ऊपरी हिस्सा पांच कैटगरी के लिए बनाया गया है. इससे, पता चलने वाली चीज़ों के बारे में सीमित जानकारी मिलती है. आपको एक ज़्यादा खास क्लासिफ़ायर मॉडल की ज़रूरत पड़ सकती है, जिसमें कॉन्सेप्ट के बारे में ज़्यादा सटीक जानकारी देने वाला डोमेन शामिल हो. उदाहरण के लिए, एक मॉडल जो फूलों की प्रजातियों या अलग-अलग तरह के भोजन में अंतर करता है.

यह एपीआई, आपको कई तरह के स्रोतों से कस्टम इमेज की कैटगरी तय करने वाले मॉडल के हिसाब से, इस्तेमाल के किसी खास उदाहरण में बदलाव करने की सुविधा देता है. ज़्यादा जानने के लिए, कृपया एमएल किट वाले कस्टम मॉडल देखें. कस्टम मॉडल को आपके ऐप्लिकेशन के साथ बंडल किया जा सकता है या क्लाउड से डाइनैमिक तरीके से डाउनलोड किया जा सकता है. इसके लिए, 'Firebase मशीन लर्निंग' की मॉडल डिप्लॉयमेंट सेवा का इस्तेमाल किया जाता है.

iOS Android

इनपुट चित्र प्री-प्रोसेसिंग

अगर ज़रूरत हो, तो ऑब्जेक्ट का पता लगाने और उसे ट्रैक करने के लिए, इनपुट इमेज के साइज़ और आसपेक्ट रेशियो को अडजस्ट करने के लिए, बायलाइनर इमेज स्केलिंग और स्ट्रैचिंग का इस्तेमाल किया जाता है. इससे, ये मॉडल के मॉडल की ज़रूरी शर्तों के मुताबिक हो जाती हैं.