ML किट रिकग्निशन v2 एपीआई, किसी भी चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन वर्ण सेट में टेक्स्ट की पहचान कर सकता है. एपीआई का इस्तेमाल डेटा-एंट्री टास्क को ऑटोमेट करने के लिए भी किया जा सकता है, जैसे कि क्रेडिट कार्ड, रसीदें, और बिज़नेस कार्ड प्रोसेस करना.
मुख्य सुविधाएं
- अलग-अलग स्क्रिप्ट और भाषाओं में टेक्स्ट की पहचान करें चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन स्क्रिप्ट में टेक्स्ट की पहचान करने की सुविधा दी जाती है
- टेक्स्ट की बनावट का विश्लेषण करता है इससे चिह्नों, एलिमेंट, लाइनों, और पैराग्राफ़ की पहचान करने में मदद मिलती है
- टेक्स्ट की भाषा की पहचान करें जाने-पहचाने टेक्स्ट की भाषा की पहचान करता है
- रीयल-टाइम पहचान: यह कई तरह के डिवाइसों पर रीयल टाइम में टेक्स्ट की पहचान कर सकती है
टेक्स्ट का स्ट्रक्चर
'टेक्स्ट की पहचान करने वाला' टूल, टेक्स्ट को ब्लॉक, लाइन, एलिमेंट, और सिंबल के तौर पर बांट देता है. मोटे तौर पर कहा जाए तो:
ब्लॉक करें, टेक्स्ट लाइनों का एक सेट होता है, जैसे कि पैराग्राफ़ या कॉलम,
लाइन एक ही ऐक्सिस पर शब्दों का करीबी सेट होता है और
एलिमेंट, ज़्यादातर लैटिन भाषाओं में एक ही ऐक्सिस पर, अक्षर और अंक ("शब्द") का लगातार होने वाला सेट होता है. वहीं, दूसरों में कोई शब्द होता है
प्रतीक एक ऐसा अक्षर होता है जो ज़्यादातर लैटिन भाषाओं में एक ही ऐक्सिस पर या किसी अन्य वर्ण में होता है
नीचे दी गई इमेज में इनमें से हर एक के उदाहरण को घटते हुए क्रम में हाइलाइट किया गया है. सायन में पहला हाइलाइट किया गया ब्लॉक, टेक्स्ट का एक ब्लॉक होता है. हाइलाइट किए गए ब्लॉक का दूसरा सेट नीले रंग का होता है. आखिर में, हाइलाइट किए गए ब्लॉक का तीसरा सेट, गहरे नीले रंग में, Words है.
पता लगाए गए सभी ब्लॉक, लाइनों, एलिमेंट और सिंबल के लिए, एपीआई बाउंडिंग बॉक्स, कॉर्नर पॉइंट, घुमाव की जानकारी, कॉन्फ़िडेंस स्कोर, पहचानी गई भाषाएं, और मान्य टेक्स्ट दिखाता है.
परिणामों के उदाहरण

फ़ोटो: डायटमार राबिश, विकिमीडिया कॉमंस, "डसेलडॉर्फ़, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
मान्यता प्राप्त टेक्स्ट | |
---|---|
टेक्स्ट | वेज दर पार्लामेंटरिश्कर डेमोक्रेटी |
ब्लॉक | (1 ब्लॉक) |
ब्लॉक 0 | |
---|---|
टेक्स्ट | विज डेर परालेमेंटारिस्का डेमोक्रेटी |
Frame | (296, 665 - 796, 882) |
कॉर्नर पॉइंट | (296, 719), (778, 665), (796, 828), (314, 882) |
मान्यता प्राप्त भाषा कोड | de |
लाइनें | (तीन लाइनें) |
लाइन 0 | |
---|---|
टेक्स्ट | विज डेर |
Frame | (434, 678 - 670, 749) |
कॉर्नर पॉइंट | (434, 705), (665, 678), (670, 722), (439, 749) |
मान्यता प्राप्त भाषा कोड | de |
कॉन्फ़िडेंस स्कोर | 0.8766741 |
रोटेशन डिग्री | -6.6116457 |
एलिमेंट | (दो एलिमेंट) |
एलिमेंट 0 | |
---|---|
टेक्स्ट | वेज |
Frame | (434, 689 - 575, 749) |
कॉर्नर पॉइंट | (434, 705), (570, 689), (575, 733), (439, 749) |
मान्यता प्राप्त भाषा कोड | de |
कॉन्फ़िडेंस स्कोर | 0.8964844 |
रोटेशन डिग्री | -6.6116457 |
एलिमेंट | (चार एलिमेंट) |
सिंबल 0 | |
---|---|
टेक्स्ट | W |
Frame | (434, 698 - 500, 749) |
कॉर्नर पॉइंट | (434, 706), (495, 698), (500, 741), (439, 749) |
कॉन्फ़िडेंस स्कोर | 0.87109375 |
रोटेशन डिग्री | -6.611646 |