टेक्स्ट की पहचान करने वाला v2

ML किट रिकग्निशन v2 एपीआई, किसी भी चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन वर्ण सेट में टेक्स्ट की पहचान कर सकता है. एपीआई का इस्तेमाल डेटा-एंट्री टास्क को ऑटोमेट करने के लिए भी किया जा सकता है, जैसे कि क्रेडिट कार्ड, रसीदें, और बिज़नेस कार्ड प्रोसेस करना.

iOS Android

मुख्य सुविधाएं

  • अलग-अलग स्क्रिप्ट और भाषाओं में टेक्स्ट की पहचान करें चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन स्क्रिप्ट में टेक्स्ट की पहचान करने की सुविधा दी जाती है
  • टेक्स्ट की बनावट का विश्लेषण करता है इससे चिह्नों, एलिमेंट, लाइनों, और पैराग्राफ़ की पहचान करने में मदद मिलती है
  • टेक्स्ट की भाषा की पहचान करें जाने-पहचाने टेक्स्ट की भाषा की पहचान करता है
  • रीयल-टाइम पहचान: यह कई तरह के डिवाइसों पर रीयल टाइम में टेक्स्ट की पहचान कर सकती है

टेक्स्ट का स्ट्रक्चर

'टेक्स्ट की पहचान करने वाला' टूल, टेक्स्ट को ब्लॉक, लाइन, एलिमेंट, और सिंबल के तौर पर बांट देता है. मोटे तौर पर कहा जाए तो:

  • ब्लॉक करें, टेक्स्ट लाइनों का एक सेट होता है, जैसे कि पैराग्राफ़ या कॉलम,

  • लाइन एक ही ऐक्सिस पर शब्दों का करीबी सेट होता है और

  • एलिमेंट, ज़्यादातर लैटिन भाषाओं में एक ही ऐक्सिस पर, अक्षर और अंक ("शब्द") का लगातार होने वाला सेट होता है. वहीं, दूसरों में कोई शब्द होता है

  • प्रतीक एक ऐसा अक्षर होता है जो ज़्यादातर लैटिन भाषाओं में एक ही ऐक्सिस पर या किसी अन्य वर्ण में होता है

नीचे दी गई इमेज में इनमें से हर एक के उदाहरण को घटते हुए क्रम में हाइलाइट किया गया है. सायन में पहला हाइलाइट किया गया ब्लॉक, टेक्स्ट का एक ब्लॉक होता है. हाइलाइट किए गए ब्लॉक का दूसरा सेट नीले रंग का होता है. आखिर में, हाइलाइट किए गए ब्लॉक का तीसरा सेट, गहरे नीले रंग में, Words है.

पता लगाए गए सभी ब्लॉक, लाइनों, एलिमेंट और सिंबल के लिए, एपीआई बाउंडिंग बॉक्स, कॉर्नर पॉइंट, घुमाव की जानकारी, कॉन्फ़िडेंस स्कोर, पहचानी गई भाषाएं, और मान्य टेक्स्ट दिखाता है.

परिणामों के उदाहरण


फ़ोटो: डायटमार राबिश, विकिमीडिया कॉमंस, "डसेलडॉर्फ़, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
मान्यता प्राप्त टेक्स्ट
टेक्स्ट वेज
दर पार्लामेंटरिश्कर
डेमोक्रेटी
ब्लॉक (1 ब्लॉक)
ब्लॉक 0
टेक्स्ट विज डेर परालेमेंटारिस्का डेमोक्रेटी
Frame (296, 665 - 796, 882)
कॉर्नर पॉइंट (296, 719), (778, 665), (796, 828), (314, 882)
मान्यता प्राप्त भाषा कोड de
लाइनें (तीन लाइनें)
लाइन 0
टेक्स्ट विज डेर
Frame (434, 678 - 670, 749)
कॉर्नर पॉइंट (434, 705), (665, 678), (670, 722), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8766741
रोटेशन डिग्री -6.6116457
एलिमेंट (दो एलिमेंट)
एलिमेंट 0
टेक्स्ट वेज
Frame (434, 689 - 575, 749)
कॉर्नर पॉइंट (434, 705), (570, 689), (575, 733), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8964844
रोटेशन डिग्री -6.6116457
एलिमेंट (चार एलिमेंट)
सिंबल 0
टेक्स्ट W
Frame (434, 698 - 500, 749)
कॉर्नर पॉइंट (434, 706), (495, 698), (500, 741), (439, 749)
कॉन्फ़िडेंस स्कोर 0.87109375
रोटेशन डिग्री -6.611646