टेक्स्ट की पहचान करने वाला v2

संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

ML किट टेक्स्ट पहचान v2 एपीआई किसी भी चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन वर्ण सेट में टेक्स्ट की पहचान कर सकता है. इस एपीआई का इस्तेमाल करके, डेटा एंट्री से जुड़े कामों को अपने-आप होने के लिए भी किया जा सकता है. जैसे, क्रेडिट कार्ड, रसीद, और बिज़नेस कार्ड को प्रोसेस करना.

iOS Android

मुख्य क्षमताएं

  • अलग-अलग स्क्रिप्ट और भाषाओं में टेक्स्ट की पहचान करें चाइनीज़, देवनागरी, जैपनीज़, कोरियन, और लैटिन स्क्रिप्ट में टेक्स्ट को पहचानने की सुविधा उपलब्ध है
  • टेक्स्ट की बनावट का विश्लेषण करता है सिंबल, एलिमेंट, लाइनों, और पैराग्राफ़ का पता लगाने की सुविधा देता है
  • टेक्स्ट की भाषा की पहचान करें
  • रीयल-टाइम में पहचान करना, कई तरह के डिवाइसों पर रीयल-टाइम में टेक्स्ट की पहचान करना

टेक्स्ट का स्ट्रक्चर

टेक्स्ट आइडेंटिफ़ायर, टेक्स्ट को ब्लॉक, लाइनों, एलिमेंट, और सिंबल में बांटता है. मोटे तौर पर बताना:

  • ब्लॉक करें, टेक्स्ट की लाइनों का एक सेट होता है, जैसे कि पैराग्राफ़ या कॉलम,

  • लाइन, एक ही ऐक्सिस पर शब्दों का एक बड़ा सेट होती है, और

  • एलिमेंट, लैटिन भाषा में एक ही ऐक्सिस पर अक्षर और अंक (जैसे, &शब्द और कोट) का एक तय सेट होता है

  • ज़्यादातर लैटिन भाषाओं में एक अक्ष या अक्षर और अंक में एक ही वर्ण होता है.

नीचे दी गई इमेज, इनमें से हर एक के उदाहरण को घटते क्रम में हाइलाइट करती है. स्यान में पहला हाइलाइट किया गया ब्लॉक, टेक्स्ट का एक ब्लॉक होता है. हाइलाइट किए गए ब्लॉक का दूसरा सेट, नीले रंग में दिखता है. आखिर में, गहरे नीले रंग में हाइलाइट किए गए ब्लॉक के तीसरे सेट को वर्ड कहते हैं.

सभी ब्लॉक किए गए ब्लॉक, लाइनों, एलिमेंट, और सिंबल के लिए एपीआई, बाउंडिंग बॉक्स, कॉर्नर पॉइंट, रोटेशन की जानकारी, कॉन्फ़िडेंस स्कोर, और पहचानी गई भाषाएं दिखाता है.

परिणामों के उदाहरण


फ़ोटो: Dietmar Rabich, Wikimedia Networks, "Düsselford, Wege der pallamentarischan Demokratie -- 2015 -- 8123" CC BY-SA 410}
पहचाना गया टेक्स्ट
टेक्स्ट वेग
डे पार्लामेंटारिसेन
डेमोग्राफ़ी
ब्लॉक (1 ब्लॉक)
ब्लॉक 0
टेक्स्ट विगे डे डे पर्लामेन्टिस्चेन डेमोक्रोटी
Frame (296, 665 - 796, 882)
कॉर्नर पॉइंट (296, 719), (778, 665), (796, 828), (314, 882)
मान्यता प्राप्त भाषा कोड de
लाइनें (तीन लाइनें)
लाइन 0
टेक्स्ट वेज डेर
Frame (434, 678 - 670, 749)
कॉर्नर पॉइंट (434, 705), (665, 678), (670, 722), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8766741
घुमाव डिग्री 6.6116457
एलिमेंट (दो एलिमेंट)
एलिमेंट 0
टेक्स्ट वेज
Frame (434, 689 - 575, 749)
कॉर्नर पॉइंट (434, 705), (570, 689), (575, 733), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8964844
घुमाव डिग्री 6.6116457
एलिमेंट (चार एलिमेंट)
सिंबल 0
टेक्स्ट W
Frame (434, 698 - 500, 749)
कॉर्नर पॉइंट (434, 706), (495, 698), (500, 741), (439, 749)
कॉन्फ़िडेंस स्कोर 0.87109375
घुमाव डिग्री 6.611646

Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.

Last updated 2022-09-23 UTC.