टेक्स्ट की पहचान करने की सुविधा

संग्रह की मदद से व्यवस्थित रहें अपनी प्राथमिकताओं के आधार पर, कॉन्टेंट को सेव करें और कैटगरी में बांटें.

एमएल किट टेक्स्ट की पहचान करने की सुविधा वाला एपीआई, लैटिन वर्शन पर आधारित किसी भी वर्ण सेट में मौजूद टेक्स्ट को पहचान सकता है. इसका इस्तेमाल डेटा एंट्री से जुड़े कामों को अपने-आप करने के लिए भी किया जा सकता है, जैसे कि क्रेडिट कार्ड, रसीदें, और बिज़नेस कार्ड.

iOS Android

मुख्य क्षमताएं

  • लैटिन-आधारित भाषाओं में टेक्स्ट की पहचान करें लैटिन स्क्रिप्ट का इस्तेमाल करके टेक्स्ट को पहचानने की सुविधा देता है
  • टेक्स्ट की बनावट का विश्लेषण करें इससे शब्दों/एलिमेंट, लाइन, और पैराग्राफ़ के बारे में पता चलता है
  • टेक्स्ट की भाषा की पहचान करें
  • छोटे ऐप्लिकेशन फ़ुटप्रिंट: Android पर, एपीआई को Google Play सेवाओं के ज़रिए अनबंडल लाइब्रेरी के तौर पर ऑफ़र किया जाता है
  • रीयल-टाइम में पहचान करना, कई तरह के डिवाइसों पर रीयल-टाइम में टेक्स्ट की पहचान करना

टेक्स्ट का स्ट्रक्चर

टेक्स्ट आइडेंटिफ़ायर, टेक्स्ट को ब्लॉक, लाइनों, एलिमेंट, और सिंबल में बांटता है. मोटे तौर पर बताना:

  • ब्लॉक करें, टेक्स्ट की लाइनों का एक सेट होता है, जैसे कि पैराग्राफ़ या कॉलम,

  • लाइन, एक ही ऐक्सिस पर शब्दों का एक बड़ा सेट होती है, और

  • एलिमेंट, लैटिन भाषा में एक ही ऐक्सिस पर अक्षर और अंक (जैसे, &शब्द और कोट) का एक तय सेट होता है

  • ज़्यादातर लैटिन भाषाओं में एक अक्ष या अक्षर और अंक में एक ही वर्ण होता है.

नीचे दी गई इमेज, इनमें से हर एक के उदाहरण को घटते क्रम में हाइलाइट करती है. स्यान में पहला हाइलाइट किया गया ब्लॉक, टेक्स्ट का एक ब्लॉक होता है. हाइलाइट किए गए ब्लॉक का दूसरा सेट, नीले रंग में दिखता है. आखिर में, गहरे नीले रंग में हाइलाइट किए गए ब्लॉक के तीसरे सेट को वर्ड कहते हैं.

सभी ब्लॉक किए गए ब्लॉक, लाइनों, एलिमेंट, और सिंबल के लिए एपीआई, बाउंडिंग बॉक्स, कॉर्नर पॉइंट, रोटेशन की जानकारी, कॉन्फ़िडेंस स्कोर, और पहचानी गई भाषाएं दिखाता है.

परिणामों के उदाहरण


फ़ोटो: Dietmar Rabich, Wikimedia Networks, "Düsselford, Wege der pallamentarischan Demokratie -- 2015 -- 8123" CC BY-SA 410}
पहचाना गया टेक्स्ट
टेक्स्ट वेग
डे पार्लामेंटारिसेन
डेमोग्राफ़ी
ब्लॉक (1 ब्लॉक)
ब्लॉक 0
टेक्स्ट विगे डे डे पर्लामेन्टिस्चेन डेमोक्रोटी
Frame (296, 665 - 796, 882)
कॉर्नर पॉइंट (296, 719), (778, 665), (796, 828), (314, 882)
मान्यता प्राप्त भाषा कोड de
लाइनें (तीन लाइनें)
लाइन 0
टेक्स्ट वेज डेर
Frame (434, 678 - 670, 749)
कॉर्नर पॉइंट (434, 705), (665, 678), (670, 722), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8766741
घुमाव डिग्री 6.6116457
एलिमेंट (दो एलिमेंट)
एलिमेंट 0
टेक्स्ट वेज
Frame (434, 689 - 575, 749)
कॉर्नर पॉइंट (434, 705), (570, 689), (575, 733), (439, 749)
मान्यता प्राप्त भाषा कोड de
कॉन्फ़िडेंस स्कोर 0.8964844
घुमाव डिग्री 6.6116457
एलिमेंट (चार एलिमेंट)
सिंबल 0
टेक्स्ट W
Frame (434, 698 - 500, 749)
कॉर्नर पॉइंट (434, 706), (495, 698), (500, 741), (439, 749)
कॉन्फ़िडेंस स्कोर 0.87109375
घुमाव डिग्री 6.611646

Except as otherwise noted, the content of this page is licensed under the Creative Commons Attribution 4.0 License, and code samples are licensed under the Apache 2.0 License. For details, see the Google Developers Site Policies. Java is a registered trademark of Oracle and/or its affiliates.

Last updated 2023-02-01 UTC.