يمكن لواجهة برمجة تطبيقات الإصدار الثاني من تقنية تعلُّم الآلة التعرُّف على النص في أي مجموعة من الأحرف الصينية والديفاناغارية واليابانية والكورية واللاتينية. يمكن استخدام واجهة برمجة التطبيقات أيضًا لتنفيذ مهام إدخال البيانات بشكل تلقائي مثل معالجة بطاقات الائتمان والإيصالات وبطاقات العمل.
نظام التشغيل iOS نظام التشغيل Android
الإمكانات الأساسية
- التعرف على النص عبر لغات ونصوص برمجية متنوعة يتيح التعرّف على النص المكتوب بالصينية والديفاناغارية واليابانية والكورية واللاتينية
- تحليل بنية النص دعم اكتشاف الرموز والعناصر والخطوط والفقرات
- تحديد لغة النص لتحديد لغة النص الذي تم التعرف عليه
- التعرف في الوقت الفعلي يمكن التعرف على النص في الوقت الفعلي على مجموعة واسعة من الأجهزة
بنية النص
تعمل أداة التعرف على النص على تقسيم النص إلى قوالب وخطوط وعناصر ورموز. بشكل تقريبي:
القالب هو عبارة عن مجموعة متجاورة من أسطر النص مثل فقرة أو عمود،
الخط عبارة عن مجموعة متجاورة من الكلمات على المحور نفسه،
العنصر عبارة عن مجموعة متجاورة من الأحرف الأبجدية الرقمية ("الكلمة") على المحور نفسه في معظم اللغات اللاتينية، أو كلمة في لغات أخرى
الرمز هو حرف واحد أبجدي رقمي على المحور نفسه في معظم اللغات اللاتينية، أو حرف في اللغات الأخرى
توضح الصورة أدناه أمثلة لكلٍّ منها بترتيب تنازلي. أول قالب تم تمييزه باللون السماوي هو عبارة عن قالب نصي. المجموعة الثانية من القوالب المميزة باللون الأزرق هي أسطر من النص. وأخيرًا، المجموعة الثالثة من القوالب المميزة باللون الأزرق الغامق هي Words.
بالنسبة إلى جميع القوالب والخطوط والعناصر والرموز التي يتم اكتشافها، تعرض واجهة برمجة التطبيقات المربعات المحيطة ونقاط الزاوية ومعلومات التدوير ونتيجة الثقة واللغات المعترَف بها والنص المعترف به.
أمثلة النتائج
نص تم التعرّف عليه | |
---|---|
النص | فيج der parlamentarischen Demokratie |
مرات صد الكرة | (قالب واحد) |
القالب 0 | |
---|---|
النص | فيج دير بارلاميناتشينسكي ديمو كاتي |
إطار | (296 و665 - 796 و882) |
نقاط الركن | (296 و719) و(778 و665) و(796 و828) و(314 و882) |
رمز اللغة المعترف به | de |
الأسطر | (3 أسطر) |
السطر 0 | |
---|---|
النص | فيج دير |
إطار | (434، 678 - 670، 749) |
نقاط الركن | (434، 705)، (665، 678)، (670، 722)، (439، 749) |
رمز اللغة المعترف به | de |
نتيجة الثقة | 0.8766741 |
درجة الدوران | -6.6116457 |
العناصر | (عنصران) |
العنصر 0 | |
---|---|
النص | ويج |
إطار | (434، 689 - 575، 749) |
نقاط الركن | (434، 705)، (570، 689)، (575، 733)، (439، 749) |
رمز اللغة المعترف به | de |
نتيجة الثقة | 0.8964844 |
درجة الدوران | -6.6116457 |
العناصر | (4 عناصر) |
الرمز 0 | |
---|---|
النص | واط |
إطار | (434، 698 - 500، 749) |
نقاط الركن | (434، 706)، (495، 698)، (500، 741)، (439، 749) |
نتيجة الثقة | 0.87109375 |
درجة الدوران | -6.611646 |