تشخیص متن

با مجموعه‌ها، منظم بمانید ذخیره و دسته‌بندی محتوا براساس اولویت‌های شما.

ML Kit Text Recognition API می‌تواند متن را در هر مجموعه نویسه‌های مبتنی بر لاتین تشخیص دهد. همچنین می‌توان از آن برای خودکارسازی وظایف ورود داده‌ها مانند پردازش کارت‌های اعتباری، رسیدها و کارت‌های تجاری استفاده کرد.

iOS اندروید

قابلیت های کلیدی

  • تشخیص متن در زبان‌های مبتنی بر لاتین از تشخیص متن با استفاده از خط لاتین پشتیبانی می‌کند
  • تجزیه و تحلیل ساختار متن از تشخیص کلمات/عناصر، خطوط و پاراگراف ها پشتیبانی می کند
  • شناسایی زبان متن زبان متن شناسایی شده را شناسایی می کند
  • ردپای کوچک برنامه در Android، API به عنوان یک کتابخانه جدا نشده از طریق خدمات Google Play ارائه می شود.
  • تشخیص زمان واقعی می تواند متن را در زمان واقعی در طیف گسترده ای از دستگاه ها تشخیص دهد

ساختار متن

Text Recognizer متن را به بلوک ها، خطوط، عناصر و نمادها تقسیم می کند. به طور کلی:

  • Block مجموعه ای از خطوط متنی به هم پیوسته است، مانند یک پاراگراف یا ستون،

  • a Line مجموعه ای از کلمات به هم پیوسته در یک محور است و

  • یک عنصر مجموعه ای از نویسه های الفبایی عددی ("کلمه") در یک محور در اکثر زبان های لاتین یا یک کلمه در زبان های دیگر است.

  • نماد یک نویسه الفبایی منفرد در یک محور در اکثر زبان های لاتین یا یک کاراکتر در زبان های دیگر است.

تصویر زیر نمونه هایی از هر یک از این موارد را به ترتیب نزولی نشان می دهد. اولین بلوک برجسته، به رنگ فیروزه ای، یک بلوک متن است. مجموعه دوم بلوک های برجسته، به رنگ آبی، خطوط متن هستند. در نهایت، مجموعه سوم بلوک های برجسته، به رنگ آبی تیره، Words هستند.

برای تمام بلوک‌ها، خطوط، عناصر و نمادهای شناسایی‌شده، API کادرهای محدود، نقاط گوشه، اطلاعات چرخش، امتیاز اطمینان، زبان‌های شناسایی شده و متن شناسایی شده را برمی‌گرداند.

نتایج نمونه


عکس: دیتمار رابیچ ، ویکی‌مدیا ، "دوسلدورف، Wege der parlamentarischen Demokratie -- 2015 -- 8123" ، CC BY-SA 4.0
متن شناخته شده
متن Wege
der parlamentarischen
دموکراسی
بلوک ها (1 بلوک)
بلوک 0
متن Wege der parlamentarischen Demokratie
قاب (296، 665 - 796، 882)
نقاط گوشه (296، 719)، (778، 665)، (796، 828)، (314، 882)
کد زبان شناخته شده de
خطوط (3 خط)
خط 0
متن Wege der
قاب (434، 678 - 670، 749)
نقاط گوشه (434، 705)، (665، 678)، (670، 722)، (439، 749)
کد زبان شناخته شده de
امتیاز اعتماد به نفس 0.8766741
درجه چرخش -6.6116457
عناصر (2 عنصر)
عنصر 0
متن Wege
قاب (434، 689 - 575، 749)
نقاط گوشه (434، 705)، (570، 689)، (575، 733)، (439، 749)
کد زبان شناخته شده de
امتیاز اعتماد به نفس 0.8964844
درجه چرخش -6.6116457
عناصر (4 عنصر)
نماد 0
متن دبلیو
قاب (434، 698 - 500، 749)
نقاط گوشه (434، 706)، (495، 698)، (500، 741)، (439، 749)
امتیاز اعتماد به نفس 0.87109375
درجه چرخش -6.611646