পাঠ্য শনাক্তকরণ v2

ML Kit Text Recognition v2 API যেকোন চাইনিজ, দেবনাগরী, জাপানীজ, কোরিয়ান এবং ল্যাটিন অক্ষর সেটে টেক্সট চিনতে পারে। ক্রেডিট কার্ড, রসিদ এবং ব্যবসায়িক কার্ড প্রক্রিয়াকরণের মতো ডেটা-এন্ট্রি কাজগুলি স্বয়ংক্রিয় করতে API ব্যবহার করা যেতে পারে।

iOS অ্যান্ড্রয়েড

মূল ক্ষমতা

  • বিভিন্ন স্ক্রিপ্ট এবং ভাষা জুড়ে পাঠ্য শনাক্ত করুন চীনা, দেবনাগরী, জাপানি, কোরিয়ান এবং ল্যাটিন স্ক্রিপ্টে পাঠ্য সনাক্তকরণ সমর্থন করে
  • পাঠ্যের গঠন বিশ্লেষণ করে প্রতীক, উপাদান, লাইন এবং অনুচ্ছেদ সনাক্তকরণ সমর্থন করে
  • পাঠ্যের ভাষা সনাক্ত করুন স্বীকৃত পাঠ্যের ভাষা সনাক্ত করে
  • রিয়েল-টাইম স্বীকৃতি বিভিন্ন ডিভাইসে রিয়েল-টাইমে পাঠ্যকে চিনতে পারে

পাঠ্য কাঠামো

পাঠ্য শনাক্তকারী পাঠ্যকে ব্লক, লাইন, উপাদান এবং প্রতীকে ভাগ করে। কঠোরভাবে কথা বলা:

  • একটি ব্লক হল পাঠ্য লাইনের একটি সংলগ্ন সেট, যেমন একটি অনুচ্ছেদ বা কলাম,

  • একটি রেখা হল একই অক্ষে শব্দের একটি সংলগ্ন সেট, এবং

  • একটি উপাদান হল বেশিরভাগ ল্যাটিন ভাষায় একই অক্ষের আলফানিউমেরিক অক্ষরের ("শব্দ") একটি সংলগ্ন সেট, বা অন্যদের একটি শব্দ

  • একটি প্রতীক হল বেশিরভাগ ল্যাটিন ভাষায় একই অক্ষের একটি একক বর্ণসংখ্যার অক্ষর বা অন্যদের একটি অক্ষর

নীচের চিত্রটি নিচের ক্রমে এইগুলির প্রতিটির উদাহরণ হাইলাইট করে৷ প্রথম হাইলাইট করা ব্লক, সায়ানে, পাঠ্যের একটি ব্লক। হাইলাইট করা ব্লকের দ্বিতীয় সেট, নীল রঙে, পাঠ্যের লাইন। অবশেষে, গাঢ় নীল রঙে হাইলাইট করা ব্লকের তৃতীয় সেট হল শব্দ।

সমস্ত সনাক্ত করা ব্লক, লাইন, উপাদান এবং প্রতীকগুলির জন্য, API বাউন্ডিং বাক্স, কোণার পয়েন্ট, ঘূর্ণন তথ্য, আত্মবিশ্বাসের স্কোর, স্বীকৃত ভাষা এবং স্বীকৃত পাঠ্য প্রদান করে।

উদাহরণ ফলাফল


ছবি: ডায়েটমার রাবিচ , উইকিমিডিয়া কমন্স , "ডুসেলডর্ফ, ওয়েজ ডার পার্লামেন্টারিসচেন ডেমোক্র্যাটি -- 2015 -- 8123" , CC BY-SA 4.0
স্বীকৃত পাঠ্য
পাঠ্য ওয়েজ
der parlamentarischen
গণতন্ত্র
ব্লক (1 ব্লক)
ব্লক 0
পাঠ্য Wege der parlamentarischen Demokratie
ফ্রেম (২৯৬, ৬৬৫ - ৭৯৬, ৮৮২)
কোণার পয়েন্ট (296, 719), (778, 665), (796, 828), (314, 882)
স্বীকৃত ভাষা কোড ডি
লাইন (৩ লাইন)
লাইন 0
পাঠ্য Wege der
ফ্রেম (৪৩৪, ৬৭৮ - ৬৭০, ৭৪৯)
কোণার পয়েন্ট (434, 705), (665, 678), (670, 722), (439, 749)
স্বীকৃত ভাষা কোড ডি
আত্মবিশ্বাসের স্কোর ০.৮৭৬৬৭৪১
ঘূর্ণন ডিগ্রী -6.6116457
উপাদান (2 উপাদান)
উপাদান 0
পাঠ্য ওয়েজ
ফ্রেম (434, 689 - 575, 749)
কোণার পয়েন্ট (434, 705), (570, 689), (575, 733), (439, 749)
স্বীকৃত ভাষা কোড ডি
আত্মবিশ্বাসের স্কোর 0.8964844
ঘূর্ণন ডিগ্রী -6.6116457
উপাদান (4 উপাদান)
চিহ্ন 0
পাঠ্য ডব্লিউ
ফ্রেম (৪৩৪, ৬৯৮ - ৫০০, ৭৪৯)
কোণার পয়েন্ট (434, 706), (495, 698), (500, 741), (439, 749)
আত্মবিশ্বাসের স্কোর 0.87109375
ঘূর্ণন ডিগ্রী -6.611646