Reconnaissance de texte v2

L'API de reconnaissance de texte de ML Kit v2 peut reconnaître du texte dans n'importe quel jeu de caractères chinois, devanagari, japonais, coréen et latin. L'API peut également être utilisée pour automatiser les tâches de saisie de données telles que le traitement des cartes de crédit, des reçus et des cartes de visite.

iOS Android

Capacités clés

  • Reconnaissance de texte dans différents scripts et langues
  • Analyse la structure du texte : permet la détection de symboles, d'éléments, de lignes et de paragraphes
  • Identifier la langue du texte : identifie la langue du texte reconnu.
  • Reconnaissance en temps réel : peut reconnaître du texte en temps réel sur de nombreux appareils.

Structure du texte

L'outil de reconnaissance de texte segmente le texte en blocs, lignes, éléments et symboles. En gros,

  • Un Block est un ensemble contigu de lignes de texte, tel qu'un paragraphe ou une colonne.

  • Une ligne est un ensemble contigu de mots sur le même axe.

  • Un élément est un ensemble contigu de caractères alphanumériques ("mot") sur le même axe dans la plupart des langues latines, ou un mot dans d'autres

  • Un symbole est un caractère alphanumérique unique sur le même axe dans la plupart des langues latines ou un caractère dans d'autres.

L'image ci-dessous met en évidence des exemples de chacun de ces éléments dans l'ordre décroissant. Le premier bloc en surbrillance, en cyan, est un bloc de texte. Le deuxième ensemble de blocs surlignés, en bleu, est constitué de lignes de texte. Enfin, le troisième ensemble de blocs en surbrillance, en bleu foncé, est Mots.

Pour tous les blocs, lignes, éléments et symboles détectés, l'API renvoie les cadres de délimitation, les points d'angle, les informations de rotation, le score de confiance, les langues et le texte reconnus.

Exemples de résultats


Photo : Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texte reconnu
Texte Wege
der parlamentarischen
Demokratie
Blocages (1 bloc)
Bloc 0
Texte Wege der parlamentarischen Demokratie
Cadre (296 665 – 796 882)
Points d'angle (296, 719), (778, 665), (796, 828), (314, 882)
Code de langue reconnu de
Lignes (3 lignes)
Ligne 0
Texte Wege der
Cadre (434 678 – 670 749)
Points d'angle (434, 705), (665, 678), (670, 722), (439, 749)
Code de langue reconnu de
Score de confiance 0,8766741
Degré de rotation -6,6116457
Éléments (2 éléments)
Élément 0
Texte Wege
Cadre (434 689 – 575 749)
Points d'angle (434, 705), (570, 689), (575, 733), (439, 749)
Code de langue reconnu de
Score de confiance 0,8964844
Degré de rotation -6,6116457
Éléments (4 éléments)
Symbole 0
Texte  W
Cadre (434 698 – 500 749)
Points d'angle (434, 706), (495, 698), (500, 741), (439, 749)
Score de confiance 0,87109375
Degré de rotation -6,611646