L'API de reconnaissance de texte de ML Kit v2 peut reconnaître du texte dans n'importe quel jeu de caractères chinois, devanagari, japonais, coréen et latin. L'API peut également être utilisée pour automatiser les tâches de saisie de données telles que le traitement des cartes de crédit, des reçus et des cartes de visite.
Capacités clés
- Reconnaissance de texte dans différents scripts et langues
- Analyse la structure du texte : permet la détection de symboles, d'éléments, de lignes et de paragraphes
- Identifier la langue du texte : identifie la langue du texte reconnu.
- Reconnaissance en temps réel : peut reconnaître du texte en temps réel sur de nombreux appareils.
Structure du texte
L'outil de reconnaissance de texte segmente le texte en blocs, lignes, éléments et symboles. En gros,
Un Block est un ensemble contigu de lignes de texte, tel qu'un paragraphe ou une colonne.
Une ligne est un ensemble contigu de mots sur le même axe.
Un élément est un ensemble contigu de caractères alphanumériques ("mot") sur le même axe dans la plupart des langues latines, ou un mot dans d'autres
Un symbole est un caractère alphanumérique unique sur le même axe dans la plupart des langues latines ou un caractère dans d'autres.
L'image ci-dessous met en évidence des exemples de chacun de ces éléments dans l'ordre décroissant. Le premier bloc en surbrillance, en cyan, est un bloc de texte. Le deuxième ensemble de blocs surlignés, en bleu, est constitué de lignes de texte. Enfin, le troisième ensemble de blocs en surbrillance, en bleu foncé, est Mots.
Pour tous les blocs, lignes, éléments et symboles détectés, l'API renvoie les cadres de délimitation, les points d'angle, les informations de rotation, le score de confiance, les langues et le texte reconnus.
Exemples de résultats
Texte reconnu | |
---|---|
Texte | Wege der parlamentarischen Demokratie |
Blocages | (1 bloc) |
Bloc 0 | |
---|---|
Texte | Wege der parlamentarischen Demokratie |
Cadre | (296 665 – 796 882) |
Points d'angle | (296, 719), (778, 665), (796, 828), (314, 882) |
Code de langue reconnu | de |
Lignes | (3 lignes) |
Ligne 0 | |
---|---|
Texte | Wege der |
Cadre | (434 678 – 670 749) |
Points d'angle | (434, 705), (665, 678), (670, 722), (439, 749) |
Code de langue reconnu | de |
Score de confiance | 0,8766741 |
Degré de rotation | -6,6116457 |
Éléments | (2 éléments) |
Élément 0 | |
---|---|
Texte | Wege |
Cadre | (434 689 – 575 749) |
Points d'angle | (434, 705), (570, 689), (575, 733), (439, 749) |
Code de langue reconnu | de |
Score de confiance | 0,8964844 |
Degré de rotation | -6,6116457 |
Éléments | (4 éléments) |
Symbole 0 | |
---|---|
Texte | W |
Cadre | (434 698 – 500 749) |
Points d'angle | (434, 706), (495, 698), (500, 741), (439, 749) |
Score de confiance | 0,87109375 |
Degré de rotation | -6,611646 |