L'API Text Kit Text Recognition v2 peut reconnaître du texte dans n'importe quel jeu de caractères chinois, coréen, devanagari, latin et japonais. L'API peut également servir à automatiser les tâches de saisie de données telles que le traitement des cartes de crédit, des reçus et des cartes de visite.
Capacités clés
- Reconnaître du texte dans différentes langues et scripts Compatible avec la reconnaissance de texte en scripts chinois, coréen, japonais et devanagari
- Analyse de la structure du texte : détecte les symboles, les éléments, les lignes et les paragraphes.
- Identifier la langue du texte : identifie la langue du texte reconnu.
- Reconnaissance en temps réel : peut reconnaître du texte en temps réel sur une large gamme d'appareils.
Structure du texte
La reconnaissance de texte segmente le texte en blocs, lignes, éléments et symboles. En gros:
Un bloc est un ensemble contigu de lignes de texte, tel qu'un paragraphe ou une colonne.
Une ligne est un ensemble de mots contigus sur le même axe.
Un élément est un ensemble contigu de caractères alphanumériques ("mot") sur le même axe dans la plupart des langues latines, ou un mot dans d'autres
Un symbole est un caractère alphanumérique unique sur le même axe dans la plupart des langues latines, ou un caractère dans d'autres
L'image ci-dessous présente des exemples de chaque option dans l'ordre décroissant. Le premier bloc en surbrillance, cyan, est un bloc de texte. Le deuxième ensemble de blocs en surbrillance, en bleu, correspond à des lignes de texte. Enfin, le troisième ensemble de blocs en surbrillance, en bleu foncé, est Words.
Pour tous les blocs, lignes, éléments et symboles détectés, l'API renvoie les cadres de délimitation, les points d'angle, les informations de rotation, le score de confiance, les langues reconnues et le texte reconnu.
Exemples de résultats

Photo : Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texte reconnu | |
---|---|
Texte | Wee der parlamentarischen Demokratie |
Blocs | (1 bloc) |
Bloc 0 | |
---|---|
Texte | Wege der parlamentarischen Demokratie |
Cadre | (296 665 - 796 882) |
Points d'angle | (296, 719), (778, 665), (796, 828), (314, 882) |
Code de langue reconnu | de |
Lignes | (3 lignes) |
Ligne 0 | |
---|---|
Texte | Wer der |
Cadre | (434 678 - 670 749) |
Points d'angle | (434, 705), (665, 678), (670, 722), (439, 749) |
Code de langue reconnu | de |
Score de confiance | 0,8766741 |
Degré de rotation | -6,6116457 |
Éléments | (2 éléments) |
Élément 0 | |
---|---|
Texte | Wege |
Cadre | (434 689 - 575, 749) |
Points d'angle | (434, 705), (570, 689), (575, 733), (439, 749) |
Code de langue reconnu | de |
Score de confiance | 0,8964844 |
Degré de rotation | -6,6116457 |
Éléments | (4 éléments) |
Symbole 0 | |
---|---|
Texte | M |
Cadre | (434 698 - 500 749) |
Points d'angle | (434, 706), (495, 698), (500, 741), (439, 749) |
Score de confiance | 0,87109375 |
Degré de rotation | -6,611646 |