Reconnaissance de texte version 2

L'API Text Kit Text Recognition v2 peut reconnaître du texte dans n'importe quel jeu de caractères chinois, coréen, devanagari, latin et japonais. L'API peut également servir à automatiser les tâches de saisie de données telles que le traitement des cartes de crédit, des reçus et des cartes de visite.

iOS Android

Capacités clés

  • Reconnaître du texte dans différentes langues et scripts Compatible avec la reconnaissance de texte en scripts chinois, coréen, japonais et devanagari
  • Analyse de la structure du texte : détecte les symboles, les éléments, les lignes et les paragraphes.
  • Identifier la langue du texte : identifie la langue du texte reconnu.
  • Reconnaissance en temps réel : peut reconnaître du texte en temps réel sur une large gamme d'appareils.

Structure du texte

La reconnaissance de texte segmente le texte en blocs, lignes, éléments et symboles. En gros:

  • Un bloc est un ensemble contigu de lignes de texte, tel qu'un paragraphe ou une colonne.

  • Une ligne est un ensemble de mots contigus sur le même axe.

  • Un élément est un ensemble contigu de caractères alphanumériques ("mot") sur le même axe dans la plupart des langues latines, ou un mot dans d'autres

  • Un symbole est un caractère alphanumérique unique sur le même axe dans la plupart des langues latines, ou un caractère dans d'autres

L'image ci-dessous présente des exemples de chaque option dans l'ordre décroissant. Le premier bloc en surbrillance, cyan, est un bloc de texte. Le deuxième ensemble de blocs en surbrillance, en bleu, correspond à des lignes de texte. Enfin, le troisième ensemble de blocs en surbrillance, en bleu foncé, est Words.

Pour tous les blocs, lignes, éléments et symboles détectés, l'API renvoie les cadres de délimitation, les points d'angle, les informations de rotation, le score de confiance, les langues reconnues et le texte reconnu.

Exemples de résultats


Photo : Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texte reconnu
Texte Wee
der parlamentarischen
Demokratie
Blocs (1 bloc)
Bloc 0
Texte Wege der parlamentarischen Demokratie
Cadre (296 665 - 796 882)
Points d'angle (296, 719), (778, 665), (796, 828), (314, 882)
Code de langue reconnu de
Lignes (3 lignes)
Ligne 0
Texte Wer der
Cadre (434 678 - 670 749)
Points d'angle (434, 705), (665, 678), (670, 722), (439, 749)
Code de langue reconnu de
Score de confiance 0,8766741
Degré de rotation -6,6116457
Éléments (2 éléments)
Élément 0
Texte Wege
Cadre (434 689 - 575, 749)
Points d'angle (434, 705), (570, 689), (575, 733), (439, 749)
Code de langue reconnu de
Score de confiance 0,8964844
Degré de rotation -6,6116457
Éléments (4 éléments)
Symbole 0
Texte M
Cadre (434 698 - 500 749)
Points d'angle (434, 706), (495, 698), (500, 741), (439, 749)
Score de confiance 0,87109375
Degré de rotation -6,611646