Présentation de l'API Text Recognition

La reconnaissance de texte consiste à détecter du texte dans des images et des flux vidéo, et à reconnaître le texte qu'elle contient. Une fois détecté, l'outil de reconnaissance détermine le texte réel dans chaque bloc et le segmente en lignes et en mots. L'API Text détecte le texte en langue latine (allemand, anglais, français, etc.), en temps réel, sur l'appareil.

Essayez l'atelier de programmation Android MLKit pour apprendre à intégrer la dernière API Text dans votre application.

Langues reconnues

L'API Text peut reconnaître du texte dans n'importe quelle langue latine. Cela inclut, sans s'y limiter:

  • Catalan
  • Danois
  • Néerlandais
  • Anglais
  • Finnois
  • Français
  • Allemand
  • Hongrois
  • Italien
  • Latino
  • Norvégien
  • Polonais
  • Portugais
  • Roumain
  • Espagnol
  • Suédois
  • Tagalog
  • Turc

Structure du texte

La reconnaissance de texte segmente le texte en blocs, lignes et mots. Plus ou moins:

  • Un bloc est un ensemble contigu de lignes de texte, tel qu'un paragraphe ou une colonne.

  • Une ligne est un ensemble de mots contigus sur le même axe vertical.

  • Un mot est un ensemble contigu de caractères alphanumériques sur le même axe vertical.

L'image ci-dessous présente des exemples de chaque option dans l'ordre décroissant. Le premier bloc en surbrillance, cyan, est un bloc de texte. Le deuxième ensemble de blocs en surbrillance, en bleu, correspond à des lignes de texte. Enfin, le troisième ensemble de blocs en surbrillance, en bleu foncé, est Words.