Reconhecimento de texto v2

A API ML Kit Text Recognition v2 reconhece texto em qualquer conjunto de caracteres chineses, devanágari, japoneses, coreanos e latinos. A API também pode ser usada para automatizar tarefas de entrada de dados, como processamento de cartões de crédito, recibos e cartões de visita.

iOS Android

Principais recursos

  • Reconhecer texto em vários scripts e idiomas é compatível com o reconhecimento de texto em scripts em chinês, devanágari, japonês, coreano e latino
  • Analisar a estrutura do texto: oferece suporte à detecção de símbolos, elementos, linhas e parágrafos
  • Identificar idioma do texto Identifica o idioma do texto reconhecido.
  • Reconhecimento em tempo real pode reconhecer texto em tempo real em uma grande variedade de dispositivos

Estrutura do texto

O reconhecedor de texto segmenta o texto em blocos, linhas, elementos e símbolos. Em termos gerais:

  • um bloco é um conjunto contíguo de linhas de texto, como um parágrafo ou uma coluna,

  • uma linha é um conjunto contíguo de palavras no mesmo eixo; e

  • Um elemento é um conjunto contíguo de caracteres alfanuméricos ("palavra") no mesmo eixo na maioria dos idiomas latinos, ou uma palavra em outros.

  • Um Símbolo é um único caractere alfanumérico no mesmo eixo na maioria dos idiomas latinos ou um caractere em outros.

A imagem abaixo destaca exemplos de cada um deles em ordem decrescente. O primeiro bloco destacado, em ciano, é um bloco de texto. O segundo conjunto de blocos destacados, em azul, são linhas de texto. Por fim, o terceiro conjunto de blocos destacados, em azul-escuro, são Words.

Para todos os blocos, linhas, elementos e símbolos detectados, a API retorna as caixas delimitadoras, pontos de canto, informações de rotação, pontuação de confiança, idiomas reconhecidos e texto reconhecido.

Resultados de exemplo


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconhecido
Texto Wege
der parlamentarischen
Demokratie
Bloqueios (1 bloco)
Bloco 0
Texto Wege der parlamentarischen Demokratie
Quadro (296.665 a 796.882)
Pontos de canto (296, 719), (778, 665), (796, 828), (314, 882)
Código de idioma reconhecido de
linhas; (3 linhas)
Linha 0
Texto Wege der
Quadro (434.678 a 670.749)
Pontos de canto (434, 705), (665, 678), (670, 722), (439, 749)
Código de idioma reconhecido de
Pontuação de confiança 0,8766741
Grau de rotação -6,6116457
Elementos (2 elementos)
Elemento 0
Texto Wege
Quadro (434.689-575.749)
Pontos de canto (434, 705), (570, 689), (575, 733), (439, 749)
Código de idioma reconhecido de
Pontuação de confiança 0,8964844
Grau de rotação -6,6116457
Elementos (4 elementos)
Símbolo 0
Texto Qua
Quadro (434.698 a 500.749)
Pontos de canto (434, 706), (495, 698), (500, 741), (439, 749)
Pontuação de confiança 0,87109375
Grau de rotação -6,611646