Reconhecimento de texto

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

A API ML Kit Text Recognition pode reconhecer texto em qualquer conjunto de caracteres baseado no alfabeto latino. Ele também pode ser usado para automatizar tarefas de entrada de dados, como processamento de cartões de crédito, recibos e cartões de visita.

iOS Android

Principais recursos

  • Reconhecer texto em idiomas latinos e suporta o reconhecimento de texto usando script latino
  • Analisar estrutura do texto: oferece suporte à detecção de palavras/elementos, linhas e parágrafos
  • Identificar idioma do texto Identifica o idioma do texto reconhecido
  • Pegada de aplicativo pequena no Android, a API é oferecida como uma biblioteca desagrupada pelo Google Play Services
  • Reconhecimento em tempo real: pode reconhecer texto em tempo real em vários dispositivos.

Estrutura do texto

O reconhecedor de texto segmenta o texto em blocos, linhas, elementos e símbolos. Cerca de:

  • um bloco é um conjunto contíguo de linhas de texto, como um parágrafo ou coluna.

  • uma linha é um conjunto contíguo de palavras no mesmo eixo; e

  • um Elemento é um conjunto contíguo de caracteres alfanuméricos ("word") no mesmo eixo na maioria das línguas latinas ou uma palavra em outros.

  • um Símbolo é um caractere alfanumérico no mesmo eixo na maioria dos idiomas latinos ou um caractere em outros

A imagem abaixo destaca exemplos de cada um deles em ordem decrescente. O primeiro bloco destacado, em ciano, é um bloco de texto. O segundo conjunto de blocos destacados, em azul, são linhas de texto. Por fim, o terceiro conjunto de blocos destacados, em azul escuro, são as palavras.

Para todos os blocos, linhas, elementos e símbolos detectados, a API retorna as caixas delimitadoras, os cantos, as informações de rotação, a pontuação de confiança, os idiomas e o texto reconhecidos.

Resultados de exemplo


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconhecido
Texto Wege
der parlamentarischen
Demokratie
Bloqueios (1 bloco)
Bloco 0
Texto Demoge der parlamentarischen Demokratie
Quadro (296.665 - 796.882)
Pontos de canto (296, 719), (778, 665), (796, 828), (314, 882)
Código de idioma reconhecido de
linhas; (3 linhas)
Linha 0
Texto Wege der
Quadro (434, 678 a 670, 749)
Pontos de canto (434, 705), (665, 678), (670, 722), (439, 749)
Código de idioma reconhecido de
Pontuação de confiança 0,8766741
Grau de rotação -6,6116457
Elementos (2 elementos)
Elemento 0
Texto Geja
Quadro (434, 689 a 575.749)
Pontos de canto (434, 705), (570, 689), (575, 733), (439, 749)
Código de idioma reconhecido de
Pontuação de confiança 0,8964844
Grau de rotação -6,6116457
Elementos (4 elementos)
Símbolo
Texto W
Quadro (434, 698 a 500.749)
Pontos de canto (434, 706), (495, 698), (500, 741), (439, 749)
Pontuação de confiança 0,87109375
Grau de rotação -6,611646