Reconhecimento de texto v2

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

A API ML Kit Text Recognition v2 reconhece textos em qualquer conjunto de caracteres chineses, Devanagari, japoneses, coreanos e latinos. A API também pode ser usada para automatizar tarefas de entrada de dados, como processamento de cartões de crédito, recibos e cartões de visita.

iOS Android

Principais recursos

  • Reconhecer texto em vários scripts e idiomas Suporte ao reconhecimento de texto em scripts em chinês, devanágari, japonês, coreano e latino
  • Análise da estrutura do texto: é compatível com a detecção de símbolos, elementos, linhas e parágrafos.
  • Identificar idioma do texto Identifica o idioma do texto reconhecido
  • Reconhecimento em tempo real: pode reconhecer texto em tempo real em vários dispositivos.

Estrutura do texto

O reconhecedor de texto segmenta o texto em blocos, linhas, elementos e símbolos. Cerca de:

  • um bloco é um conjunto contíguo de linhas de texto, como um parágrafo ou coluna.

  • uma linha é um conjunto contíguo de palavras no mesmo eixo; e

  • um Elemento é um conjunto contíguo de caracteres alfanuméricos ("word") no mesmo eixo na maioria das línguas latinas ou uma palavra em outros.

  • um Símbolo é um caractere alfanumérico no mesmo eixo na maioria dos idiomas latinos ou um caractere em outros

A imagem abaixo destaca exemplos de cada um deles em ordem decrescente. O primeiro bloco destacado, em ciano, é um bloco de texto. O segundo conjunto de blocos destacados, em azul, são linhas de texto. Por fim, o terceiro conjunto de blocos destacados, em azul escuro, são as palavras.

Para todos os blocos, linhas, elementos e símbolos detectados, a API retorna as caixas delimitadoras, os cantos, as informações de rotação, a pontuação de confiança, os idiomas e o texto reconhecidos.

Resultados de exemplo


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconhecido
Texto Wege
der parlamentarischen
Demokratie
Bloqueios (1 bloco)
Bloco 0
Texto Demoge der parlamentarischen Demokratie
Quadro (296.665 - 796.882)
Pontos de canto (296, 719), (778, 665), (796, 828), (314, 882)
Código de idioma reconhecido de
linhas; (3 linhas)
Linha 0
Texto Wege der
Quadro (434, 678 a 670, 749)
Pontos de canto (434, 705), (665, 678), (670, 722), (439, 749)
Código de idioma reconhecido de
Pontuação de confiança 0,8766741
Grau de rotação -6,6116457
Elementos (2 elementos)
Elemento 0
Texto Geja
Quadro (434, 689 a 575.749)
Pontos de canto (434, 705), (570, 689), (575, 733), (439, 749)
Código de idioma reconhecido de
Pontuação de confiança 0,8964844
Grau de rotação -6,6116457
Elementos (4 elementos)
Símbolo
Texto W
Quadro (434, 698 a 500.749)
Pontos de canto (434, 706), (495, 698), (500, 741), (439, 749)
Pontuação de confiança 0,87109375
Grau de rotação -6,611646