A API ML Kit Text Recognition v2 reconhece texto em qualquer conjunto de caracteres chineses, devanágari, japoneses, coreanos e latinos. A API também pode ser usada para automatizar tarefas de entrada de dados, como processamento de cartões de crédito, recibos e cartões de visita.
Principais recursos
- Reconhecer texto em vários scripts e idiomas é compatível com o reconhecimento de texto em scripts em chinês, devanágari, japonês, coreano e latino
- Analisar a estrutura do texto: oferece suporte à detecção de símbolos, elementos, linhas e parágrafos
- Identificar idioma do texto Identifica o idioma do texto reconhecido.
- Reconhecimento em tempo real pode reconhecer texto em tempo real em uma grande variedade de dispositivos
Estrutura do texto
O reconhecedor de texto segmenta o texto em blocos, linhas, elementos e símbolos. Em termos gerais:
um bloco é um conjunto contíguo de linhas de texto, como um parágrafo ou uma coluna,
uma linha é um conjunto contíguo de palavras no mesmo eixo; e
Um elemento é um conjunto contíguo de caracteres alfanuméricos ("palavra") no mesmo eixo na maioria dos idiomas latinos, ou uma palavra em outros.
Um Símbolo é um único caractere alfanumérico no mesmo eixo na maioria dos idiomas latinos ou um caractere em outros.
A imagem abaixo destaca exemplos de cada um deles em ordem decrescente. O primeiro bloco destacado, em ciano, é um bloco de texto. O segundo conjunto de blocos destacados, em azul, são linhas de texto. Por fim, o terceiro conjunto de blocos destacados, em azul-escuro, são Words.
Para todos os blocos, linhas, elementos e símbolos detectados, a API retorna as caixas delimitadoras, pontos de canto, informações de rotação, pontuação de confiança, idiomas reconhecidos e texto reconhecido.
Resultados de exemplo

Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconhecido | |
---|---|
Texto | Wege der parlamentarischen Demokratie |
Bloqueios | (1 bloco) |
Bloco 0 | |
---|---|
Texto | Wege der parlamentarischen Demokratie |
Quadro | (296.665 a 796.882) |
Pontos de canto | (296, 719), (778, 665), (796, 828), (314, 882) |
Código de idioma reconhecido | de |
linhas; | (3 linhas) |
Linha 0 | |
---|---|
Texto | Wege der |
Quadro | (434.678 a 670.749) |
Pontos de canto | (434, 705), (665, 678), (670, 722), (439, 749) |
Código de idioma reconhecido | de |
Pontuação de confiança | 0,8766741 |
Grau de rotação | -6,6116457 |
Elementos | (2 elementos) |
Elemento 0 | |
---|---|
Texto | Wege |
Quadro | (434.689-575.749) |
Pontos de canto | (434, 705), (570, 689), (575, 733), (439, 749) |
Código de idioma reconhecido | de |
Pontuação de confiança | 0,8964844 |
Grau de rotação | -6,6116457 |
Elementos | (4 elementos) |
Símbolo 0 | |
---|---|
Texto | Qua |
Quadro | (434.698 a 500.749) |
Pontos de canto | (434, 706), (495, 698), (500, 741), (439, 749) |
Pontuação de confiança | 0,87109375 |
Grau de rotação | -6,611646 |