Reconocimiento de texto v2

La API de reconocimiento de texto de la versión 2 del Kit de AA puede reconocer texto en cualquier grupo de caracteres de chino, devanagari, japonés, coreano y latino. La API también se puede usar para automatizar tareas de entrada de datos, como procesar tarjetas de crédito, recibos y tarjetas de presentación.

iOS Android

Funciones clave

  • Reconoce texto en varios idiomas y alfabetos. Compatibilidad con el reconocimiento de texto en chino, coreano, devanagari, japonés y latino.
  • Analiza la estructura del texto. Admite la detección de símbolos, elementos, líneas y párrafos.
  • Identificar el idioma del texto Identifica el idioma del texto reconocido.
  • Reconocimiento en tiempo real: Puede reconocer texto en tiempo real en una amplia variedad de dispositivos.

Estructura del texto

El Identificador de texto segmenta el texto en bloques, líneas, elementos y símbolos. En términos generales:

  • Un bloque es un conjunto contiguo de líneas de texto, como un párrafo o una columna,

  • Una línea es un conjunto de palabras contiguas en el mismo eje.

  • Un Elemento es un conjunto contiguo de caracteres alfanuméricos ("palabra") en el mismo eje en la mayoría de los idiomas latinos, o una palabra en otros

  • Un símbolo es un carácter alfanumérico en el mismo eje en la mayoría de los idiomas latinos, o un carácter en otros

En la siguiente imagen, se destacan ejemplos de cada una de ellas en orden descendente. El primer bloque destacado, en cian, es un bloque de texto. El segundo conjunto de bloques destacados, en azul, son líneas de texto. Por último, el tercer conjunto de bloques destacados, en azul oscuro, son Words.

Para todos los bloques, líneas, elementos y símbolos detectados, la API muestra los cuadros de límite, los puntos de las esquinas, la información de rotación, la puntuación de confianza, los idiomas reconocidos y el texto reconocido.

Resultados de ejemplo


Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconocido
Texto Wege
der parlamentarischen
Democracia
Bloques (1 bloque)
Bloque 0
Texto Wege der parlamentarischen Demokratie
Marco (296, 665-796, 882).
Esquinas (296, 719), (778, 665), (796, 828), (314, 882)
Código de idioma reconocido de
Líneas (3 líneas)
Línea 0
Texto Región de Wege
Marco (434, 678 - 670, 749)
Esquinas (434, 705), (665, 678), (670, 722), (439, 749)
Código de idioma reconocido de
Puntuación de confianza: 0,8766741
Grado de rotación –6.6116457
Elementos (2 elementos)
Elemento 0
Texto Wege
Marco (434, 689 - 575, 749)
Esquinas (434, 705), (570, 689), (575, 733), (439, 749)
Código de idioma reconocido de
Puntuación de confianza: 0,8964844
Grado de rotación –6.6116457
Elementos (4 elementos)
Símbolo 0
Texto M
Marco (434, 698 - 500, 749)
Esquinas (434, 706), (495, 698), (500, 741), (439, 749)
Puntuación de confianza: 0,87109375
Grado de rotación –6.611646