La API de reconocimiento de texto de la versión 2 del Kit de AA puede reconocer texto en cualquier grupo de caracteres de chino, devanagari, japonés, coreano y latino. La API también se puede usar para automatizar tareas de entrada de datos, como procesar tarjetas de crédito, recibos y tarjetas de presentación.
Funciones clave
- Reconoce texto en varios idiomas y alfabetos. Compatibilidad con el reconocimiento de texto en chino, coreano, devanagari, japonés y latino.
- Analiza la estructura del texto. Admite la detección de símbolos, elementos, líneas y párrafos.
- Identificar el idioma del texto Identifica el idioma del texto reconocido.
- Reconocimiento en tiempo real: Puede reconocer texto en tiempo real en una amplia variedad de dispositivos.
Estructura del texto
El Identificador de texto segmenta el texto en bloques, líneas, elementos y símbolos. En términos generales:
Un bloque es un conjunto contiguo de líneas de texto, como un párrafo o una columna,
Una línea es un conjunto de palabras contiguas en el mismo eje.
Un Elemento es un conjunto contiguo de caracteres alfanuméricos ("palabra") en el mismo eje en la mayoría de los idiomas latinos, o una palabra en otros
Un símbolo es un carácter alfanumérico en el mismo eje en la mayoría de los idiomas latinos, o un carácter en otros
En la siguiente imagen, se destacan ejemplos de cada una de ellas en orden descendente. El primer bloque destacado, en cian, es un bloque de texto. El segundo conjunto de bloques destacados, en azul, son líneas de texto. Por último, el tercer conjunto de bloques destacados, en azul oscuro, son Words.
Para todos los bloques, líneas, elementos y símbolos detectados, la API muestra los cuadros de límite, los puntos de las esquinas, la información de rotación, la puntuación de confianza, los idiomas reconocidos y el texto reconocido.
Resultados de ejemplo

Foto: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
Texto reconocido | |
---|---|
Texto | Wege der parlamentarischen Democracia |
Bloques | (1 bloque) |
Bloque 0 | |
---|---|
Texto | Wege der parlamentarischen Demokratie |
Marco | (296, 665-796, 882). |
Esquinas | (296, 719), (778, 665), (796, 828), (314, 882) |
Código de idioma reconocido | de |
Líneas | (3 líneas) |
Línea 0 | |
---|---|
Texto | Región de Wege |
Marco | (434, 678 - 670, 749) |
Esquinas | (434, 705), (665, 678), (670, 722), (439, 749) |
Código de idioma reconocido | de |
Puntuación de confianza: | 0,8766741 |
Grado de rotación | –6.6116457 |
Elementos | (2 elementos) |
Elemento 0 | |
---|---|
Texto | Wege |
Marco | (434, 689 - 575, 749) |
Esquinas | (434, 705), (570, 689), (575, 733), (439, 749) |
Código de idioma reconocido | de |
Puntuación de confianza: | 0,8964844 |
Grado de rotación | –6.6116457 |
Elementos | (4 elementos) |
Símbolo 0 | |
---|---|
Texto | M |
Marco | (434, 698 - 500, 749) |
Esquinas | (434, 706), (495, 698), (500, 741), (439, 749) |
Puntuación de confianza: | 0,87109375 |
Grado de rotación | –6.611646 |