Accesibilidad a archivos PDF sin problemas con AA y OCR

La accesibilidad es más que una traducción directa de las funciones: es todo un sistema de asistencia diseñado para crear una experiencia del usuario personalizada. El año pasado, el equipo de accesibilidad de Chrome y ChromeOS se asoció con el equipo de OCR de Google para democratizar la accesibilidad a los archivos PDF: legibles con lectores de pantalla, navegables y fáciles de iniciar.

12% 60% Más de 1 millón

Aumento del uso de PDF

Alcance de usuarios de accesibilidad

Páginas con OCR por semana

El problema de los PDFs

Si usas un lector de pantalla, sabrás que, actualmente, más de 360,000 millones de archivos PDF (el 12% de todos los PDFs en la Web) no son accesibles. Si bien la accesibilidad de los archivos PDF ha mejorado, sigue siendo frustrante encontrar un documento necesario que no se haya procesado correctamente para la lectura de pantalla, y es posible que incluso los documentos que se procesan a través del OCR no sean fáciles de navegar.

El reconocimiento óptico de caracteres basado en aprendizaje automático (OCR basado en AA) es una de las primeras formas aplicadas de la IA moderna. Sin embargo, los sistemas de OCR rudimentarios simplemente proporcionan una lectura directa del texto en la pantalla, sin arquitectura de información, metainformación ni pistas contextuales. En general, esto proporciona una UX deficiente, incluso cuando se admite el OCR.

Si bien existen sistemas diseñados para lograr mayores niveles de accesibilidad de PDF, la mayoría son servicios externos o pagos, por lo que debes transferir el documento a otra app para leerlo, lo que genera fricción. Para los usuarios de tecnología de accesibilidad, tener la función interna de OCR basada en AA en el lector de PDF predeterminado hace que la experiencia sea menos diferente. Para crear una experiencia verdaderamente accesible, la funcionalidad siempre debe estar disponible y ser gratuita.

Desarrollar un sistema verdaderamente accesible

Para ofrecer la mejor UX, el equipo de accesibilidad de Chrome y ChromeOS quería usar datos sin procesar del OCR basado en AA para crear un framework navegable para los usuarios con visión reducida o nula, no solo mostrar la información en la pantalla, sino también generar automáticamente la navegación y los puntos de referencia.

Con el procesamiento posterior de los datos, el equipo de Accesibilidad pudo crear árboles de navegación y puntos de referencia, como números de página, sobre la marcha. De esta manera, no solo se podían leer los archivos PDF, sino que el proceso de lectura se facilitó.

Procesamiento en cualquier hardware y dispositivo

Sin embargo, el proceso de OCR basado en AA tiene un costo de procesamiento bastante alto. El equipo tuvo que proporcionar un OCR y un procesamiento posterior al OCR que requieren muchos recursos de procesamiento en diversas plataformas y arquitecturas de hardware para que los usuarios pudieran usar las funciones fácilmente en sus propios dispositivos sin una conexión a Internet activa y sin preocupaciones por la privacidad.

Para lograrlo, el equipo tuvo que migrar el código desarrollado originalmente para ejecutarse en servidores de Google Linux, desconectado del entorno operativo de Google, compatible con todas las plataformas diferentes (macOS, Windows y ChromeOS) y todas las arquitecturas de hardware posibles.

Además, el código que se ejecuta en los servidores de Google supone un cierto nivel de seguridad en su entorno, pero cuando el código se ejecuta en las computadoras de los usuarios, esto no se puede suponer. Por lo tanto, el equipo también necesitaba que su código fuera lo suficientemente seguro como para que un agente malicioso no pudiera usarlo para comprometer Chrome o la computadora del usuario.

Como no todos los usuarios necesitaban la función, el equipo no la convirtió en una parte esencial de Chrome. En cambio, el equipo decidió entregar la función on demand según la configuración de hardware y software del usuario en su dispositivo.

Mayor accesibilidad multiplataforma en ChromeOS

La accesibilidad nunca está completa, sino que se encuentra en un estado de mejora continua. De cara al futuro, el equipo de Accesibilidad espera mejorar el encuadre, la UX y la fidelidad, además de ampliar la accesibilidad de los archivos PDF a todos los usuarios del navegador Chrome en todas las plataformas y agregar OCR a otros dispositivos Chrome que puedan beneficiarse.

Desde el lanzamiento del OCR basado en AA para archivos PDF, el equipo amplió la compatibilidad del OCR a 77 idiomas y siete escrituras adicionales: árabe, bengalí, cirílico, devanagari, chino, japonés y coreano. Ahora, los usuarios pueden obtener un resumen de los documentos escaneados en el modo de lectura de Chrome a través del OCR para quienes deseen una vista más enfocada y accesible del texto que leen en la Web.

Además, por primera vez, los lectores de pantalla podrán leer archivos PDF en la app nativa de Galería multimedia de Chromebook. El equipo de accesibilidad integró el OCR en esta app nativa para que los usuarios puedan leer archivos PDF sin conexión o sin necesidad de usar el navegador, lo que desbloquea miles de millones de archivos PDF inaccesibles a los que ahora se puede acceder directamente en tu Chromebook.