L'accessibilità non è solo una traduzione letterale delle funzionalità: è un intero sistema di supporto progettato per creare un'esperienza utente personalizzata. Lo scorso anno, il team per l'accessibilità di Chrome e ChromeOS ha collaborato con il team OCR di Google per fornire un'accessibilità democratica ai PDF: leggibili da screen reader, navigabili e facili da avviare.
| 12% | 60% | 1.000.000+ |
|---|---|---|
Crescita dell'utilizzo dei PDF | Copertura utenti con problemi di accessibilità | Pagine sottoposte a OCR settimanalmente |
Il problema dei PDF
Se utilizzi uno screen reader, sai che oggi oltre 360 miliardi di PDF (il 12% di tutti i PDF sul web) non sono accessibili. Sebbene l'accessibilità dei PDF sia migliorata, è ancora frustrante imbattersi in un documento necessario che non è stato elaborato correttamente per la lettura dello schermo e anche i documenti elaborati tramite OCR potrebbero non essere facili da navigare.
Il riconoscimento ottico dei caratteri (OCR) basato sul machine learning è una delle prime forme applicate di AI moderna. Tuttavia, i sistemi OCR rudimentali forniscono semplicemente una lettura diretta del testo sullo schermo, senza architettura delle informazioni, metainformazioni e indizi contestuali. Nel complesso, questa soluzione offre una UX scadente anche quando l'OCR è supportato.
Esistono sistemi progettati per livelli più elevati di accessibilità dei PDF, ma la maggior parte sono servizi a pagamento e/o esternalizzati. Devi trasferire il documento a un'altra app per leggerlo, creando attrito. Per gli utenti di tecnologie assistive, la funzionalità OCR ML interna al lettore PDF predefinito rende l'esperienza meno diversa. Per creare un'esperienza davvero accessibile, la funzionalità deve essere sempre disponibile e senza costi.
Sviluppare un sistema veramente accessibile
Per offrire la migliore esperienza utente, il team di accessibilità di Chrome e ChromeOS voleva utilizzare i dati OCR ML non elaborati per creare un framework navigabile dagli utenti con problemi di vista o non vedenti, non solo visualizzando le informazioni sullo schermo, ma generando automaticamente la navigazione e i punti di riferimento.
Elaborando i dati, il team per l'accessibilità è stato in grado di creare alberi di navigazione e punti di riferimento come i numeri di pagina al volo. In questo modo, non solo è stato possibile leggere i PDF, ma anche semplificare la procedura di lettura.
Elaborazione su qualsiasi hardware e dispositivo
Tuttavia, il processo di OCR basato sull'ML comporta un costo di calcolo piuttosto elevato. Il team doveva fornire l'OCR e il post-elaborazione dell'OCR con un costo computazionale elevato su molte piattaforme e architetture hardware diverse, in modo che gli utenti potessero utilizzare facilmente le funzionalità sul proprio dispositivo senza una connessione a internet attiva e senza problemi di privacy.
Per raggiungere questo obiettivo, il team ha dovuto eseguire la migrazione del codice originariamente sviluppato per essere eseguito su server Google Linux, disconnesso dall'ambiente operativo di Google, compatibile con tutte le diverse piattaforme (macOS, Windows e ChromeOS) e tutte le possibili architetture hardware.
Inoltre, il codice eseguito sui server Google presuppone un certo livello di sicurezza nel suo ambiente, ma quando viene eseguito sui computer degli utenti, questo non può essere dato per scontato. Di conseguenza, il team doveva anche rendere il codice sufficientemente sicuro da impedire a un agente dannoso di utilizzarlo per compromettere Chrome o il computer dell'utente.
Poiché la funzionalità non era necessaria a tutti gli utenti, il team non l'ha resa una parte essenziale di Chrome. Il team ha invece scelto di fornire la funzionalità on demand in base alla configurazione hardware e software dell'utente sul suo dispositivo.
Accessibilità multipiattaforma più ampia su ChromeOS
L'accessibilità non è mai completa, ma è in uno stato di miglioramento continuo. In futuro, il team per l'accessibilità spera di migliorare il bounding, l'esperienza utente e la fedeltà, nonché di estendere l'accessibilità dei PDF a tutti gli utenti del browser Chrome su ogni piattaforma e di aggiungere l'OCR ad altri dispositivi Chrome che potrebbero trarne vantaggio.
Da quando è stato rilasciato l'OCR basato sul machine learning per i PDF, il team ha ampliato il supporto OCR a 77 lingue e 7 script aggiuntivi: arabo, bengalese, cirillico, devanagari, cinese, giapponese e coreano. Ora gli utenti possono riassumere i documenti scansionati nella modalità Lettura di Chrome tramite l'OCR per chi desidera una visualizzazione più mirata e accessibile del testo che legge sul web.
Inoltre, per la prima volta in assoluto, gli screen reader potranno leggere i PDF su Chromebook nell'app nativa Media / Galleria. Il team per l'accessibilità ha integrato l'OCR in questa app nativa in modo che gli utenti possano leggere i PDF offline o senza dover usare il browser, sbloccando miliardi di PDF inaccessibili che ora possono essere aperti direttamente su Chromebook.