La maggior parte delle persone associa l'Americans with Disabilities Act a modifiche fisiche e infrastrutturali che devono essere apportate a edifici o altri luoghi, ma poiché la definizione di disabilità si sta ampliando, le persone si stanno rendendo conto che "accessibile" si applica anche a cose come i siti Web e il riconoscimento vocale.
In questo caso, il gigante della tecnologia Google si sta impegnando per migliorare il suo software di riconoscimento vocale con Project Euphonia. Project Euphonia è un'iniziativa per registrare campioni vocali di volontari e analizzarli in modo che le persone con SLA, disturbi neurologici e altre difficoltà del linguaggio possano utilizzare i loro dispositivi intelligenti con la facilità di un individuo "tipico".
Perché mi sono offerto volontario
Una corda vocale sinistra paralizzata e una lingua asimmetrica a causa di un tumore al cervello hanno provocato il mio disturbo del linguaggio Disartria. Il mio modo di parlare confuso e la mia voce debole rendono difficile per amici e parenti capirmi o ascoltarmi, soprattutto in uno spazio affollato. Questo mi ha reso un ottimo candidato per il Progetto Euphonia, quindi mi sono offerto volontario non appena l'ho letto. Registrando campioni su un sito Web rudimentale, ho ripetuto 4.500 frasi da "Come raggiungo Mountain View, California?" a "Riproduci brani di Cardi B".
Oltre a soddisfare i criteri del Progetto Euphonia, mi sono offerto volontario perché mi è stato presentato per la prima volta il principale programma di riconoscimento vocale Dragon Naturally Speaking nel 1997 e ha fallito in modo spettacolare. Nel corso degli anni, ho provato programmi analoghi presso l'Assistive Technology Lab del Boston's Children's Hospital e versioni aggiornate di Drago, e sebbene questo software abbia fatto passi da gigante, fa ancora fatica a individuare la mia voce.
Questo è problematico per due motivi: sono uno scrittore con una mancanza di capacità motorie, quindi scrivo con una mano o lentamente con due se sono stanco. Con tre libri di poesie autopubblicati, un libro di memorie e una raccolta di storie inedite collegate al mio nome, rabbrividisco al pensiero di quanto avrei potuto produrre di più se la digitazione non fosse stata un compito fisicamente arduo.
L'altro motivo per cui il riconoscimento vocale scadente crea una barriera per me è a causa della proliferazione di prodotti abilitati alla voce nelle case e sui telefoni. Usando solo la mia storia, se potessi accedere a computer e dispositivi intelligenti nel modo in cui dovrebbero essere usati, mi darebbe più tempo libero, mi consentirebbe di svolgere completamente le attività e potenzialmente trasformerebbe il mio modo di vivere.
Progetto Euphonia: come funziona?
Allora, come funziona Euphonia? Dopo aver scaricato un'app prototipo con un modello di riconoscimento vocale personalizzato sul mio telefono, ho posizionato il telefono accanto al mio laptop e ho dettato; mentre lo facevo, ho visto tutto ciò che ho detto apparire nel mio Google Doc sul mio laptop. L'ho fatto per alcuni mesi, registrando frasi da un romanzo che stavo scrivendo, e corretto eventuali imprecisioni per Google utilizzando l'app.
Dopo diversi mesi senza registrare frasi, ho finito la prima bozza di un romanzo - 20.000 parole - usando l'app. Questo non vuol dire che sia impeccabile; per ogni ora che scrivo, devo tornare indietro e passare un'ora a fare piccole correzioni. Ma non mi dispiace perché Euphonia è in una fase beta e invece di scrivere lentamente 100 parole al giorno, sto generando 500 parole al giorno.
Poi c'è il fatto che Euphonia non è stato progettato per l'elaborazione di testi - è più per comandi dichiarativi - e il mio stile di scrittura è quello che chiamano un "pantalone" (vola vicino alla sede dei tuoi pantaloni), quindi ho molte pause perché non so come finirà una frase, sai, come Michael Scott. Tuttavia, quando so cosa voglio dire, come messaggi di testo, e-mail o istruzioni al mio assistente, è di gran lunga il riconoscimento vocale più preciso che abbia mai usato.
Quando istituzioni come Google danno voce ai disabili nel progettare l'architettura del futuro, lasciandoli rimanere se stessi invece di cercare di convertirli in qualcosa di "normale", mi fa sperare che nell'era dell'IA prevarrà l'umanesimo.
Se desideri visitare il sito web del Progetto Euphonia, o hai un problema di linguaggio e vuoi contribuire con un campione vocale, puoi andare a questo link: https://sites.research.google/euphonia/about/