Jaime D’Alessandro per “la Repubblica”
Li vedi sulle gradinate davanti al portone di scuola: telefono vicino alla bocca tenuto per orizzontale mentre chiedono all' assistente virtuale di trovare sul Web o su YouTube un' informazione o un video. Oppure mentre inviano l' ennesimo messaggio vocale accompagnato dal tormentone del momento che spopola sul social Tik Tok.
E già intuisci che il tramonto della parola scritta, almeno nel mondo della tecnologia, si avvicina. Sono più di un miliardo i dispositivi nel mondo attraverso i quali Alexa di Amazon, Siri di Apple, Cortana di Microsoft o l' Assistente di Google ci parlano. Solo di altoparlanti smart, Echo di Amazon in testa che ha la quota di mercato più ampia, nel 2018 ne sono stati venduti 86 milioni ed entro la fine del prossimo anno dovrebbero salire a 225 milioni quelli attivi.
UN FENOMENO VIRALE
«Nel 2020 la metà delle ricerche online verrà fatto attraverso la voce», aveva azzardato Andrew Ng, quando ancora dirigeva la ricerca e lo sviluppo per il colosso cinese Baidu.
Professore della Stanford University, è un nome di peso in fatto di intelligenza artificiale (Ai) e per un anno è anche stato a capo del Google Brain Deep Learning Project.
In realtà i numeri sono probabilmente più bassi: Gartner sostiene che si arriverà a circa il 30 per cento in media. Ma già oggi il 39,3 per cento di chi è nato dopo il 2000 usa per lo più la voce per interagire con tablet e smartphone e sono cifre in costante crescita.
Dialoghiamo sempre più con gli apparecchi che abbiamo a casa: dal telecomando del decoder alla console, dal sistema digitale della nostra macchina alla televisione. Con 91 milioni di video online che riguardano le varie incarnazioni di Alexa, i 140 milioni su Siri e i 64 milioni sul collega di Google, quello degli assistenti è anche un fenomeno virale.
«Le reti neurali sintetiche, che son dietro l' intelligenza artificiale di oggi, si stanno diffondendo in maniera capillare » , racconta James Barrat, di passaggio a Roma alla presentazione della prossima Maker Faire, Documentarista e saggista, è autore di La nostra invenzione finale appena pubblicato da Nutrimenti con alcuni aggiornamenti visto che negli Usa è uscito cinque anni fa.
«Nel giro di cinque anni gli assistenti avranno fatto tanti di quei passi avanti da essere irriconoscibili. Pensi solo alle possibilità come principale interfaccia per una popolazione sempre più anziana e che fa fatica a leggere. L' Alexa di domani avrà anche una memoria a differenza di quella di oggi e ricorderà molto di quel che facciamo. Il potenziale insomma è enorme, così come i rischi di concentrazione».
LA TUTELA DEI DATI
Sono solo nove le grandi compagnie che hanno in mano le tecnologie più avanzate e i sospetti di violazione della privacy di questi dispositivi, il fatto che ascolterebbero 24 ore su 24 quel che avviene in casa nostra, li hanno avanzati da più parti. Ma prima di virare verso le possibili distopie, meglio parlare dei tanti limiti attuali. Se provate a fare due domande conseguenziali sullo stesso tema, sono diversi gli assistenti che incespicano. Fanno eccezione le informazioni su un monumento a patto che ci si limiti a dati e date.
Q - ASSISTENTE VOCALE SENZA SESSO
Le Ai sui televisori e i decoder si limitano a rispondere su palinsesto e catalogo, ad alzare il volume o cambiare canale, dunque ricevano richieste che sono circoscritte e in genere falliscono meno. Perché alla fine il problema per le macchine è il riuscire a capire di cosa si parla, dunque il contesto. Indirizzi e percorsi, previsioni del tempo, appuntamenti segnati in agenda, informazioni sul traffico, ultime notizie, stazioni radio, sono semplici.
INTOPPI CON LA PLAYLIST
Ma già quando chiedete una certa canzone in una determinata playlist di un servizio streaming collegato allo smartphone o all' altoparlante smart potreste incontrare qualche intoppo. Ci si riduce quindi ad un generico « fammi ascoltare della musica classica o dell' hip-hop».
Più è specifico l' ambito di utilizzo, meglio si comportano le Ai: è più semplice reperire le informazioni sul Web; non devono passare da un soggetto all' altro, cosa che le reti neurali non sanno fare. Ognuna è specializzata su un singolo aspetto, non hanno ancora la capacità di apprendere come apprendiamo noi sfruttando magari l' esperienza fatta in un ambito simile.
Per riconoscere un tramonto in una fotografia, devono vedere milioni di immagini prima di avere la certezza di saperlo distinguere e quel sapere non lo sanno applicare ad un altro soggetto: devono ripartire da capo. Per questo al Facebook Ai Research (Fair) studiano come i bambini piccoli apprendono le parole nella speranza di poter replicare quel processo anche nelle macchine.
QUEL DUPLEX È UN GENIO
A maggio dello scorso anno ha fatto impressione la dimostrazione di Duplex, la versione più evoluta della Ai di Google. È capace di chiamare un barbiere o un ristorante e fare una prenotazione dialogando e rispondendo come fosse una persona in carne ed ossa, con tanto di esitazioni ed intercalare.
Per ora però è disponibile solo in 43 dei 50 Stati Usa. « La voce è la forma più naturale che esiste ed è ovvio che in futuro sarà il mezzo principale di dialogo con il digitale», spiega Behshad Behzadi, capo ingegnere nei laboratori di ricerca di Google a Zurigo.
« E non capisco i sospetti di una maggiore concentrazione di potere nelle mani di chi ha sviluppato gli assistenti virtuali.
Ogni volta che si pone una domanda, l' assistente risponde spiegando dove ha reperito l' informazione come succederebbe con una ricerca fatta da tastiera » . Behzadi, che abbiamo incontrato a Barcellona durante il Mobile World Congress, rispondeva ai dubbi di Rich Williams, a capo di Groupon: « Il 50 per cento delle persone non scaricano più nuove app. Ce ne sono troppe, è un settore che si è consolidato con poche app che hanno tutti e una moltitudine che tutti ignorano.
Cosa succederà in futuro? Che gli utenti chiederanno: "Ok Google, trovami qualcosa da fare con i miei figli questo weekend". Di sicuro non diranno: "Ok Google, vai su Groupon e trovami qualcosa da fare con i miei figli questo weekend" » . Insomma, alla fine i colossi del Web si troveranno in una posizione di ancor maggior potere con le interfacce vocali, un filtro fra servizi e possibili clienti difficile da aggirare per gli altri.
amazon echo alexa 3 apple siri 3 assistente vocale 2 google home 4 google home 2 google home 3 assistente vocale 1 amazon echo alexa 2 apple siri 2 amazon echo alexa 4