Dagotraduzione dal Washington Post
«La mia voce come la conoscevo mi è stata portata via. Le persone intorno a me fanno fatica a capirmi quando parlo», ha detto una voce, immediatamente riconoscibile come quella dell'attore Val Kilmer, in un video condiviso su YouTube la scorsa settimana.
L'attore di Hollywood ha perso la sua voce naturale dopo un intervento chirurgico per cancro alla gola nel 2015, che ha sconvolto la sua carriera e alterato permanentemente il suo modo di comunicare. Almeno fino alla fine dello scorso anno, quando Sonantic, una società di software con sede nel Regno Unito che clona voci per attori e studi, ha aiutato Kilmer a parlare di nuovo.
Anche le voci artificiali più diffuse basate su persone reali, come Siri di Apple e Alexa di Amazon, suonano false. Ma un'ondata di start-up sta implementando servizi di clonazione vocale intelligenti per assistenti digitali, videogiochi e studi cinematografici.
Le voci generate sono diventate più realistiche nell'era dei deepfake, una tecnologia che utilizza l'intelligenza artificiale per manipolare i contenuti in modo che appaiano e suonino ingannevolmente reali. Questi media sono così buoni che a volte è difficile distinguere tra le voci umane e le loro controparti sintetiche.
Cinque anni dopo l'intervento di Kilmer, i suoi rappresentanti hanno contattato Sonantic per ripristinare digitalmente la sua voce perduta. «Quindi è quello che abbiamo fatto», ha raccontato Zeena Qureshi, CEO e co-fondatore di Sonantic. «Il team di Val voleva restituirgli la sua voce in modo che potesse continuare a creare».
Il progetto è iniziato nel dicembre 2020 dopo che Kilmer ha terminato le riprese di "Val", un documentario sulla sua carriera a Hollywood e sulla battaglia contro il cancro. La tecnologia AI di Sonantic non è stata inclusa nel film. Tuttavia, l'azienda ha pubblicato una clip su YouTube che ha più di 18.000 visualizzazioni.
Il progetto di Kilmer arriva un mese dopo che il documentarista Morgan Neville ha rivelato di aver utilizzato un software di clonazione vocale non identificato per imitare il defunto chef Anthony Bourdain nel film commerciale "Road Runner".
Sonantic non ha rivelato altri attori con cui sta lavorando. La società lavora principalmente con marchi di giochi, come Obsidian Entertainment e Remedy Games di Xbox Game Studios, e spesso concede in licenza il suo servizio di voce sintetica agli studi, consentendo loro di modificare e dirigere voci artificiali in modo simile a come i registi possono influenzare gli attori.
«Ci piace pensarlo come un Photoshop della voce, dove puoi entrare e ritoccare piccole aree», ha affermato John Flynn, chief technology officer dell'azienda.
angelina jolie colin farrell val kilmer alexander
Gli ingegneri dell'azienda in genere richiedono tre ore di audio per ricreare una voce in 24 ore. Ma a causa delle restrizioni sulle licenze dei film, Sonantic ha dovuto ricreare la voce di Kilmer con meno di 30 minuti di audio.
La società afferma che gli ingegneri hanno estratto campioni da vecchi filmati e li hanno "puliti" per eliminare il rumore di fondo. Hanno creato uno script basato sul materiale, hanno collegato l'audio e il testo insieme in "brevi blocchi" e hanno eseguito i dati attraverso gli algoritmi del "motore vocale", che imparano a parlare ascoltando le registrazioni, ha affermato Flynn.
meg ryan val kilmer in the doors
Il motore vocale comprende il significato dalle parole scritte e può utilizzare questi segnali per «illustrare rabbia intensa e dolore emotivo», secondo una dichiarazione. Ad aprile, Sonantic ha mostrato come il servizio audio può ricreare coppie in preda a un'accesa discussione. In quella demo, due voci hanno una conversazione normale che si trasforma rapidamente in una litigata urlante. Nella vita reale, questo scenario potrebbe preservare le «corde vocali degli attori» e consentirebbe loro di «guadagnare entrate passive», ha affermato la società in un comunicato.
val kilmer nicole kidman batman forever
L'azienda afferma di aver creato 40 versioni della voce di Kilmer e di aver selezionato l'opzione di qualità più elevata per catturare al meglio l'espressione dell'attore. Il risultato è un programma di sintesi vocale basato su desktop che, secondo Sonatic, può imitare i livelli di proiezione e le emozioni di Kilmer.
Il software vocale può leggere le righe di testo ad alta voce, presumibilmente catturando le precedenti sottigliezze di Kilmer nel discorso, nell'espressione e nel tono. Kilmer, amato per il suo ruolo di Iceman in "Top Gun", è libero di usare la tecnologia come vuole, dice Sonantic.
«È esclusivamente il suo modello. Potrebbe usarlo per uso personale o professionale, se lo desidera», ha detto Qureshi.
Ma la tecnologia suscita anche preoccupazioni legali, etiche ed economiche, in particolare tra i doppiatori preoccupati per il prosciugamento del loro sostentamento.
La tecnologia deepfake è stata utilizzata per realizzare video di politici come Donald Trump e Barack Obama, mettendo in luce i pericoli di una tecnologia progettata per far sembrare che le persone dicano cose che non hanno mai detto.
«Quando sono un attore, posso decidere se supportare il contenuto», ha detto Jay Britton, un doppiatore che interpreta personaggi animati in "Go! Andare! Cory Carson ” e una lunga lista di videogiochi. «Sarebbe una cosa devastante che la tua voce sia là fuori a dire cose che potresti non necessariamente supportare».
Non ci sono leggi negli Stati Uniti che vietano alle aziende di generare voci sintetiche.