L’intelligenza artificiale in Cina potrebbe non fermarsi alle news dei Tg: presto avremo gli avatar di due importanti autori cinesi che leggeranno audiolibri.

Il motore di ricerca cinese Sogou aveva fatto molto scalpore quando aveva annunciato che avrebbe utilizzato Yanni, un avatar creato con l’AI, come conduttore del Tg dell’agenzia di stampa Xinhua.
Ma la società cinese non ha intenzione di fermarsi qui dato che ha creato due nuovi avatar estremamente realistici che verranno utilizzati come narratori di audiolibri.
I due autori “clonati” grazie all’intelligenza artificiale sono Yue Guan e Bu Xin Tian Shang Diao Xian Bing. Il sistema di AI, come riporta la BBC, ha elaborato i due avatar lavorando sulla tecnologia di sintesi vocale e sui videoclip delle conferenze tenute dai due autori cinesi a China Online Literature+.
La nuova frontiera della produzione audio?
Anche se al momento gli utenti preferiscono gli audiolibri letti da attori e speaker professionisti, i nuovi avatar creati da Sogou potrebbero aprire a nuovi scenari.
Combinando la sintesi vocale con lo studio dei video e delle voci di altri attori e spekaer, infatti, l’intelligenza artificiale potrebbe creare voci non solo naturali, ma in tutto e per tutto somiglianti a quelle di personaggi famosi.
Sicuramente c’è ancora molto da lavorare dato che Yanny, l’avatar che attualmente legge le news su Xinhua non riesce ancora ad essere perfettamente realistico e, guardandolo, si capisce subito di essere di fronte a un prodotto dell’AI.
Certo, lavorare solo sulla voce permette di ridurre le complessità e quindi potrebbe essere più semplice arrivare ad un risultato realistico.
È molto probabile, anzi è sicuro, che anche Amazon e gli altri big player de digitale stiano lavorando a progetti del genere per sfruttare al meglio le potenzialità dei loro assistenti vocali che, molto presto, potrebbero diventare vere e proprie interfacce relazionali e non semplici bot vocali…
Un nuova forma di copyright da tutelare?
Molto probabilmente fra qualche anno nascerà a un nuovo tipo di diritto di sfruttamento e relativo copyright, un po’ come sta già successo nel cinema con l’utilizzo dell’immagine di attori deceduti grazie all’AI, ovvero il diritto di utilizzo e di riproduzione attraverso l’intelligenza artificiale di una specifica voce.
Il vantaggio, da un punto di vista della produzione, sarebbe enorme perché in questo modo si potrebbero pubblicare audiolibri ad una velocità attualmente impensabile.
In uno scenario del genere gli speaker e gli attori affermati si potrebbero limitare a cedere il diritto relativo alla loro voce senza doverla effettivamente usare, ma sicuramente le varie forme di AI riuscirebbero a trovare un nuovo tipo di voce perfetto per ogni utente, di fatto creando addirittura l’audiolibro su misura per ogni singolo utente.
Stiamo correndo un po’ troppo con la fantasia e non ci siamo accorti di essere finiti dentro a Matrix? Forse…