Anche Storytel scommette sull’Intelligenza Artificiale: costi ridotti del 95% e possibilità per gli utenti di cambiare voce in tempo reale durante l’ascolto. L’era degli umani sta per finire?
L’utilizzo di voci prodotte Intelligenze Artificiali è l’elefante nella stanza del mondo dell’audiolibro. Da mesi infatti gli operatori del settore ne parlano sempre con maggiore insistenza (tranne che in Italia, tanto per cambiare…).
Ora anche Storytel, così come fatto in precedenza da Apple e da Google, prende posizione e annuncia la decisione di utilizzare per le sue produzioni voci generate da AI grazie a una collaborazione con ElevenLab.
La società norvegese va contro quello che i puristi considerano un tabù, basti ricordare che Audible che in più di un’occasione si è schierata contro i cosiddetti audiolibri text to speech, letti cioè da Intelligenze Artificiali.
Non a caso Storytel ha dichiarato che continuerà a produrre audiolibri tradizionali, che la narrazione umana è l’essenza degli audiolibri e blablablabla….
Taglio dei costi del 95%
L’AI dunque affiancherà il tradizionale sistema di produzione di audiolibri, offrendo agli ascoltatori la possibilità di cambiare in tempo reale la voce che stanno ascoltando.
Per il momento l’Intelligenza Artificiale sarà utilizzata nei contenuti Originals di Storytel che rappresentano l’1% del catalogo dell’azienda norvegese. Grazie all’AI Storytel sarà in grado di tagliare i costi di produzione del 95%, cifra pazzesca che dimostra l’enorme potenzialità dei sistemi basati sull’Intelligenza Artificiale.
La nuova funzionalità si chiamerà “Voice Switcher” e permetterà agli ascoltatori di scegliere direttamente da quale voce farsi leggere un audiolibro. Gli ascoltatori preferiranno le voci umane o sceglieranno le alternative create dall’AI? Questo ovviamente è il quesito più interessante di tutta la faccenda.
Per ora la funziona Voice Switcher è in fase beta e sarà disponibile soltanto per i titoli in inglese. Entro la fine dell’anno ci saranno anche il danese e lo svedese, a seguire il servizio verrà allargato anche agli altri titoli.
L’elefante nella stanza
All’inizio di questo pezzo abbiamo parlato di elefante nella stanza, ma forse l’espressione è riduttiva. Con LA CASE Books noi utilizziamo l’AI per produrre audiolibri in multilingua dal dicembre 2021 con risultati a dir poco sorprendenti, e la qualità delle AI sta aumentando a velocità incredibile.
Proprio la settimana scorsa abbiamo ricevuto la proposta di utilizzare anche Intelligenze Artificiali che leggono in italiano (funzione ad esempio non disponibile su Google Play Store o su Apple Store) da Speechki.
Devo dire che sono rimasto sbalordito dalla qualità della lettura anche in italiano, lingua che al momento è sicuramente poco conveniente dal punto di vista del mercato, tanto da non essere presa in considerazione da Google.
Bene, se in così breve tempo anche per una lingua marginale come l’italiano si ottengono risultati del genere non vedo proprio come sia possible nel giro di qualche anno continuare ad utilizzare narratori umani.
Sta per finire l’era delle voci umane nel settore degli audiolibri?
La mia può sembrare una previsione catastrofista per i puristi, per chi annusa il profumo della carta e, soprattutto, per chi lavora con la voce, ma sono fermamente convinto che il 90% delle produzioni sarà realizzato con voci digitali molto prima di quanto si creda.
Anzi, probabilmente gli speaker leader di settore, i doppiatori più riconoscibili e gli attori più famosi a breve venderanno i diritti di utilizzo delle loro voci alle big company e lasceranno tutto il lavoro alle Intelligenze Artificiali. Loro si limiteranno a incassare le royalties.
Prevedo un massimo di 5 anni per uno scenario del genere, ma magari mi sbaglio eh…
P.S.
Ah, dimenticavo, Skynet mi ha detto che vi saluta un casino…