E se i podcaster potessero premere un interruttore e parlare istantaneamente in un’altra lingua?
Questa è la premessa alla base della nuova funzione di traduzione vocale alimentata dall’intelligenza artificiale di Spotify, che riproduce i podcast in altre lingue utilizzando la voce del podcaster stesso.
Uno strumento di traduzione avanzata
L’azienda di Spotify, il colosso svedese dello streaming audio, ha stretto una partnership con una manciata di podcaster per tradurre i loro episodi dall’inglese in spagnolo con un nuovo strumento, chiamato Whisper di OpenAI. Ovviamente non si vuole fermare allo spagnolo, quindi ha in programma di lanciare anche le traduzioni in francese e tedesco nelle prossime settimane.
E chissà, presto si spingerà anche oltre i confini delle lingue inglesi ed europee.
I podcaster inclusi nel progetto di Spotify
Il gruppo iniziale di episodi sarà composto da alcuni grandi nomi del podcasting occidentale, tra cui Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons e Steven Bartlett.
Questi sono tutti podcaster di successo che hanno scelto di concentrarsi su argomenti diversi. Dax Shepard intervista celebrità, Monica Padman intervista imprenditori, Lex Fridman intervista scienziati e filosofi, Bill Simmons parla di basket e cultura pop, e Steven Bartlett intervista imprenditori. Tutti e cinque sono noti per le loro interviste approfondite e interessanti, e hanno contribuito a rendere i podcast uno dei formati di intrattenimento più popolari al mondo.
Le potenzialità di Whisper di OpenAI
La spina dorsale della funzione di traduzione è lo strumento di trascrizione vocale Whisper di OpenAI, che può sia trascrivere il parlato inglese, che tradurre altre lingue, sempre in inglese.
Ma lo strumento di Spotify va oltre la traduzione speech-to-text – una possibilità ormai applicata che la tecnologia e il progresso conoscono già da tempo – : la funzione traduce un podcast in una lingua diversa e lo riproduce in una versione sintetizzata della voce del podcaster stesso.
“Grazie alla corrispondenza con la voce del creatore, Voice Translation offre agli ascoltatori di tutto il mondo la possibilità di scoprire e lasciarsi ispirare da nuovi podcaster in un modo più autentico che mai“, ha dichiarato in un comunicato Ziad Sultan, vicepresidente di Spotify per la personalizzazione.
C’è sempre lo zampino di OpenAI
È probabile che dietro la replica vocale di questa nuova funzione ci sia la stessa OpenAI.
L’azienda di intelligenza artificiale ha fatto alcuni annunci questa mattina, tra cui il lancio di uno strumento in grado di creare “un audio simile a quello umano partendo da un testo e da pochi secondi di parlato campione”.
Tuttavia, al riguardo OpenAI afferma che sta intenzionalmente limitando la diffusione di questo strumento per motivi di sicurezza e privacy.
Saranno necessari i debiti permessi
Questo è probabilmente uno dei motivi per cui Spotify afferma che la tecnologia di traduzione viene testata solo con un “gruppo selezionato” di podcaster. Proprio perché ci si aspetta che ci vogliano i permessi ufficiali delle voci stesse, affinché queste possano essere “automatizzate” anche in altre lingue.
L’azienda, ad oggi, non ha precisato in che misura intende rendere disponibile lo strumento o quando prevederne l’espansione. Tuttavia, questo è ciò che possiamo aspettarci in uno dei prossimi aggiornamenti, insieme al dibattito che questi stessi scateneranno.