Augie ha da poco rilasciato Aug X, una piattaforma di creazione video alimentata dall’intelligenza artificiale che incorpora una funzione di clonazione della voce per leggere i testi pubblicitari senza dover prenotare uno studio di registrazione.
In collaborazione con ElevenLabs, Aug X consente agli utenti di registrare la propria voce o quella di qualcun altro, e di clonarla per utilizzarla in altri brevi video.
La nuova possibilità di Augie
La piattaforma Augie, rivolta principalmente a marketer e team di social media manager, consente di aggiungere rapidamente narrazione, foto, testo e musica ai video senza dover curare l’editing audio e video nel modo tradizionale. In altre parole, quando si tratta di creare prodotti audio e video, offre la possibilità di saltare dei passaggi ricchi di possibilità, ma in genere macchinosi, che richiedono mani esperte.
Jeremy Toeman, fondatore della piattaforma, ha dichiarato che l’azienda ha voluto aggiungere una funzione di clonazione vocale dopo essersi resa conto che alcune persone non amano parlare al microfono o registrare voci fuori campo. Questo è dovuto anche al fatto che per ottenere dei montaggi di qualità serve attrezzatura di un certo livello.
“Sarete sorpresi dal numero di persone che hanno usato la nostra funzione di clonazione vocale e che ci hanno ringraziato perché non amavano registrare la narrazione“, ha dichiarato Toeman.
Come funziona la clonazione della voce su Augie
Per ottenere la voce narrante desiderata, gli utenti dovranno prima registrare un breve frammento della loro voce in cui dicono qualcosa, o selezionarne una già esistente dallo loro libreria, per poi scrivere o caricare un copione completo su Augie.
Una volta fatto questo, sarà la piattaforma a provvedere al resto: la voce, sulle orme del campione fornito, leggerà il copione per intero – quindi creerà le “parole mancanti” – con un tono che si potrà poi modellare in base alle esigenze dell’atmosfera del prodotto finale (serio, entusiasta, inquietante, ecc.).
In questo modo, Toeman immagina che i team di marketing possano realizzare brevi video senza dover prenotare il tempo di uno speaker o una speaker, né uno studio di registrazione.
Per ora c’è un libero accesso alla funzione di Aug X
Augie è entrato in beta pubblica a maggio, ciò significa che al momento tutti coloro che utilizzano Augie hanno libero accesso alla funzione di clonazione vocale.
Tuttavia, Toeman dice che tra qualche tempo potrebbe limitare la lunghezza e la qualità dei video e il numero di voci clonate degli abbonati non paganti, a causa dei costi di gestione per Augie dei server di clonazione vocale.
Per completare i video, inoltre, gli utenti possono anche scegliere da una libreria di foto che la piattaforma mette già a disposizione – Aug X prende in licenza le foto da Getty – oppure scegliere di utilizzare immagini generate anch’esse dall’intelligenza artificiale.
Le preoccupazioni circa la clonazione di materiale
La clonazione vocale non è una novità, ad esempio Samsung consente agli utenti persino di utilizzare una voce Ai per rispondere alle chiamate, qualora volessero.
Ma ora che aziende come Aug X stanno integrando la tecnologia in servizi più completi, atti alla produzione vera e propria di materiale, più che all’interazione, il livello di ramificazione dell’AI in certi settori sta aumentando. Da un lato c’è un grande entusiasmo da parte di alcuni circa le grandiosi possibilità dello strumento, dall’altro questo non smette di suscitare preoccupazioni, soprattutto circa le limitazioni del suo uso.
La principale riguarda la questione dei diritti d’autore e la legalità dell’uso dell’immagine di qualcun altro, oppure delle sue capacità per esteso, tra cui ricade sicuramente anche la voce.
La cautela di Augie al riguardo
“Abbiamo pensato a cosa potrebbe andare storto, quindi stiamo facendo molta attenzione a chi può usare la voce preregistrata per clonare“, ha dichiarato Toeman al riguardo.
Per questo le voci registrate, a differenza di quelle che fanno parte della più ampia libreria di Augie, saranno disponibili solo per gli account individuali. Quindi un’altra persona della stessa organizzazione deve registrare nuovamente la voce del proprio speaker sul proprio account Augie per clonare il suo discorso.
Infine, gli utenti non possono caricare registrazioni altre: la piattaforma accetterà solo voci registrate con un microfono dal vivo e al momento. Quindi, ad esempio, non è possibile mettere in vivavoce la voce di del proprio ex per fingere una telefonata mai accaduta.