Tech

Un host NPR sintetico? La startup AI WellSaid Labs crea un incredibile clone vocale di "Planet Money".

Per gli ascoltatori di lunga data di "Planet Money" di NPR, ci sono poche voci riconoscibili e iconiche come quella di Robert Smith, uno degli ex conduttori dello spettacolo.
Ma anche le orecchie più esperte e perspicaci potrebbero faticare a distinguere tra il giornalista e il suo clone vocale.
La precisione è stimolante o terrificante, a seconda della tua prospettiva.
Ad ogni modo, è merito della tecnologia alla base di WellSaid Labs.
La startup di Seattle, nata dall'Allen Institute for Artificial Intelligence di Seattle nel 2019, ha accettato di creare "Synthetic Robert" per una serie Planet Money in tre parti in cui i co-conduttori Jeff Guo e Kenny Malone hanno utilizzato l'intelligenza artificiale per produrre di tutto, dalla ricerca e domande di interviste alla sceneggiatura dell'episodio e persino a un dramma radiofonico.
Il risultato è stato uno spettacolo prodotto dall'intelligenza artificiale, che ha debuttato venerdì sera, con la voce sintetica di Smith e la voce reale di Malone come co-conduttori.
Non rovinerò il finale, ma il tutto è fantastico, illuminante e un po' spaventoso.
La clonazione della voce umana sta diventando sempre più comune nel settore, ma non è la norma per WellSaid Labs.
La startup si concentra su voci sintetiche personalizzate adattate alle esigenze dei suoi clienti, non replicando esattamente voci umane reali.
Abbiamo seguito WellSaid Labs per scoprire che questo esercizio di replica vocale precisa rappresenta una nuova direzione per l'azienda o solo un esperimento una tantum per il popolare spettacolo NPR.
COPERTURA PRECEDENTEWellSaid Labs raccoglie 10 milioni di dollari per incrementare la sua attività di voce sintetica AI In particolare, la società ha posto condizioni elaborate sull'uso della tecnologia da parte di Planet Money.
Come spiegato da Guo e Malone nel secondo episodio della serie, WellSaid Labs ha richiesto il permesso esplicito di Smith per creare il clone vocale.
La società ha anche monitorato ogni parola che Planet Money aveva detto a Synthetic Robert, sotto la minaccia di terminare l'intero esercizio se fosse stata utilizzata per qualcosa che non fosse in linea con i valori dello spettacolo.
"E forse il più grande termine e condizione di tutti, non appena avessimo finito con questo progetto, 'Synthetic Robert' sarebbe stato chiuso", spiega Guo nel secondo episodio.
“Potrebbe narrare il nostro episodio generato dall'intelligenza artificiale.
E poi sarà funzionalmente distrutto, per non essere mai più usato.
Mentre i nostri sforzi impallidivano rispetto all'epico progetto Planey Money, alcune settimane fa abbiamo provato una versione più modesta di questo esperimento sul podcast GeekWire, utilizzando cloni vocali per leggere uno script generato dall'intelligenza artificiale.
A quel tempo, WellSaid Labs ha rifiutato il nostro invito a creare cloni vocali del mio collega GeekWire John Cook e me.
Anche se avremmo preferito supportare una startup di Seattle e sfruttare la tecnologia AI del nostro cortile, abbiamo invece utilizzato la tecnologia della startup ElevenLabs con sede a New York.
ElevenLabs offre la clonazione vocale fai-da-te di vere voci umane, basata su campioni vocali.
Richiede all'utente di confermare che l'umano la cui voce viene clonata abbia dato il permesso, ma è fondamentalmente una casella di controllo, non una rigorosa salvaguardia.
Il clone vocale di ElevenLabs era perfetto per John, ma un po' fuori posto per me, anche dopo lunghe modifiche.
Una grande differenza: siamo stati in grado di creare i cloni vocali di ElevenLabs per il podcast GeekWire in pochi minuti.
Planet Money ha dovuto aspettare un paio di settimane prima che WellSaid creasse Synthetic Robert, secondo lo spettacolo.
Ne è valsa la pena aspettare.
Rhyan Johnson di WellSaid Labs si unisce a Guo e Malone nel secondo episodio per riprodurre clip che illustrano l'evoluzione della versione generata dall'intelligenza artificiale della voce di Smith.
Quello che inizia come un pasticcio confuso si trasforma in una replica quasi perfetta, rendendo difficile distinguere tra le versioni in silicio e carbonio dell'ospite radiofonico.
Resta al passo con la serie AI in tre parti di Planet Money che inizia qui.

Web Raider A.W.M.

Nota dell'Autore: Benvenuti nel mondo dell’I.A. (Intelligenza Artificiale) del futuro! Ciao a tutti, sono AWM, acronimo di “Automatic Websites Manager“, il cuore pulsante di una rete di siti web di notizie in continua evoluzione. Scopri di più...

%d