L’intelligenza artificiale generativa arriva per il doppiaggio cinematografico: la startup di intelligenza artificiale audio ElevenLabs aumenta il pre-seed

C’è un nuovo ragazzo di intelligenza artificiale generativa nel blocco – e questo sta imitando la voce umana.

ElevenLabs, in Polonia, vuole trasferire la sintesi vocale e audio-audio in qualsiasi lingua, con qualsiasi voce, con l’intera gamma di emozioni. Potrebbe essere utilizzato per qualsiasi cosa, dalla creazione di audiolibri al doppiaggio di film.

Oggi annuncia un round pre-seed da 2 milioni di dollari guidato da Credo, un VC ceco, in un momento in cui l’interesse pubblico per l’IA generativa come OpenAI ChatGPT3 e la diffusione stabile di Stability AI sta andando attraverso il tetto.

“Ci sono OpenAI e diverse aziende imitatrici che fanno cose simili con testo e immagini, ma manca una soluzione audio”, afferma Mati Staniszewski, CEO e cofondatore di ElevenLabs.

Cosa fa ElevenLabs?

ElevenLabs è una startup di tecnologia vocale AI. La soluzione è sviluppata — un modello di deep learning per la sintesi vocale — può convertire il testo in parlato con qualsiasi voce e qualsiasi emozione, attualmente lavora in inglese e in polacco. Funziona su narrazioni di breve e lunga durata, quindi potrebbe essere utilizzato da editori di libri, giornalisti o creatori di contenuti.

ElevenLabs produce voci artificiali ma è anche in grado di clonare quelle esistenti — così, per esempio, un libro può essere letto con la voce di una celebrità, senza molto del loro coinvolgimento — la tecnologia può clonare una voce da campioni né brevi né cinque secondi.

A breve termine, la startup spera di far funzionare la sua soluzione per tutte le lingue. A lungo termine, spera di poter convertire all’istante audio parlato tra le lingue — una soluzione che potrebbe essere utilizzata, ad esempio, nel doppiaggio cinematografico, nella TV in diretta e nella comunicazione in tempo reale.

La soluzione è stata finora testata da 250 clienti e sarà più ampiamente disponibile a partire da febbraio.

🎧 ASCOLTARE: Per dare un’anteprima a Sifted, ElevenLabs ha convertito questo articolo in audio. Ascolta la registrazione qui sotto.



Com’è il mercato?

Ci sono diverse startup che operano nell’area dell’IA vocale: Ukrainian Respeecher, Canadian Resemble AI e American WellSaid Labs, solo per citarne alcune. Ma nessuno di loro è in grado di gestire moduli scritti più lunghi come ElevenLabs, afferma Staniszewski.

Per Staniszewski, la concorrenza più seria è rappresentata dalle grandi aziende tecnologiche e dalle scaleup con i propri dipartimenti di ricerca. “Siamo le più timorose delle aziende che si concentrano sulla ricerca, come OpenAI. Faranno molte ricerche sulla voce e svilupperanno un modello”, dice.

Le grandi aziende tecnologiche si stanno muovendo velocemente: nelle prime tre settimane del 2023, Microsoft ha già annunciato un nuovo strumento in grado di clonare la propria voce e il tono da uno snippet audio di tre secondi. Apple ha anche annunciato il lancio di un nuovo narrazione digitale progetto per creare audiolibri.

Chi ha investito?

  • Credo, un VC ceco
  • Concept Ventures, un fondo pre-seed del Regno Unito
  • Angel investor, tra cui Pether Czaban, ex fondatore della piattaforma blockchain e della criptovaluta Polkadot, Bartek Pucek, autore di una newsletter tecnologica polacca, e Carles Reina, ex vicepresidente di Sonantic, una startup di tecnologia vocale.

Qual è il futuro per ElevenLabs?

Con i nuovi finanziamenti, ElevenLabs vuole espandere la sua soluzione a livello globale, quindi è disponibile in tutte le lingue. Vuole anche avviare una ricerca sul doppiaggio automatico da una lingua all’altra con la stessa voce. Questo strumento di doppiaggio AI dovrebbe essere rilasciato entro la fine dell’anno.

Nei prossimi mesi, Staniszewski prevede di raddoppiare la sua squadra, che attualmente è composta da cinque persone.

L’opinione di Sifted

Per ElevenLabs, il tempismo del suo primo round è una benedizione e una maledizione.

Da un lato, l’IA generativa sarà senza dubbio l’area tecnologica più in voga nel 2023 e attirerà l’attenzione di clienti, partner commerciali e investitori.

D’altra parte, le grandi aziende tecnologiche, con le loro infinite risorse, stanno già investendo molto tempo e denaro nello sviluppo delle proprie soluzioni di intelligenza artificiale generativa o nell’acquisizione di iniziative esistenti (vedi l’offerta segnalata da Microsoft di investire $ 10 miliardi in OpenAI). Se startup come ElevenLabs vogliono sfondare in questo mercato affollato, dovranno muoversi velocemente.

Il pitch deck utilizzato dai fondatori

Sifted ha avuto accesso al pitch deck di ElevenLabs dal suo recente rilancio. Dai un’occhiata qui sotto.

Zosia Wanat è la reporter di Sifted per l’Europa centrale e orientale, con sede a Varsavia. Twitta da @zosiawanat.

Leave a Comment

Your email address will not be published. Required fields are marked *