0 risultati
video suggerito
video suggerito
16 Febbraio 2024
17:15

I primi video creati da Sora, la nuova AI lanciata da OpenAI: cosa può fare e come funziona

Sora di OpenAI è uno strumento di AI generativa per creare video realistici partendo da semplici comandi testuali. I primi risultati sono molto promettenti, ma lo strumento è ancora in fase di test e non è ancora disponibile al pubblico per via dei possibili rischi legati a un uso improprio.

634 condivisioni
I primi video creati da Sora, la nuova AI lanciata da OpenAI: cosa può fare e come funziona
OpenAI Sora | Geopop
Credits: OpenAI.

OpenAI ha presentato in anteprima Sora, una nuova soluzione legata all'intelligenza artificiale generativa, che permette di creare dei filmati partendo da semplici input testuali. Per intenderci, è una sorta di “ChatGPT per creare video” tramite cui si possono animare immagini già esistenti o creare delle scene da zero, partendo da semplici comandi testuali, in modo analogo a quanto avviene con DALL-E per le immagini. Sora non è il primo strumento di AI generativa per il text-to-video, ma secondo OpenAI si differenzia per l'elevato grado di realismo e per la possibilità di generare filmati più lunghi rispetto alla concorrenza (fino a 1 minuto).

Al momento Sora è in fase di test e non è disponibile per il pubblico: come dichiarato dalla stessa OpenAI, lo strumento infatti ha ancora dei limiti e soprattutto non è esente dai rischi che un uso improprio di questa tecnologia comporterebbe, come quelli legati alla disinformazione. Per questo motivo l'applicazione è disponibile solo per un limitato gruppo di creator e di esperti di sicurezza. Su Internet comunque sono già presenti vari filmati che mostrano quanto può essere potente l’utilizzo di Sora per generare video con l’AI.

Cosa può fare Sora

Cosa permette di fare Sora? Dai video diffusi in rete si può apprezzare la complessità delle scene che il sistema di text-to-video di OpenAI riesce a produrre. Nei video generati partendo da testi possono essere inclusi più personaggi con tanto di dettagli accurati riguardanti sia i soggetti ritratti che lo sfondo delle scene, specifiche tipologie di movimento e realizzare più riprese all'interno di un singolo video creato andando a simulare l'utilizzo di più camere.

OpenAI Sora | Geopop
Fotogramma di un video che dimostra il livello di realismo di Sora. Credits: OpenAI.

Sora, inoltre, è in grado di comprendere non solo qual è la richiesta che l’utente fa tramite la digitazione del prompt (ovvero del comando testuale), che gli permette di interpretare accuratamente le istruzioni e generare personaggi che esprimono emozioni che sembrano “reali” e che si muovono tenendo conto delle leggi fisiche.

Come anticipato prima, inoltre, Sora è in grado non solo di generare video da istruzioni testuali, ma può anche prendere un'immagine statica già esistente e “animarla” con un’attenzione ai dettagli davvero impressionante. Il modello può anche partire da un filmato già esistente e andare riempire i fotogrammi mancanti o estenderlo.

I primi video iper-realistici generati da Sora

Ecco alcuni esempi di video realizzati con Sora, che mostrano le capacità di questa applicazione di generare filmati molto realistici:

Quali sono i limiti di Sora

Ma come si suol dire “non è tutto oro quel che luccica”. Il modello presenta anche limiti e punti deboli. Tra questi c’è il fatto che non sempre riesce a simulare scene complesse, come quelle che riguardano output in cui sono presenti elementi di causa-effetto. Per esempio, se si chiede a Sora di generare un video in cui il protagonista addenta un pezzo di pizza o martella un chiodo, è probabile che il soggetto generato dall’AI darà un morso alla pizza o tirerà la martellata, ma non è detto che questo provochi un effetto sulla pizza o sul chiodo rappresentato nel filmato.

Sembrerebbe, inoltre, che il modello faccia anche fatica a comprendere prompt che contengono riferimenti spaziali, il che porta Sora a confondere la destra con la sinistra, non gli consente di eseguire movimenti di camera complessi e così via. Inoltre, i video generati possono avere la durata massima di un minuto.

Al momento Sora non è stato rilasciato per il pubblico. Solo alcuni utenti selezionati (tra cui artisti visivi, designer e registi) stanno provando il modello per fornire a OpenAI feedback su come migliorarlo.

Quali sono i possibili rischi legati a questa nuova applicazione

Quando si parla di AI generativa non si può non pensare anche ai possibili rischi nell'uso di strumenti come Sora. Poter realizzare video con un livello di realismo così elevato può rappresentare per malintenzionati un'occasione per fare disinformazione, per esempio diffondendo fake news o diffamando personaggi pubblici, magari usando la tecnica del deep fake (che consiste nell'addestrare l'AI con immagini e video di volti esistenti realmente per andare a "incollarli" su corpi reali di altre persone) oppure creando dal nulla persone mai esistite prima. È già successo e può succedere ancora.

Ecco perché OpenAI non ha ancora rilasciato Sora per tutti. L'azienda, infatti, ha dichiarato di voler prima coinvolgere un team di esperti esterni affinché possano testare a fondo Sora e individuare potenziali criticità del modello legate alla sicurezza degli utenti. OpenAI sta lavorando anche a un classificatore di rilevamento che permetterà di capire quando un video è stato generato artificialmente con Sora, il che dovrebbe contribuire a mitigare i rischi menzionati poc'anzi.

Fonti
Sfondo autopromo
Cosa stai cercando?
api url views