ChatGPT ha un nuovo generatore di immagini integrato in GPT-4o: come funziona e chi può utilizzarlo

OpenAI ha integrato in ChatGPT un potente generatore di immagini basato su GPT-4o che consente di creare immagini contestualmente alle conversazioni testuali. Più preciso di DALL-E 3 nella resa visiva, è accessibile agli abbonati ChatGPT Plus, Pro e Team, mentre il rilascio per gli utenti gratuiti è stato posticipato per via dell'elevata domanda.

Da oggi puoi supportare la Missione Cultura di Geopop

A cura di Giuseppe Servidio

Immagine generata artificialmente con GPT–4o, nella quale si vede un cavallo al galoppo sulla superficie dell’acqua. Credit: OpenAI.

OpenAI ha recentemente annunciato un'importante novità per ChatGPT: ora il chatbot basato sull'intelligenza artificiale può generare immagini in modo nativo basandosi sul modello GPT-4o. Questa innovazione rappresenta un passo avanti significativo rispetto alle precedenti capacità di GPT-4o, che fino ad ora si limitavano alla generazione e modifica di contenuti testuali. La tecnologia di GPT-4o promette immagini più accurate e dettagliate rispetto al suo predecessore, DALL-E 3, anche se il processo di generazione richiede un po' più di tempo. La generazione di immagini con GPT-4o è disponibile anche su Sora. Il sistema è in grado di modificare immagini esistenti, comprese quelle con persone, intervenendo su elementi in primo piano e sullo sfondo, il tutto in modo sorprendentemente accurato.

Cosa può fare il generatore d'immagini integrato in GPT-4o: le novità

La novità annunciata nelle scorse ore da OpenAI rappresenta un cambiamento importante per il settore dell'intelligenza artificiale generativa. Fino a questo momento, infatti, ChatGPT si era distinto come chatbot avanzato, ma la sua capacità di elaborazione visiva era delegata a strumenti separati come DALL-E. Con GPT-4o, invece, la creazione di immagini è diventata un processo integrato e più sofisticato. Il modello è stato progettato per garantire un livello superiore di dettaglio e fedeltà visiva, migliorando la resa dei testi nelle immagini – a differenza di quanto avveniva con i modelli precedenti, dove la scrittura risultava spesso distorta o illeggibile – e aprendo nuove prospettive nel fotoritocco automatizzato e nella creazione di contenuti visivi personalizzati grazie alla capacità del modello di modificare immagini esistenti.

Un altro aspetto tecnologico degno di nota riguarda il metodo con cui GPT-4o genera le immagini. L'approccio “autoregressivo” impiegato dal modello consente di produrre immagini con una logica sequenziale, lavorando progressivamente sulle diverse sezioni della figura, invece di generare l'intero contenuto in un unico passaggio. Questo procedimento, sebbene più lento rispetto a modelli che operano in parallelo, contribuisce a migliorare la qualità e la precisione del risultato finale.

Se da un lato questa innovazione apre nuove possibilità creative e semplifica la produzione di contenuti visivi, dall'altro solleva questioni importanti sulla gestione dei diritti d'autore, sull'accessibilità di tali strumenti a tutti gli utenti e anche sulla difficoltà di distinguere contenuti reali da immagini prodotte artificialmente.

A proposito della questione relativa ai diritti d'autore, per allenare il modello, OpenAI ha utilizzato dati pubblici nonché immagini fornite da partner come Shutterstock. L'azienda ha assicurato che rispetta i diritti degli artisti, impedendo la generazione di opere che imitano direttamente il lavoro di creatori viventi e offrendo un modulo di opt-out per coloro che vogliono escludere i propri lavori dai dataset di addestramento. Nonostante ciò, l'addestramento del modello su dati pubblici e immagini provenienti da partnership commerciali rappresenta un aspetto controverso e delicato. OpenAI, come altre aziende del settore, mantiene riservati i dettagli specifici del dataset, sia per proteggere il proprio vantaggio competitivo sia per evitare controversie legali legate al copyright. E tutto questo solleva dubbi sul reale rispetto del diritto d'autore di fotografi, illustratori e grafici di tutto il mondo.

Questione copyright a parte, se volete vedere il generatore d'immagini di OpenAI basato su GPT-4o, vi lasciamo al seguente video introduttivo realizzato dall'azienda.

Disponibilità ritardata per gli utenti Free

Attualmente, la generazione di immagini usando il modello GPT-4o è disponibile per gli abbonati a ChatGPT Pro Plus, Pro e Team, mentre il rilascio per gli utenti gratuiti subirà un ritardo a causa dell'elevata domanda, come ha confermato lo stesso Sam Altman, CEO di OpenAI, che su X ha riferito:

Le immagini in ChatGPT sono molto più popolari di quanto ci aspettassimo (e avevamo aspettative piuttosto alte). Il lancio del nostro livello gratuito purtroppo verrà posticipato per un po'.

non perderti questo articolo

OpenAI rilascia ufficialmente Sora, come l’AI genera video realistici da un testo e quanto costa

Fonti

OpenAI TechCrunch TheVerge