17 Luglio 2023
15:46

DALL-E, l’algoritmo di OpenAI che genera immagini da una descrizione: cos’è e come funziona

DALL-E è un algoritmo sviluppato da OpenAI, basato su intelligenza artificiale, in grado di generare immagini partendo dal testo fornito in input dall'utente.

Entra nel nuovo canale WhatsApp di Geopop
Ti piace questo contenuto?
DALL-E, l’algoritmo di OpenAI che genera immagini da una descrizione: cos’è e come funziona
dall E

DALL-E è un algoritmo di intelligenza artificiale, sviluppato da OpenAI, in grado di generare immagini a partire da input testuali forniti dall'utente che lo utilizza.
OpenAI aveva già mostrato le capacità dei LLM (Large Language Model) GPT-3 e GPT-4 e, grazie a DALL-E, possiamo sperimentare come un modello in grado di comprendere le richieste dell'utente possa divenire la base fondamentale per la creazione di un tool in grado di generare immagini partendo da una semplice descrizione.

La sua presentazione risale a gennaio 2021 e ha mostrato fin da subito le sue capacità di analisi del testo ricevuto come input al fine di generare immagini coerenti alla richiesta ricevuta.

Come funziona DALL-E

Schematizzare il funzionamento di DALL-E è piuttosto semplice:

  1. L'utente fornisce un input testuale (ad es. "un astronauta che cammina in mezzo ad un ambiente desertico");
  2. L'algoritmo di interpretazione del testo di DALL-E analizza la richiesta dell'utente e cerca di comprenderne i dettagli;
  3. Viene effettuata la ricerca degli elementi necessari per produrre l'immagine all'interno del dataset su cui DALL-E è stato addestrato;
  4. Viene generata l'immagine.
astronaut image generated by DALL-E
Fonte: OpenAI

L'algoritmo nel corso degli anni è stato affinato e perfezionato consentendo ora la generazione di immagini più coerenti ed impiegando un tempo inferiore rispetto al passato.
Il tool, al momento, genera immagini in formato quadrato con risoluzione di 1024pixel, inoltre, grazie ad un editor di immagini consente di aggiungere, rimuovere e modificare elementi di un'immagine precedentemente generata.

Il dataset di DALL-E

Il dataset di associazioni tra immagini e testo utilizzato per addestrare l'algoritmo non è pubblico, tuttavia, è possibile ipotizzare che esso contenesse milioni di associazioni.
OpenAI ha dichiarato che l'algoritmo, inoltre, implementa dei sistemi di sicurezza che consentono di evitare la generazione di immagini che raffigurino violenza, odio o contenuti espliciti. Tuttavia ci tiene a sottolineare che, in quanto prodotto basato su AI, DALL-E migliorerà nel tempo grazie all'apprendimento derivante dall'attività con gli utenti.

Sfondo autopromo
Cosa stai cercando?