0 risultati
video suggerito
video suggerito
23 Dicembre 2025
7:00

Come funziona Codex GPT-5.2: cos’è l’ultima mossa di OpenAI per contrastare Google e Meta

GPT-5.2-Codex è il nuovo modello di codifica agentica targato OpenAI per lo sviluppo software complesso: migliora il refactoring, la gestione del contesto e la sicurezza, ed è una risposta diretta alla crescente concorrenza di Google e Meta.

Ti piace questo contenuto?
Come funziona Codex GPT-5.2: cos’è l’ultima mossa di OpenAI per contrastare Google e Meta
Immagine
Credit: OpenAI.

Codex GPT-5.2, il modello di codifica agentica definito da OpenAI «[come] il più avanzato per l'ingegneria del software in contesti complessi» (principalmente ingegneria e cybersecurity), rappresenta il tentativo più recente del colosso dell'intelligenza artificiale per rafforzare la propria posizione nella competizione sempre più serrata nel settore. Il rilascio di GPT-5.2-Codex è infatti un segnale preciso sulle priorità dell'azienda diretta da Sam Altman che, nelle settimane scorse, ha fatto scattare il “codice rosso” per OpenAI, proprio per la concorrenza pressante di Google Gemini. Vediamo le caratteristiche di GPT-5.2-Codex e il suo ruolo nella competizione tra OpenAI, Google e Meta.

Le caratteristiche di GPT-5.2-Codex

GPT-5.2-Codex nasce come una variante di GPT-5.2 ottimizzata per la cosiddetta codifica agentica, cioè la capacità di un sistema di intelligenza artificiale di agire come un agente autonomo che pianifica, esegue e corregge sequenze di operazioni complesse nel tempo. A differenza dei modelli che rispondono a singole richieste isolate, un agente mantiene il contesto su orizzonti temporali lunghi e interagisce con strumenti come terminali e ambienti di sviluppo. Per ottenere questo risultato, OpenAI ha lavorato sulla compattazione del contesto, una tecnica che consente di conservare le informazioni rilevanti riducendo il consumo di token, migliorando così l'efficienza e la coerenza del ragionamento.

Dal punto di vista pratico, questo si traduce in prestazioni superiori su attività come il refactoring, ovvero la riorganizzazione del codice senza modificarne il comportamento. GPT-5.2-Codex dimostra inoltre una maggiore affidabilità negli ambienti Windows, storicamente più complessi da gestire per strumenti automatizzati, e integra capacità visive più avanzate per interpretare screenshot, diagrammi tecnici e mockup, cioè bozze preliminari dell'interfaccia di un'applicazione.

Visti i progressi fatti da OpenAI, non sorprende che GPT-5.2-Codex abbia raggiunto punteggi interessanti in alcuni test. Nel benchmark SWE-Bench Pro, un test in cui al modello viene fornito un repository reale e viene chiesto di generare una patch funzionante il modello ha raggiunto il punteggio di 56,4%; mentre nel benchmark Terminal-Bench 2.0, un test che simula ambienti di terminale autentici con compiti complessi come compilazione del codice o configurazione di server, il modello ha raggiunto il punteggio di 64,0%. Risultati, questi, i quali indicano come il modello non si limiti a “scrivere codice”, ma abbia anche la capacità di operare in contesti realistici e dinamici.

Immagine
Nel benchmark SWE–Bench Pro al sistema viene messo a disposizione un archivio di codice reale e gli viene richiesto di produrre una modifica correttiva capace di risolvere un problema concreto di ingegneria del software. Nel benchmark Terminal–Bench 2.0 serve a valutare il comportamento degli agenti di intelligenza artificiale in contesti di terminale realistici, con prove che includono la compilazione del codice, il training dei modelli e l’impostazione di infrastrutture server. Credit: OpenAI.

Un aspetto particolarmente delicato riguarda la cybersecurity. Con l'aumento delle capacità dei modelli, cresce anche la loro efficacia nell'individuare vulnerabilità, cioè difetti che possono essere sfruttati per compromettere un sistema. Tecniche come il fuzzing, che consiste nel testare un software con input casuali o malformati, o l'analisi zero-shot, in cui il modello affronta un problema senza avergli fornito esempi preliminari, diventano più potenti se supportate da sistemi agentici.

OpenAI riconosce che le stesse capacità che aiutano i difensori potrebbero essere abusate. A questo riguardo, l'azienda ha infatti spiegato:

Questi progressi possono rafforzare la sicurezza informatica su larga scala, ma introducono anche nuovi rischi di uso improprio che richiedono un’implementazione attenta. Sebbene GPT‑5.2-Codex non raggiunga il livello “Alto” di capacità in cybersicurezza secondo il nostro Framework di preparazione, stiamo progettando il nostro approccio di distribuzione⁠ tenendo conto della crescita futura delle capacità.

GPT-5.2-Codex è già in fase di rilascio su tutte le funzionalità di Codex riservate agli abbonati a pagamento di ChatGPT, mentre OpenAI sta completando il lavoro necessario per rendere disponibile il modello anche tramite API in modo graduale e sicuro nelle prossime settimane successive. Allo stesso tempo viene avviato un progetto sperimentale, basato su invito, che consentirà a professionisti e organizzazioni verificate che sono impegnate nella cyberdifesa di accedere in maniera controllata a capacità più avanzate e a modelli con minori restrizioni, con l'obiettivo di «[bilanciare] l'accessibilità con la sicurezza», per citare testualmente OpenAI.

La competizione tra OpenAI, Google e Meta

Questo rilascio va letto anche in ottica competizione con Google (che ha guadagnato non pochi punti con il rilascio della famiglia Gemini 3) e Meta. Non dobbiamo dimenticare, infatti, quanto Sam Altman, CEO di OpenAI, si sia dimostrato preoccupato per la crescita esponenziale dei modelli concorrenti. Crescita che ha fatto scattare il “codice rosso” negli uffici del colosso dell'AI. Riguardo a questo, Fidji Simo, responsabile delle applicazioni di OpenAI, in occasione del rilascio di GPT 5.2 ha spiegato:

Abbiamo annunciato il “codice rosso” per segnalare chiaramente all'azienda che vogliamo concentrare le risorse in un’area specifica; è un modo per definire le priorità e stabilire cosa può essere messo in secondo piano. […] Abbiamo aumentato le risorse dedicate a ChatGPT in generale; direi che questo aiuta nel rilascio del modello, ma non è il motivo per cui esce proprio questa settimana.

Sfondo autopromo
Cosa stai cercando?
api url views