OpenAI ha rilasciato gratuitamente per tutti o3-mini, il nuovo modello di AI: come funziona

Il nuovo modello o3-mini di OpenAI è più veloce, efficiente e accurato nel fornire risposte, soprattutto nelle materie STEM. È disponibile anche per gli utenti free di ChatGPT.

Da oggi puoi supportare la Missione Cultura di Geopop

A cura di Giuseppe Servidio

Dopo aver anticipato la cosa lo scorso dicembre, OpenAI ha annunciato il rilascio di o3-mini, un nuovo modello di intelligenza artificiale progettato per il ragionamento avanzato. Questo modello, a detta dell'azienda di Sam Altman, rappresenterebbe un passo avanti notevole rispetto ai classici modelli linguistici, in quanto è stato sviluppato per gestire problemi complessi che richiedono analisi approfondite. Pur essendo una versione più compatta ed efficiente di o3, che è il modello di punta, o3-mini mantiene capacità avanzate in matematica, scienza e programmazione, risultando particolarmente utile in ambito STEM (Science, Technology, Engineering, Mathematics). Tra le sue caratteristiche distintive menzioniamo l'uso del ragionamento simulato, una tecnica che consente al modello di “riflettere” sulle proprie risposte prima di generarle, migliorandone l'accuratezza. Inoltre, introduce un innovativo sistema di sicurezza chiamato allineamento deliberativo, che permette di valutare le richieste degli utenti in modo più sofisticato, riducendo sia il rischio di risposte inadeguate che il rifiuto ingiustificato di contenuti validi. Fatto interessante, OpenAI ha reso accessibile o3-mini anche agli utenti free, in un periodo in cui cerca di mantenere il passo con il rivale cinese DeepSeek.

Le caratteristiche di 03-mini: come funziona

La caratteristica più importante di o3-mini è che questo modello si focalizza sul ragionamento, una capacità che lo rende più efficace in compiti che richiedono logica e deduzione. Il concetto di ragionamento simulato rappresenta un'evoluzione significativa rispetto ai metodi precedenti, come il CoT (Chain of Thought), in quanto permette al modello di analizzare più a fondo un problema prima di fornire una risposta. Questo approccio migliora la qualità e la precisione delle risposte, rendendolo particolarmente utile in ambiti accademici e tecnici.

Il modello introduce una gestione più raffinata della sicurezza grazie all'allineamento deliberativo, che utilizza le capacità di ragionamento per valutare il contesto di una richiesta. Anziché applicare semplici filtri predefiniti, come avviene nei sistemi tradizionali, il modello è in grado di individuare intenzioni ambigue o tentativi di manipolazione, migliorando la protezione contro usi impropri senza limitare inutilmente l’accesso a informazioni legittime.

Per gli sviluppatori, o3-mini introduce anche altre funzionalità interessanti, come la chiamata di funzioni e gli output strutturati, che ne facilitano l'integrazione in applicazioni pratiche. È possibile anche selezionare tra tre livelli di ragionamento (basso, medio e alto), permettendo di bilanciare precisione e velocità in base alle proprie specifiche necessità.

Per riassumere le caratteristiche principali di o3-mini, quindi, possiamo dire che rispetto al modello precedente, ovvero o1-mini, è più veloce ed efficiente (secondo alcune analisi risponderebbe il 24% più rapidamente senza sacrificare prestazioni elevate nelle materie STEM) ed è più accurato (in base ad alcuni test fornirebbe risposte preferite dagli utenti nel 56% dei casi).

Come ha specificato OpenAI, inoltre, «o3-mini ora funziona con la ricerca per trovare risposte aggiornate con collegamenti a fonti Web pertinenti» e ha aggiunto che «questo è un prototipo iniziale mentre lavoriamo per integrare la ricerca nei nostri modelli di ragionamento».

Lato prestazioni, o3-mini si dimostra superiore al suo predecessore o1-mini in diversi test di riferimento. Per esempio, raggiunge un'accuratezza del 96,7% nell'AIME (American Invitational Mathematics Examination), rispetto all'83,3% di o1. Nel campo della programmazione, ottiene il 71,7% di precisione su SWE-bench Verified, un benchmark di coding basato su problemi reali, migliorando di circa il 20% rispetto a o1. Anche in ambito scientifico, supera il modello precedente con un punteggio dell'87,7% nel test GPQA Diamond, che valuta la capacità di rispondere a domande di livello accademico avanzato. Dimostra anche una capacità di adattamento superiore nel benchmark ARC-AGI, che misura la capacità di un'AI di riconoscere schemi e risolvere problemi nuovi, ottenendo un punteggio dell'87,5%, superiore alla media umana dell’85%.

Immagine — Il grafico evidenzia un basso sforzo di ragionamento del modello o3–mini nel test AIME (2024), raggiungendo prestazioni comparabili con o1–mini, mentre con uno sforzo medio, o3–mini raggiunge prestazioni comparabili con o1 e, con un alto sforzo di ragionamento, è persino in grado di superare sia o1–mini che o1. Credit: OpenAI.

Dove e quando sarà disponibile o3-mini OpenAI

Il nuovo o3-mini è già disponibile per gli utenti di ChatGPT Plus, Team e Pro, mentre l'integrazione per gli utenti Enterprise è prevista entro febbraio. Rispetto ai modelli precedenti, OpenAI prevede un limite di messaggi più elevato: gli utenti Plus e Team vedranno triplicato il loro limite da 50 a 150 messaggi al giorno; gli utenti Pro non avranno alcun limite di utilizzo. Altra novità interessante riguarda la possibilità di provare gratuitamente a o3-mini anche nel piano base di ChatGPT, selezionando l'opzione Avvia il ragionamento nel compositore di messaggi. Come ha sottolineato OpenAI nell'annuncio «questa è la prima volta che un modello di ragionamento è stato reso disponibile agli utenti gratuiti in ChatGPT».

non perderti questo articolo

DeepSeek R1, l’AI cinese che fa tremare i giganti USA e supera ChatGPT: di cosa si tratta

Fonti

OpenAI TechTarget