Anthropic disattiva i modelli AI Claude Fable 5 e Mythos a causa del Governo USA: cosa sta succedendo

Il governo degli USA ha vietato i modelli AI Fable 5 e Mythos 5 di Anthropic ai non americani per motivi di sicurezza nazionale. Non potendo filtrare gli utenti, l'azienda li ha disattivati per tutti a livello globale. Anthropic definisce la misura un gravissimo errore, causato da un mero jailbreak.

Vogliamo andare oltre il web: partecipa alla Missione Cultura

A cura di Giuseppe Servidio

Tre giorni è il tempo che Claude Fable 5 ha avuto per godersi il titolo di modello di intelligenza artificiale più performante al mondo tra quelli disponibili al pubblico, prima che il governo degli Stati Uniti ne ordinasse lo spegnimento immediato per tutti gli utenti non americani, in tutto il pianeta, anche all’interno degli USA e anche per i dipendenti di Anthropic non statunitensi. Nel comunicato diffuso dall’azienda diretta dai fratelli Amodei, infatti, si legge: «Il governo degli Stati Uniti, citando le autorità per la sicurezza nazionale, ha emanato una direttiva sul controllo delle esportazioni per sospendere l'accesso a Fable 5 e Mythos 5 a qualsiasi cittadino straniero, sia all'interno che all'esterno degli Stati Uniti, compresi i dipendenti stranieri di Anthropic».

Come avrete appena appreso, oltre a Fable 5 è stato disattivato anche Mythos 5, il suo “fratello maggiore” rimasto fino a quel momento riservato a pochissimi partner selezionati. Anthropic, l'azienda che ha sviluppato entrambi i modelli, si è detta pronta a rispettare l'ordine ma ha anche fatto sapere di considerarlo un errore: secondo la sua ricostruzione, alla base ci sarebbe un presunto e limitato “jailbreak” individuato in Fable 5, una falla nei meccanismi di sicurezza che, a detta dell'azienda, sarebbe comunque già presente in altri modelli concorrenti. La vicenda ha avuto un'eco enorme anche fuori dagli Stati Uniti, con diversi politici europei che l'hanno presa come spunto per parlare di sovranità tecnologica e della necessità, per il continente, di sviluppare propri modelli di intelligenza artificiale. Vediamo insieme, con ordine, cosa è successo e perché.

Il blocco di Mythos 5 e Fable 5 dal governo USA

Partiamo da Mythos: secondo Anthropic è il modello più avanzato mai realizzato dall'azienda, presentato in anteprima ad aprile ma mai distribuito su larga scala perché capace, a detta della stessa azienda, di individuare da solo vulnerabilità di sicurezza in praticamente tutti i sistemi operativi e i browser testati. Per questo era stato condiviso solo con circa 50 organizzazioni, tra cui Amazon, Apple, Google, Microsoft e CrowdStrike, nell'ambito di un programma chiamato Project Glasswing, pensato per usare queste capacità a scopo difensivo, cioè per scovare e correggere falle prima che vengano sfruttate da malintenzionati.

Fable 5 è arrivato solo tre giorni prima dello stop ed era la versione “addomesticata” di Mythos: stesse capacità di base, ma con filtri aggiuntivi per bloccare le risposte su temi ad alto rischio, come la sicurezza informatica e la biologia. Questo lo rendeva, secondo Anthropic, sufficientemente sicuro per essere messo a disposizione di tutti, e appena rilasciato è risultato il modello più performante tra quelli pubblici nei test di Vals AI, una società che misura le prestazioni dei modelli di IA tramite benchmark, cioè prove standardizzate che permettono di confrontare diversi sistemi tra loro.

Veniamo ora all'ordine del governo. Formalmente si tratta di una misura di controllo delle esportazioni, uno strumento che normalmente serve a impedire che determinate tecnologie finiscano nelle mani di soggetti stranieri per motivi di sicurezza nazionale. In questo caso, però, l'effetto pratico è stato molto più ampio: per rispettare l'ordine, Anthropic ha dovuto disattivare entrambi i modelli per tutti gli utenti del mondo, cittadini americani compresi, perché non esisteva un modo tecnico per applicare il blocco solo ai cittadini stranieri, inclusi i propri dipendenti non statunitensi. Gli altri modelli di Anthropic continuano invece a funzionare normalmente per tutti.

Secondo la ricostruzione di Anthropic, il governo non avrebbe fornito motivazioni dettagliate al riguardo, ma l'azienda ritiene che la preoccupazione riguardi proprio quel “jailbreak” di Fable 5. Semplificando al massimo, nel mondo dell'AI, con questo termine si indica un modo per “convincere” un modello a ignorare le proprie regole interne. In questo caso si tratterebbe di una tecnica che permette al modello di analizzare un codice e individuare vulnerabilità software già note, una capacità che, secondo l'azienda, è disponibile anche in altri modelli pubblici, incluso GPT-5.5 di OpenAI, e che gli esperti di sicurezza informatica usano regolarmente a scopo difensivo.

Anthropic sottolinea inoltre che le sue protezioni più importanti non dipendono solo dal comportamento del modello, ma da sistemi di controllo indipendenti che restano attivi anche se il modello stesso venisse “convinto” a rispondere in modo anomalo.

La frustrazione di Anthropic

Da qui la frustrazione di Anthropic: ritirare dal mercato un modello usato da centinaia di milioni di persone per una vulnerabilità limitata, a suo avviso, rischia di bloccare il lancio di qualsiasi nuovo modello da parte di qualsiasi azienda del settore. C'è anche un paradosso di fondo: l'azienda ha costruito gran parte della sua immagine sulla cautela mostrata proprio con Mythos, presentato come troppo potente per la distribuzione libera, e oggi si trova “punita” quasi per lo stesso motivo, tanto che, già ad aprile, Sam Altman di OpenAI aveva parlato di una strategia di marketing basata sulla paura.

La vicenda ha avuto un eco immediato anche in Europa, dove diversi politici, dalla Francia al Regno Unito, passando per i Paesi Bassi, hanno colto l'occasione per chiedere maggiori investimenti in modelli di AI europei, sostenendo che dipendere da tecnologie sviluppate altrove esponga al rischio di restarne tagliati fuori da un momento all'altro, proprio come accaduto agli utenti non americani di Fable 5 e Mythos 5.

non perderti questo articolo

Claude Mythos è il modello AI di Anthropic che fa paura agli esperti di cybersecurity

Fonti

TechCrunch Euronews Anthropic