Llama 3.1 di Meta rappresenta un salto significativo nell'ambito delle intelligenze artificiali open source. Con una capacità di 405 miliardi di parametri (nella sua versione più grande, ovvero Llama 3.1 405B), al momento è il modello open source più avanzato e potente mai rilasciato. Questa nuova versione supporta una lunghezza di contesto estesa fino a 128.000 token e supporta otto lingue diverse, rendendola estremamente versatile e utile per una vasta gamma di applicazioni. Servirà per la generazione di dati sintetici, per la distillazione del modello (sarebbe quel processo che consiste nel trasferire le conoscenze e le competenze essenziali di un modello più grande a uno più piccolo ed efficiente), la traduzione multilingue e molto altro ancora.
Le caratteristiche e le prestazioni di Llama 3.1: cos'è e come funziona
Una delle caratteristiche più impressionanti di Llama 3.1 è la sua capacità di rivaleggiare con modelli chiusi leader del settore come GPT-4o e Claude 3.5 Sonnet. Le valutazioni su oltre 150 set di benchmark hanno dimostrato che Llama 3.1 è competitivo su compiti complessi come il ragionamento matematico, l'uso di strumenti e la traduzione. Inoltre, Meta ha migliorato la qualità e la quantità dei dati utilizzati per l'addestramento, innalzando l'efficacia del modello attraverso procedure iterative di post-addestramento e ottimizzazioni dirette delle preferenze.
Un altro aspetto cruciale è la scalabilità del modello. Grazie all'uso di oltre 16.000 GPU H100, Llama 3.1 è stato addestrato su più di 15 trilioni di token, un'impresa che ha richiesto notevoli ottimizzazioni della stack di addestramento. Meta, inoltre, avendo quantizzato i suoi nuovi modelli da 16 a 8 bit ha potuto ridurre i requisiti computazionali, permettendo a questi di operare su singoli nodi server.
Ma Llama 3.1 non è solo potente, è anche costruito anche per essere integrato in un sistema più ampio, con componenti aggiuntivi come Llama Guard 3 e Prompt Guard per la sicurezza e l'uso responsabile. Meta ha anche introdotto Llama Stack, un'interfaccia standardizzata per facilitare l'interoperabilità tra i vari componenti del sistema Llama.
Llama 3.1 è disponibile al download gratuito da questa pagina, in tre differenti versioni: 405B (la più potente di tutte), 70B e 8B.
Le preoccupazioni sulla sicurezza dei modelli AI open source
La notizia del rilascio pubblico del codice di Llama 3.1 ha destato pareri contrastanti nel mondo tech, “spaccando” sostanzialmente in due l'opinione di esperti e appassionati tech. Una parte di questi si ritiene chiaramente favorevole alla cosa, mentre un'altra parte sostiene che il rilascio di modelli AI open source così potenti possa rappresentare una seria minaccia informatica. Non è di quest'ultimo avviso Mark Zuckerberg, CEO di Meta, che in un post pubblicato sul blog della sua azienda ha scritto:
Credo che l'open source sia necessario per un futuro positivo dell'AI. L'AI ha più potenziale di qualsiasi altra tecnologia moderna per aumentare la produttività umana, la creatività e la qualità della vita, e per accelerare la crescita economica sbloccando al contempo il progresso nella ricerca medica e scientifica. L'open source garantirà che più persone in tutto il mondo abbiano accesso ai vantaggi e alle opportunità dell'AI, che il potere non sia concentrato nelle mani di un piccolo numero di aziende e che la tecnologia possa essere distribuita in modo più uniforme e sicuro nella società. C'è un dibattito in corso sulla sicurezza dei modelli di IA open source e la mia opinione è che l'IA open source sarà più sicura delle alternative. Penso che i governi concluderanno che è nel loro interesse supportare l'open source perché renderà il mondo più prospero e sicuro.