;Resize,width=638;)
Il gigante cinese del commercio Alibaba ha annunciato nelle scorse ore il rilascio di Qwen2.5-Max, il suo nuovo LLM (Large Language Model) totalmente open-source che potrebbe superare DeepSink R-1, il modello AI che ha recentemente scosso il mercato. Il lancio di Qwen2.5-Max è avvenuto in un momento strategico, non solo perché è stato fatto nel pieno del Capodanno cinese, ma anche (e soprattutto) perché l'annuncio segue a stretto giro quello di DeepSeek-R1, quasi a sembrare una risposta diretta a quest'ultimo. Senza troppi peli sulla lingua Alibaba ha affermato, infatti, che in alcuni benchmark Qwen2.5-Max supera DeepSeek-V3 (la versione precedente di R-1) e persino Llama 3.1-405B, il modello open source di Meta. Se questa affermazione trovasse ulteriori conferme, Alibaba si posizionerebbe in una posizione dominante nel settore dell'AI generativa open-source.
Cos’è e come funziona il modello AI di Alibaba Qwen2.5-Max
Dal punto di vista tecnologico, Qwen2.5-Max si distingue per la sua multimodalità, ovvero la capacità di comprendere sia testo che immagini e persino di generare contenuti video, caratteristiche che lo avvicinano ai modelli occidentali più avanzati, come GPT-4o di OpenAI e a Claude 3.5 Sonnet di Anthropic. Nel commentare il processo di training del suo nuovo modello, Alibaba ha spiegato:
È un modello MoE su larga scala che è stato pre-addestrato su oltre 20 trilioni di token e ulteriormente post-addestrato con metodologie curate Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF).
I risultati di questo lavoro si traducono in prestazioni eccelse per Qwen2.5-Max. Sempre stando a quanto affermato da Alibaba, il modello supera DeepSeek V3 in benchmark quali Arena-Hard (uno strumento di valutazione automatica per LLM sintonizzati sull'istruzione), LiveBench (un benchmark che testa in modo completo le capacità generali di un modello) e LiveCodeBench (utilizzato per valutare le prestazioni degli LLM su diverse finestre temporali). Qwen2.5-Max ha ottenuto risultati competitivi anche in altre valutazioni, tra cui MMLU-Pro (che testa la conoscenza attraverso problemi di livello universitario).

Nel seguente video potete vedere Qwen2.5-Max all'opera.
Dubbi e limiti su Qwen2.5-Max
Emergono, però, anche in questo caso dubbi legati alla sicurezza e alla gestione dei dati. Come nel caso di DeepSeek, Qwen2.5-Max conserva le informazioni degli utenti su server cinesi, il che implica la possibilità che il Governo cinese vi possa accedere. Dal momento che questo ha spinto il Garante della privacy italiano ad aprire un'indagine e, come primo provvedimento, a rimuovere l'app di DeepSeek dagli store italiani, è probabile che misure simili possano essere applicate anche ad altri modelli AI cinesi.
Un'altra criticità è data dal fatto che, nonostante la sua natura open-source, l'uso di Qwen2.5-Max non è immediato: per adoperarlo, come spiega Alibaba sulla pagina di presentazione del modello, bisogna «prima registrare un account Alibaba Cloud e attivare il servizio Alibaba Cloud Model Studio, quindi navigare verso la console e creare una chiave API», un processo che può risultare poco intuitivo per gli utenti meno “smanettoni”.
Qwen 2.5-Max, DeepSeek e le altre intelligenze artificiali: cosa sta succedendo
L'annuncio di Alibaba è arrivato in un contesto di crescente competizione tra le aziende cinesi che operano nel mercato dell'AI. Il successo di DeepSeek, con il rilascio del modello DeepSeek-R1 il 20 gennaio scorso, ha destabilizzato il mercato, portando addirittura al crollo delle azioni di alcune big tech occidentali, come NVIDIA. La startup ha dimostrato che è possibile sviluppare modelli di alta qualità con costi operativi molto più bassi rispetto a quelli delle aziende statunitensi, mettendo in discussione gli enormi investimenti di colossi come OpenAI, Google e Anthropic.
Questo ha scatenato una reazione immediata in Cina: ByteDance, la società madre di TikTok, ha aggiornato il proprio modello AI, affermando che supera in prestazioni OpenAI o1 in test specifici. Alibaba, come abbiamo appena riportato, ha invece risposto con Qwen2.5-Max.
E tornando alla “competizione” nel campo open source tra Qwen2.5-Max e DeepSeek, è interessante notare che Qwen2.5 (la versione precedente a Qwen 2.5-Max) ha raggiunto 94 milioni di download sulla piattaforma Hugging Face, metà dei quali solo nell'ultimo mese, superando Llama 3.1 di Meta e affermandosi come il modello AI open-source più scaricato al mondo. Questo indubbiamente rappresenta un segnale importante, in quanto evidenzia come il mercato dell'intelligenza artificiale stia rapidamente evolvendo verso soluzioni più accessibili e personalizzabili, alternative ai modelli “chiusi” come quelli di OpenAI.