0 risultati
video suggerito
video suggerito
27 Gennaio 2025
14:40

DeepSeek R1, l’AI cinese che fa tremare i giganti USA e supera ChatGPT: di cosa si tratta

DeepSeek è una startup cinese che sviluppa modelli AI innovativi a basso costo, utilizzando tecniche come l’apprendimento per rinforzo e l’architettura MoE. Si tratta dell'app gratuita attualmente più scaricata negli USA.

776 condivisioni
DeepSeek R1, l’AI cinese che fa tremare i giganti USA e supera ChatGPT: di cosa si tratta
Immagine

DeepSeek è una startup cinese attiva nel settore dell’intelligenza artificiale che sta rapidamente guadagnando attenzione, spaventando la concorrenza e superando il rivale ChatGPT in termini di download dagli store USA. DeepSeek è nata da un hedge fund cinese chiamato High-Flyer Quant, creato da Liang Wenfeng nel 2015 e caratterizzato da costi significativamente inferiori rispetto ai concorrenti. Grazie all’uso di tecniche avanzate di machine learning, come l’apprendimento per rinforzo e l’architettura MoE, DeepSeek ha raggiunto prestazioni eccezionali senza compromettere l’efficienza delle risorse. L’azienda cinese sta rapidamente superando altri leader del settore e ha inoltre scelto di rendere open source i suoi modelli, contribuendo così alla democratizzazione dell’intelligenza artificiale. Vediamo più da vicino le tecnologie sviluppate da DeepSeek, il suo impatto sui giganti della Silicon Valley – su tutti OpenAI, Google e Meta – e le sue strategie di pricing, che potrebbero potenzialmente incidere sull'intero panorama dell’AI.

Cos'è e come funziona DeepSeek

L’obiettivo di DeepSeek è chiaro: competere con i colossi tecnologici nel campo dell’intelligenza artificiale. Nel novembre 2023 ha lanciato il suo primo prodotto significativo, DeepSeek Coder, un modello open source per attività di codifica. A questo sono seguiti il modello linguistico DeepSeek LLM, con 67 miliardi di parametri e, nel maggio 2024, il modello DeepSeek-V2, che ha attirato grande attenzione per le sue prestazioni elevate a un costo nettamente inferiore rispetto ai concorrenti. Questi modelli si distinguono per la capacità di ridurre il consumo di risorse computazionali, grazie a tecniche come l’apprendimento per rinforzo, che consente loro di migliorare progressivamente le capacità tramite tentativi ed errori.

Un altro punto di forza della strategia di DeepSeek è l’architettura MoE (Mixture of Experts), che attiva solo una parte dei parametri per ogni compito specifico. Questo approccio riduce significativamente i costi di calcolo e migliora l’efficienza, consentendo prestazioni elevate a fronte di un dispendio minore di risorse. Anche la capacità di utilizzare l’attenzione latente multi-testa, integrata nel modello DeepSeek-V3, consente di elaborare input complessi con maggiore precisione, gestendo contemporaneamente più aspetti delle informazioni.

Nel gennaio 2025, l’azienda ha lanciato DeepSeek-R1, un modello avanzato per attività di ragionamento, che si è messo in diretta competizione con i modelli più evoluti di OpenAI. Questo dimostra la determinazione di DeepSeek nel posizionarsi come attore di rilievo nel mercato globale. La startup ha sviluppato anche modelli distillati, come DeepSeek-R1-Distill, che combinano l’efficienza dei modelli più piccoli con le capacità avanzate dei modelli più grandi.

Immagine

La differenza tra DeepSeek e l'AI di ChatGPT

Le differenze tra DeepSeek e la concorrenza vanno ricercate soprattutto nel suo modello di business. Finanziata esclusivamente da High-Flyer, un hedge fund fondato da Liang Wenfeng, l’azienda non dipende da investitori esterni e può concentrarsi sulla ricerca a lungo termine. Nonostante il successo, DeepSeek non ha ancora piani concreti per una commercializzazione su larga scala, preferendo focalizzarsi su ricerca e sviluppo.

La sua politica di contenimento dei costi è un aspetto chiave di DeepSeek e si riflette in modo evidente sulle sue tariffe, che sono sensibilmente più basse rispetto a quelle dei competitor. Basti pensare che l’API di DeepSeek-R1, ad esempio, costa solo 0,55 dollari per milione di token di input e 2,19 dollari per milione di token di output, molto meno rispetto a modelli simili di altri giganti come OpenAI, che chiede 15 dollari per milione di token di input e 60 dollari per milione di token di output! Questa notevole efficienza nei costi potrebbe spingere i concorrenti di DeepSeek a ridurre i loro prezzi per rimanere competitivi.

Un altro aspetto distintivo dell’azienda è l’approccio open source, che permette a piccole imprese e sviluppatori indipendenti di accedere a tecnologie avanzate senza dover affrontare costi a dir poco esorbitanti.

Le sfide di DeepSeek e i limiti di censura

Fin qui tutto bello. Ma va detto anche che DeepSeek affronta diverse sfide. Una delle principali riguarda la limitata disponibilità di risorse di calcolo avanzate, a causa dei controlli sulle esportazioni di chip dagli Stati Uniti (e con l'elezione di Donald Trump la cosa potrebbe complicarsi ulteriormente). Sebbene DeepSeek abbia dimostrato grande efficienza nella gestione delle risorse, l’accesso a hardware più potente è essenziale per mantenere la competitività con i concorrenti della Silicon Valley.

Essendo un’azienda cinese, inoltre, DeepSeek deve fare i conti con la censura dei suoi modelli per evitare la diffusione di contenuti contrari al Partito Comunista Cinese. Questo potrebbe potenzialmente rappresentare un notevole ostacolo alla sua adozione globale, in particolare nei Paesi dove la libertà di espressione è un valore fondamentale e indiscutibile. Se DeepSeek sarà in grado di superare o meno queste sfide sarà solo il tempo a rivelarcelo.

Fonti
Sfondo autopromo
Cosa stai cercando?
api url views