0 risultati
video suggerito
video suggerito
5 Aprile 2024
15:00

Fastweb sta lavorando a un’intelligenza artificiale che “pensa” in italiano

Fastweb intende addestrare un'intelligenza artificiale basata su modello linguistico di grandi dimensioni (LLM) in italiano, per realizzare nuovi chatbot e assistenti virtuali capaci di interagire nativamente in italiano, con vantaggi anche per la sicurezza dei dati, specialmente per la Pubblica Amministrazione.

759 condivisioni
Fastweb sta lavorando a un’intelligenza artificiale che “pensa” in italiano
fastweb intelligenza artificiale italiana

Fastweb sta creando il primo LLM (Large Language Model), ovvero un modello linguistico di grandi dimensioni per l'intelligenza artificiale, addestrato nativamente in lingua italiana. L'obiettivo è realizzare sistemi di AI in grado di capire perfettamente l'italiano, cogliendone tutte le sfumature e le particolarità linguistiche. Questo avrebbe vantaggi sia in termini di precisione nella comprensione delle richieste, sia per quanto riguarda la protezione e al controllo delle informazioni. A tale scopo, Fastweb ha acquistato 31 NVIDIA DGX H100, l'hardware che costituirà il cuore pulsante del supercomputer che l'azienda controllata dal gruppo elvetico Swisscom impiegherà per creare e alimentare il proprio LLM.

Come verrà addestrata l'intelligenza artificiale di Fastweb

I modelli su cui si basano i sistemi AI più popolari del momento – come ChatGPT di OpenAI e Gemini di Google – sono addestrati nativamente in inglese e, interagendo con loro, si percepisce la loro profonda impronta anglosassone. Questo può rappresentare un limite per chi li usa impartendo comandi in altre lingue (come l'italiano appunto), in quanto non sempre c'è una piena comprensione delle richieste fatte lato utente. Queste AI, dunque, non sempre riescono a restituire degli output che siano soddisfacenti per una cultura diversa da quella anglosassone. Con il nuovo LLM addestrato nativamente in italiano, Fastweb vuole colmare questo "gap".

Giovanni Germani, Manager of Architecture & AI COE di Fastweb, ha infatti riferito:

Il nostro obiettivo è presidiare tutti gli anelli della catena del valore dell’intelligenza artificiale, eccezion fatta per la produzione di chip. Partiamo dal supercomputer di NVIDIA per arrivare alla consulenza, passando per la fornitura di potenza computazionale a startup e aziende e alla realizzazione di modelli su misura.

Per poter raggiungere un risultato che sia qualitativamente rilevante dal punto di vista linguistico, Fastweb sta raccogliendo una grande mole di dati con cui addestrare il modello da più fonti: dall'editoria ai social media, passando per il Web e la Pubblica Amministrazione. A questo riguardo il responsabile AI di Fastweb ha spiegato:

La qualità del dataset e il bilanciamento delle varie fonti sono fondamentali per avere un LLM efficiente e capace di parlare davvero in lingua italiana.

Quando si tratta di addestramento di un modello linguistico di grandi dimensioni e dei dati che vengono impiegati per addestrarlo, spesso vengono sollevati quesiti circa il rispetto della privacy degli utenti e delle norme sul diritto d'autore (entrambi affrontati al centro dell'AI Act, la prima legge al mondo che regolamenta l'uso dell'intelligenza artificiale). Riguardo a questo tema il dirigente Fastweb ha rassicurato:

A differenza di altri modelli, rispetteremo tutte le normative europee sulla protezione dei dati personali, sulla sicurezza dell’AI e sul diritto d’autore.

Immagine

Quali sono le potenzialità di un'AI “italiana”

Se entro il 2024 verrà raggiunto l'obiettivo di avere i primi modelli costruiti da zero addestrati nativamente in lingua italiana, il panorama dell'AI per noi italiani potrebbe cambiare sensibilmente. «A quel punto» dice Giovanni Germani «potremo offrire alle aziende e alla Pubblica Amministrazione un’alternativa agli attuali fornitori di AI».

Questo significherà poter addestrare modelli con personalizzazioni ad hoc facendo rimanere fisicamente i propri dati in Italia (per la cronaca, il data center che ospiterà il supercomputer di Fastweb usato per l'addestramento si trova in Lombardia), con tutti i vantaggi annessi e connessi relativi alla protezione e al controllo delle informazioni.

Cosa ancora più interessante, disporre di un'intelligenza artificiale “italiana” contribuirà alla potenziale nascita di nuovi chatbot e assistenti virtuali capaci di dialogare in modo naturale con chi parla in italiano, disporre di sistemi di traduzione automatica più efficaci, affidabili e precisi, e generare contenuti creativi che abbiano un senso anche nella nostra lingua.

Sfondo autopromo
Cosa stai cercando?
api url views