
Per Chatbot AI si intende un sistema basato sull'intelligenza artificiale che interagisce con gli utenti simulando una conversazione umana. Dietro un Chatbot AI, anché funzioni, ci sono tante cose molto complesse, ma di base gli elementi principali sono due: il modello d’intelligenza artificiale e le componenti fisiche, gli hardware. Il modello è un po’ come se fosse il cervello del chatbot, mentre gli hardware sono un po’ come i muscoli: forniscono al cervello la potenza necessaria per fare i calcoli complessi. Nello specifico per un chatbot di AI, serve un hardware molto potente: un supercomputer. Ne abbiamo esemplare proprio qui in italia, in provincia di Bergamo, in grado di sviluppare nuove applicazioni, tra cui chatbot in lingua italiana.
Come viene addestrato un modello per un chatbot di AI?
Come prima cosa bisogna capire che un chatbot prima di saper rispondere dev’essere addestrato e per farlo c’è un processo che si basa sull’intelligenza artificiale, nello specifico il famoso machine learning, tramite cui il modello impara grazie a una quantità enorme di dati, testi e immagini che gli vengono dati in pasto. Ok, ma nel concreto, il modello come fa ad imparare?
Ci sono tre fasi principali d’apprendimento.
La prima fase è un po’ come le scuole elementari: si apprendono competenze linguistiche e nozioni generali. È in questa fase che il modello “impara la lingua italiana”. In che modo?
In pratica vengono dati al modello una serie di testi verificati di qualità, come ad esempio un articolo di Geopop, da cui sono state nascoste in maniera randomica alcune parole. Ora, quello che viene richiesto al modello è riempire questi spazi vuoti, un po’ come il gioco dell’enigmistica, fill the blank. Inizialmente farà un sacco di errori ma, mano a mano, ogni volta che il chatbot commette degli errori, vengono modificati i suoi parametri. In questo modo, imparando a predire la parola, il modello apprende anche tutta una serie di informazioni correlate: la struttura sintattica della frase, la grammatica e poi tutta una serie di nozioni.
La seconda fase invece è come se fosse l’università, perché qui impara competenze più specialistiche: al modello, dopo l’apprendimento dell’italiano vengono date una serie di domande con risposte multiple e si “insegna” al modello ad eseguire dei task. La terza e ultima fase poi, è un po’ l’esame finale: viene verificata l’ecacia delle risposte da un team di persone in carne e ossa, che controllano il risultato dei task assegnati. In questa fase si può anche impostare il tipo di comportamento atteso, quindi il modo e il tono con cui ci si aspetta che il modello risponda (per esempio in modo formale, oppure giocoso, giovanile o con un linguaggio tecnico, dipende dal tipo di domanda). Una volta poi che siamo soddisfatti del livello di apprendimento, il modello è pronto per essere utilizzato e non apprenderà più nuove informazioni, quantomeno fino all’aggiornamento successivo.
Quindi, attenzione: i chatbot non vanno a cercare la risposta su internet, ma generano una risposta grazie al proprio modello, al proprio cervello che è stato allenato. Idealmente se avessi un chatbot generativo leggero, cioè che sa compiere solo alcune funzioni, potrei farlo funzionare anche sul mio pc non connesso a internet. Tecnicamente funzionerebbe.
Ovviamente i grandi chatbot internazionali che sanno fare di tutto sono agganciati alla rete per essere anche costantemente aggiornati e attenzione, utilizzano motori, muscoli, molto potenti: i supercomputer.
Comprendere domande e generare risposte: dietro la customer experience
La loro potenza di calcolo serve in particolare per poter capire quello che gli scriviamo e per formulare delle risposte, che tecnicamente si traduce nella gestione dei dati e le operazioni necessarie.
Per comprendere il nostro linguaggio il bot divide la frase in mattoncini, cioè in singole unità che prendono il nome di token, e infatti si dice che tokenizza la domanda ricevuta. Per fare un esempio, se la domanda dovesse essere “come si prepara una torta di mele?”, il bot scomporrebbe la frase in 8 token:
- Come
- si
- prepara
- una
- torta
- di
- mele
- punto interrogativo
In questo modo gli sarà più facile analizzarla e riconoscere le parti del discorso più importanti.
Infatti, il passo successivo è proprio quello di riconoscere “i mattoncini più rilevanti”, e cioè le parole chiave della frase.
Nel nostro caso individua le parole “torta” e “preparare”, e a questo punto capisce che, molto probabilmente, per rispondere alla domanda dovrà scavare nei “cassettini” della sua memoria legati al mondo della cucina.
Una volta capita la domanda, per risponderci il chatbot passa alla fase di Generazione del Linguaggio Naturale, e cioè la generazione della risposta.
Quindi, in questo caso, seleziona i dati più importanti relativi alla ricetta della torta di mele (tra quelli che ha appreso durante la fase di addestramento), organizza le informazioni in una struttura logica, compone le frasi, le collega tra loro e genera il testo. Ed ecco la nostra risposta.
Il primo chatbot realizzato in Italia
Da luglio in Italia abbiamo un supercomputer interamente dedicato all’intelligenza artificiale generativa. È stato installato da Fastweb per creare chatbot in lingua italiana che potranno essere utilizzati dalle aziende e dalle Pubbliche Amministrazioni.
Ma a cosa ci serve un chatbot specificatamente italiano? I vantaggi sono molteplici. Prima di tutto, essendo addestrato su dati italiani, parlerà benissimo l’italiano. E non soltanto per quel che riguarda la grammatica, ma anche per tutte quelle sfaccettature della lingua e quelle sfumature culturali che, normalmente, solo chi vive il territorio può comprendere appieno. Inoltre rispetterà i diritti di copyright sui contenuti che ha utilizzato per l’addestramento, poiché si tratta di dati regolarmente acquisiti in seguito ad accordi con gli editori. Anche le aziende che vogliono sviluppare il loro chatbot saranno più tutelate, sapendo che i server sono qui nel territorio italiano: non è banale.
In secondo luogo, trattandosi di un modello interamente sviluppato da zero, si avrà il pieno controllo su tutte le fasi di sviluppo, quindi, per esempio, si potrà scegliere il tipo di dati da utilizzare per l’addestramento. Questo modello, nello specifico, verrà addestrato su dati autorevoli e verificati, grazie ad accordi presi con realtà del calibro di Mondadori, Bignami e ISTAT.