
Un tavolo da gioco, un disco che sfreccia a tutta velocità su un tavolo da air hockey e un braccio robotico che gioca come un professionista. Tre studenti di fisica ingegneristica dell'UBC (University of British Columbia) sono riusciti in un'impresa che potrebbe potenzialmente ridefinire il modo in cui vengono addestrati i robot. I tre giovani ricercatori hanno creato un robot da air hockey guidato da un'AI capace di sfidare e battere gli esseri umani, pur avendo imparato a giocare esclusivamente all'interno di una simulazione virtuale.
Generalmente, per insegnare a un sistema robotico a compiere gesti complessi nel mondo fisico si utilizza il metodo dei tentativi ed errori direttamente sul campo. Questo approccio classico, sebbene valido, comporta un enorme dispendio di tempo e il rischio concreto di usurare o rompere le componenti meccaniche a causa dei continui fallimenti iniziali. I ricercatori canadesi hanno invece aggirato il problema trasferendo l'intera fase di apprendimento nello spazio virtuale, sviluppando un “gemello digitale”, ovvero una replica digitale altamente dettagliata del tavolo reale, all'interno del quale l'algoritmo ha potuto disputare milioni di partite e commettere infiniti errori senza subire alcun danno materiale.
Una volta terminato questo percorso di studio simulato, il cervello virtuale è stato copiato e trasferito nel corpo meccanico del robot. Il risultato è interessante: fin dal primo istante, la macchina si è dimostrata immediatamente pronta a competere, dimostrando un'efficacia straordinaria contro gli avversari in carne e ossa e aprendo nuove frontiere per l'addestramento dei sistemi autonomi del futuro.
Come è stato addestrato il robot
Ma come si fa a preparare un software a gestire la caotica realtà di una partita di air hockey senza fargli mai toccare un vero tavolo da air hockey? Questo sport è una vera sfida per i robot, poiché il disco si muove a velocità elevatissime, rimbalza in modo imprevedibile e risente di variazioni minime causate dagli urti con le sponde o con la manopola di gioco. Inoltre, nella realtà fisica entrano in gioco ostacoli tecnici complessi come la latenza (cioè il ritardo temporale con cui i dati passano dalla telecamera al motore), le micro-vibrazioni della struttura e i lievi cali di tensione elettrica.
Per superare queste barriere, il team dell'UBC ha adottato una strategia controintuitiva: ha progettato un ambiente virtuale volutamente imperfetto. Attraverso una tecnica chiamata “randomizzazione del dominio”, gli studenti hanno inserito nella simulazione elementi di disturbo come sponde irregolari, tavoli leggermente deformati e anomalie nei rimbalzi. Questo ha permesso all'intelligenza artificiale di non basarsi su calcoli geometrici rigidi e perfetti, ma di imparare a prevedere una traiettoria approssimativa del disco, preparandosi a gestire l'imprevisto esattamente come farebbe un giocatore umano.
Per rendere l'apprendimento rapido ed efficiente, i ricercatori hanno evitato i classici motori grafici commerciali e hanno implementato un algoritmo avanzato basato sul meccanismo del “soft actor-critic”. Il sistema appartiene alla famiglia del reinforcement learning, una tecnica in cui l'algoritmo apprende ricevendo ricompense quando prende buone decisioni ed è stato progettato per massimizzare le prestazioni senza rinunciare alla sperimentazione di nuove strategie.
Per concretizzare tutto questo nel mondo fisico, il tavolo reale è stato equipaggiato con una telecamera posizionata dall'alto e un disco rivestito di nastro retroriflettente, un materiale capace di rinviare la luce direttamente verso la fonte che la emette, consentendo all'occhio elettronico di tracciare i movimenti a 120 fotogrammi al secondo.

Il risultato nell’usare questo sistema lo potete apprezzare dal seguente filmato.
I possibili risvolti futuri dell'esperimento
La vera vittoria di questo esperimento, nato originariamente all'interno del laboratorio universitario per creare una piattaforma didattica per i futuri corsi di automazione, va ben oltre il semplice divertimento. Gli studenti hanno superato mesi di sfide tecniche per integrare la meccanica del robot con un modello di controllo feedforward, un sistema predittivo che anticipa gli errori prima che si verifichino e applica correzioni in tempo reale.
Il successo di questo trasferimento dal virtuale al reale lascia ben sperare per il futuro, aprendo scenari in cui addestrare in modo sicuro e rapido droni, veicoli autonomi, robot industriali, etc., all'interno di simulazioni realistiche non sarà affatto utopico.