Si chiama Project GR00T (Generalist Robot 00 Technology) la nuova piattaforma di intelligenza artificiale presentata da NVIDIA alla GTC 2024, pensata per facilitare la realizzazione di robot umanoidi in grado di imitare i movimenti e il linguaggio naturale direttamente osservando gli esseri umani. Durante la presentazione si è vista una dimostrazione con robot in grado di rispondere in modo credibile a input dati da umani, a testimonianza del fatto che il progetto si trovi già a un buon livello di maturità. Con questo progetto il colosso del computing punta a competere con OpenAI, l'azienda di ChatGPT, che soltanto pochi giorni fa ha fatto parlare di sé tramite il robot umanoide Figure 01. Ad affiancare la nuova piattaforma NVIDIA ha presentato inoltre la potenza computazionale del nuovo SoC (System on Chip) Jetson Thor che sfrutta per i calcoli grafici le nuove GPU Blackwell, dedicate alle applicazioni di intelligenza artificiale, che promettono performance da 7 a 30 volte superiori rispetto alla precedente generazione.
NVIDIA ha sviluppato una piattaforma chiamata Isaac, che semplifica e riduce i costi di sviluppo per robot a scopi industriali o commerciali. Tra le altre funzionalità, NVIDIA Isaac consente di utilizzare modelli preimpostati per addestrare i robot, eseguire test e simulazioni e semplificare lo sviluppo di robot autonomi.
La strategia di NVIDIA è quindi quella di attirare aziende interessate ad investire nel settore della robotica e dell'AI mettendo a loro disposizione una suite con cui progettare e sviluppare robot da zero. Aziende come Boston Dynamics, Sanctuary e la stessa Figure AI hanno già aderito al progetto.
Inoltre, Per automatizzare la capacità di apprendimento dei robot, oltre a mettere a disposizione la suite Isaac, NVIDIA ha previsto modelli di apprendimento in grado di elaborare una moltitudine di file dati come input. lI modello consente l'addestramento partendo dall'insieme di dati che vengono forniti: per esempio è possibile richiedere l'analisi di testo, immagini, video o addirittura di manifestazioni comportamentali legate alla prossemica, alla mimica e alla gestualità. A valle dell'elaborazione, il robot potrà essere addestrato e utilizzare ciò che ha “imparato” per produrre features uniche come movimenti, proprietà di linguaggio (anche in lingue) o la capacità di interagire con gli utenti basandosi sulle informazioni ricevute in input.