
Video generati dall'intelligenza artificiale che mostrano Will Smith mentre mangia un piatto di spaghetti sono diventati, nel giro di pochi anni, molto più di un meme virale: oggi rappresentano un test semplice ma efficace per misurare quanto sia migliorata la capacità delle AI di simulare il comportamento umano. Questo esperimento puramente empirico, noto online come “Will Smith Eating Spaghetti”, concentra in pochi secondi alcune delle sfide più complesse della generazione video: la coerenza del volto da un fotogramma all’altro, la naturalezza dei movimenti, il rapporto tra mani, posate e cibo, e persino la sincronizzazione tra audio e labbra. Ripercorrendo la sua evoluzione, possiamo capire perché una clip che nel 2023 sembrava un classico esempio di AI slop oggi ha raggiunto un livello simil-cinematografico, e cosa questo ci dice sullo stato attuale della ricerca sull'intelligenza artificiale generativa, senza cedere a facili entusiasmi o, al contrario, a timori ingiustificati.
L'evoluzione del meme di Will Smith che mangia spaghetti: 2023 vs 2026
Il primo video, comparso nel marzo 2023 su Reddit, mostrava un Will Smith irriconoscibile, con tratti del volto che cambiavano continuamente e gesti meccanici, lontani da qualsiasi esperienza reale. Era stato realizzato con ModelScope, uno strumento di conversione da testo a video: significa che l'utente inserisce una descrizione scritta, chiamata prompt, e il modello prova a trasformarla in immagini in movimento. Il risultato era a dir poco disturbante proprio perché il cervello umano è estremamente sensibile alle anomalie nei volti e nelle azioni quotidiane come mangiare. Non a caso il filmato si diffuse rapidamente, generando un mix di ilarità e inquietudine in chi lo guardava, diventando materia prima per parodie e discussioni di vario genere.
Da quel momento, “Will Smith che mangia spaghetti” ha iniziato a funzionare come una sorta di benchmark non ufficiale, cioè un test usato dalla community per confrontare i progressi dei diversi modelli. Nel 2024 le nuove iterazioni mostravano già passi avanti: i movimenti erano più fluidi e la scena più stabile, ma persistevano ancora errori evidenti, come forchette deformate o spaghetti che sembravano ignorare la forza di gravità.
Il salto più interessante arriva nel 2025, quando strumenti come Google Veo 3 producono versioni del test molto più convincenti. I volti risultano più coerenti, la postura credibile e l’azione complessiva più naturale. Restano dettagli strani, come suoni di masticazione eccessivamente “croccanti”, ma siamo di fronte a imperfezioni sottili, non più a errori macroscopici. È in questa fase che il deepfake smette di essere solo una curiosità sperimentale e diventa una tecnologia più matura, almeno dal punto di vista visivo. Chiaramente, questa maturità visiva non implica una reale comprensione dell’azione da parte dell'AI, ma una simulazione sempre più raffinata nel modo in cui la realtà viene rappresentata nei video sintetici.
Negli ultimi sviluppi, il test evolve ulteriormente grazie a generatori come Kling 3.0, sviluppato dalla società cinese Kuaishou Technology. Qui non vediamo più solo un uomo che mangia davanti alla telecamera, ma è rappresentata una vera e propria scena in cui si vedono due personaggi seduti a tavola (uno dei due è Will Smith ovviamente), con tanto di dialoghi, cambi d'inquadrature, etc. Le voci, anch'esse sintetiche, sono sincronizzate con il labiale, un aspetto tecnicamente complesso perché richiede che audio e video siano generati in modo coerente. Ma giudicate voi stessi i progressi fatti dal 2023 a oggi.
Stop alle clip di Will Smith che mangia spaghetti?
Curiosamente, proprio mentre la qualità dei video generati con l'AI cresce, il test degli spaghetti inizia a incontrare dei limiti. Aziende come OpenAI e xAI (l'azienda di Elon Musk che sviluppa la controversa Grok) adottando guardrail sempre più rigidi, con regole automatiche che impediscono di generare immagini riconducibili a persone reali o protette da copyright. Questo rende sempre più difficile replicare lo stesso esperimento con attori famosi, soprattutto negli Stati Uniti, dove l’industria dell’intrattenimento è particolarmente attenta alla tutela della propria proprietà intellettuale.