
Ha senso scegliere un hotel basandoci solo sulla media delle recensioni online? O acquistare un prodotto cosmetico solo perché "il 90% ha visto miglioramenti"? Ogni giorno prendiamo decisioni basandoci su numeri e statistiche: ma cosa succede quando i dati mancano? Che si tratti di informazioni mai raccolte, trascurate o volutamente omesse, anche quello che non ci viene detto conta. E la storia che racconta può rivelarsi persino più interessante di quella dei dati di cui disponiamo.
Recensioni online: l'importanza dei dati mancanti
Quando dobbiamo scegliere un ristorante o un hotel, sempre più spesso controlliamo le recensioni online e confrontiamo le medie delle valutazioni. Ma quanto possiamo fidarci di queste informazioni? Diverse piattaforme permettono di lasciare una recensione solo a chi ha effettivamente usufruito del servizio, rendendo il punteggio medio più attendibile. Ma è sufficiente e affidabile?
Gli studi ci dicono che solo una minoranza delle persone recensisce online le proprie esperienze. Capire perché alcune recensioni mancano diventa quindi essenziale per valutare l'affidabilità del punteggio medio.

I motivi per cui delle recensioni possono mancare sono molteplici e gli statistici li classificano in tre categorie:
- Le recensioni che mancano, ad esempio, per un errore di caricamento del server, sono dati che mancano per puro caso (MCAR: Missing Completely at Random). In queste occasioni, le recensioni disponibili possono comunque essere considerate rappresentative.
- Se invece delle recensioni mancano perché alcuni gruppi – ad esempio, gli anziani – sono meno propensi a scrivere recensioni online, allora siamo di fronte a dati assenti per motivi legati ad altre variabili osservabili (MAR: Missing at Random). Questo può distorcere il punteggio medio, ma su alcune piattaforme possiamo in parte correggerlo filtrando le recensioni in base al profilo dell'utente che le ha scritte, ad esempio per fascia di età.
- Il caso più critico è quando le persone decidono di non lasciare una recensione proprio in base al tipo di esperienza vissuta. Ad esempio, molte persone decidono di non scrivere una recensione quando hanno avuto un'esperienza mediocre o negativa In queste situazioni, la media può essere fuorviante, perché l'assenza della valutazione è legata proprio al punteggio della recensione (MNAR: Missing Not at Random)
Quando pochi parlano per tutti: il rischio di generalizzare troppo
Gli studi ci dicono che chi scrive recensioni lo fa, più frequentemente, dopo esperienze molto positive o molto negative. Le esperienze “normali” spariscono nel silenzio, generando un fe2nomeno noto come bias di selezione. Il risultato?
Soprattutto quando le recensioni sono poche ed estreme, la media rischia di riflettere più un compromesso tra l’entusiasmo di alcuni e la frustrazione di altri, che non un indicatore realistico delle esperienze vissute. Ecco perché, soprattutto in presenza di poche recensioni, è meglio essere cauti. La cautela è d'obbligo anche davanti a pattern sospetti, come tante recensioni scritte tutte lo stesso giorno o prive di commenti dettagliati. Ad esempio, davanti ad una trattoria con 4,8 stelle su 15 recensioni scritte tutte lo stesso giorno e tutte molto generiche.
Il rischio di generalizzare sulla base di dati incompleti non riguarda solo le recensioni online. Anche nella ricerca clinica e cosmetica, i dati mancanti possono generare distorsioni significative. Quante volte vediamo pubblicizzati i risultati di studi clinici apparentemente molto promettenti? O leggiamo frasi del tipo: "Crema testata su 100 persone: il 90% ha visto miglioramenti!". Ma quanti erano i partecipanti iniziali allo studio? Se 90 su 100 hanno notato miglioramenti, ma 30 persone sono uscite dalla sperimentazione prima della sua fine, i risultati potrebbero essere molto meno entusiasmanti.
E questo è tutt'altro che raro: le statistiche mostrano che il tasso di drop-out (cioè di uscita anticipata dallo studio) può superare il 20%. Quei dati mancanti potrebbero nascondere non solo un’assenza di miglioramenti, ma persino effetti collaterali non riportati e i dati conclusivi appariranno più positivi di quanto dovrebbero.
Oltre i dati: il valore dell'assenza
Non tutti i dati mancanti sono un problema. A volte, la loro assenza è intenzionale e utile.
Ad esempio, quando la recensione non riguarda un hotel ma temi delicati, come la valutazione del proprio ambiente di lavoro o della propria università, l’anonimato dei rispondenti può aumentare la sincerità delle risposte. In queste situazioni, i dati mancanti, come nome e cognome dei rispondenti, possono influenzare positivamente la disponibilità a condividere informazioni delicate, migliorando la qualità complessiva dei risultati.
Lo stesso vale nella ricerca scientifica. Le migliori sperimentazioni cliniche sono quelle “in cieco”, cioè quando né il paziente né lo sperimentatore sanno quale trattamento viene somministrato. A volte, nemmeno i ricercatori che seguono lo studio lo sanno (doppio cieco) o persino chi analizza i dati (triplo cieco). Tenere nascosto quel dato chiave sul trattamento eseguito aiuta infatti a isolare l’efficacia reale del trattamento da suggestioni, aspettative o pregiudizi.
Ogni dato assente, ogni recensione che manca, può aiutarci a valutare meglio la veridicità delle informazioni che riceviamo. Anche senza strumenti statistici, possiamo sempre chiederci: "Chi è che non ha lasciato informazioni? E perché?”