Come funziona la ricerca su Google: algoritmo, data centers e consumo energetico

Vi siete mai chiesti cosa accade dopo aver premuto l'invio sulla barra di ricerca? Com'è possibile avere tutte quelle informazioni in così poco tempo?

Entra nel nuovo canale WhatsApp di Geopop
25 Agosto 2022
18:30
6 condivisioni
Come funziona la ricerca su Google: algoritmo, data centers e consumo energetico
ricerche google

Apriamo Google sui nostri pc e digitiamo la nostra ricerca, circa 0,5 secondi dopo migliaia di risultati compaiono per rispondere alla nostra domanda. Questo gesto viene ripetuto quotidianamente circa 3.5 miliardi di volte, in media ogni utente lo fa 1 o 2 volte al giorno .
Ma cosa accade davvero in quella minuscola frazione di secondo? Vediamo insieme cosa succede quando facciamo una ricerca su Google!

Il percorso del software in tre fasi

Premiamo invio: che fine fa il nostro input?
Il primo passaggio possiamo chiamarlo il “matching” o “abbinamento” ed è messo in moto da un software in grado di prendere le parole digitate e cercarle sul World Wide Web.
Questa cosa è resa possibile dal fatto che il software ha un’intera copia di tutti questi siti, quindi cerca in ognuno di loro delle parole che possano collegarsi in qualche modo alla nostra ricerca. Sarebbe un po’ la stessa cosa che potrebbe fare un bibliotecario rapidissimo in un’enorme biblioteca: vogliamo un libro che parli di termosifoni? Ci porterà in un istante tutti i libri che hanno quella parola dentro.

libreria_informazioni_online

Il secondo step è relativo al “meaning” quindi al significato della nostra ricerca. Il software è associato a un algoritmo di machine learning, ovvero un algoritmo che apprende automaticamente delle modalità per selezionare i migliori risultati tra tutti quelli esistenti: in questo modo ce li presenta “più in alto” sulla nostra schermata Google.
Così si arriva alla fase finale, raggiunta circa in 0.5 secondi: tutto l’indice di Google ci si apre davanti con una serie lunghissima di contenuti di vario tipo che possono rispondere alla nostra domanda di partenza.

Come funziona l'algoritmo della ricerca Google

Il velocissimo percorso che fa la nostra ricerca comporta una capacità di calcolo enorme: miliardi di domande vengono poste ogni giorno e circa il 15% di queste è sempre totalmente nuovo in quanto legato all’attualità e alle novità del momento. Il tentativo di Google è quello di fornire una risposta quanto più accurata possibile, organizzando miliardi di informazioni.
La parte difficile è proprio qui: l’algoritmo deve indicizzare i contenuti, quindi mapparli e ordinarli, e per farlo viene continuamente testato, valutato e aggiornato.

test_algoritmo

Quando si fanno i test si punta ad ottenere la più alta rilevanza del contenuto proposto nell’indice. L’idea è restituire grossomodo 4 tipologie diverse di informazioni (siti web, immagini, notizie e video) in modo che somiglino al risultato che proporrebbe un essere umano. Quindi, se cerchiamo come prima “koala”, troveremo subito immagini con l’animale piuttosto che informazioni su ristoranti che si chiamano così. L’algoritmo è calibrato sulla base delle preferenze degli utenti, ma anche sull’affidabilità delle informazioni e la provenienza geografica dei contenuti.

ricerca_su_google

Chiaramente però questo sistema può avere delle falle. Dunque entrano in gioco i valutatori.
I “search quality raters” sono infatti delle persone, che sono esterne a Google, addette a valutare la qualità delle ricerche. Hanno proprio un documento che si chiama “general guidelines” in cui sono tutte le linee guida generali da seguire per capire quando una ricerca è una “buona ricerca”, quindi se è utile alle persone. Le tre caratteristiche da ricercare sono autorevolezza, competenza e affidabilità. I valutatori insomma fanno delle ricerche e restituiscono un feedback a Google sulla loro validità.

L'hardware della ricerca Google: i data centers

Benissimo, abbiamo capito come si svolge la ricerca da parte del software…ma l’hardware? Dove avviene fisicamente tutto questo procedimento? Parliamo dei data center!
Un data center è un centro di elaborazione e stoccaggio di dati. Quelli che vengono utilizzati per collezionare tutte le informazioni che cerchiamo su Google sono di fatto degli edifici molto ampi che, in totale, ospitano milioni di server.

denise-at-the-dalles
Interno di un data center. Credits: Google.

Si tratta di luoghi piuttosto rumorosi e anche molto caldi perché il lavoro dei server ha queste due grosse conseguenze: il rumore e il caldo. I server sono come tanti computer che lavorano sempre e tutti insieme, per questo motivo i data center devono essere dotati anche di un impianto di raffreddamento.
Nei data center la cosa va più o meno così: si fa una copia (costantemente aggiornata) dell’intero web. E già solo questo è letteralmente assurdo: pensate alla mole di informazioni! Questa copia del web poi viene suddivisa in piccole parti e ogni parte è conservata in un server. Praticamente ogni data center è un enorme grande puzzle di tutto il web e tutti i server lavorano insieme, ognuno nella sua parte di web. Quindi quando arriva una nostra ricerca, questa verrà elaborata dal server specifico che contiene la parte di web che ci interessa.

st-ghislain-data-center-exterior
Esterno di un data center. Credits: Google

Ma come arriva la nostra ricerca fino a questi edifici? Per la maggior parte dei casi avviene tramite dei cavi sottomarini con cui letteralmente possiamo inviare segnali anche dall’altra parte del mondo a velocità sorprendenti. Questo meccanismo con i cavi funziona sia per l’invio della nostra ricerca ai data centers, che per rimandarci indietro la pagina con l’indice dei siti.
Ma se una ricerca dall’Italia dovesse ogni volta arrivare fino agli Stati Uniti, si perderebbe un sacco di tempo. Quindi una nostra ricerca arriva invece al data center a noi più vicino. Si è fatto in modo, insomma, di ridurre le distanze per aumentare la velocità di risposta.
Esistono infatti 22 Data Centers di proprietà di Google in tutto il mondo, e altri di aziende loro partner. 16 data center in Nord America, 3 in Sud America, 8 in Europa e 7 in Asia. 34 data center in totale.

Il dispendio energetico

Tutto questo turbinio di informazioni e dati implica chiaramente un dispendio energetico notevole. I data center, in generale di tutte le aziende che li possiedono, utilizzano circa l’1% dell’elettricità nel mondo, ovvero circa 200 terawatt di elettricità all’ora.
Secondo uno studio pubblicato su Nature nel 2018 i data center contribuiscono per circa lo 0,3% delle emissioni di anidride carbonica, mentre l’intero sistema ICT (ovvero dell’informazione e della comunicazione tecnologica) contribuisce per il 2% del valore totale delle emissioni di CO2.
Allo stesso tempo, stando a quanto dichiarato da Google, per i propri data center, l’obiettivo è riuscire a raggiungere entro il 2030 un'indipendenza totale dalle energie provenienti da combustibili fossili.

Avatar utente
Camilla Ferrario
Redattrice
L’universo è un posto strano e il modo che abbiamo di abitarlo cattura continuamente la mia attenzione. “Sii curiosa” è il mio imperativo: amo provare a ricostruire indizio per indizio il grande enigma in cui ci troviamo. Sono laureata in Filosofia, ho fatto la speaker in una web radio e adoro il true crime. Di cosa non posso fare a meno? Del dialogo aperto con gli altri e della pasta alle vongole.
Sfondo autopromo
Cosa stai cercando?
api url views