Seymour Cray aveva ragione
Per quanto possa sembrare strano, il vero problema, se vuoi inventare un motore di ricerca perfetto, non è tanto quello di dover scaricare un database di 13 miliardi di pagine web (tante sono, oggi). In fondo, se stipi migliaia di computer in un hangar e sei uno nato con Windows, ce la puoi fare serenamente. Il vero problema è un altro: una volta che hai isolato in mezzo a quell'oceano i tre milioni e passa di pagine web dove compare la parola lasagne, come fai a metterle in un qualsiasi ordine che faciliti la ricerca? È chiaro che se le sbatti lì, a caso, tutto il tuo lavoro è vano: sarebbe come far entrare un poveretto in una biblioteca in cui ci sono tre milioni di volumi (sulle lasagne) e poi dirgli: arrangiati un po' tu. Se non risolvi quel problema, il sapere rimane inaccessibile, e i motori di ricerca, inutili. Quando Brin e Page iniziarono a cercare una soluzione, avevano chiaro in mente che gli altri, quelli che già ci stavano provando, erano lontani dall'averla trovata. In genere, lavoravano sulla base di un principio molto logico, anzi troppo logico, e, a pensarci adesso, tipicamente pre-barbaro, quindi antico. In pratica si fidavano delle ripetizioni. Più volte compariva in una pagina la parola richiesta, più quella pagina saliva nelle prime posizioni. Concettualmente, è una soluzione che rinvia a un modo di pensare classico: il sapere è dove lo studio è più approfondito e articolato. Se uno ha scritto un saggio sulla lasagna, è probabile che il termine lasagna ricorra molte volte, e quindi è lì che il ricercatore viene spedito.
Naturalmente, oltre ad essere obsoleto, il sistema faceva acqua da tutte le parti. Un saggio scemo sulla lasagna, in quel modo, figurava molto prima di una semplice, ma utile, ricetta. Inoltre, come potevi difenderti dal sito personale del signor Mario Lasagna? Era un inferno. Ad Alta Vista (il motore di ricerca migliore, ai tempi) reagirono con una mossa che la dice lunga sul carattere conservatore di quelle prime soluzioni: pensarono di attivare degli editor che si studiassero i tre milioni di pagine sulle lasagne, e poi le mettessero in ordine di rilevanza. Anche un bambino avrebbe capito che non poteva funzionare. Però ci provarono, e per noi questo segna un'importante pietra miliare: è l'ultimo disperato tentativo di affidare all'intelligenza e alla cultura un giudizio sulla rilevanza dei luoghi del sapere. Da lì in poi, sarebbe stato tutto diverso. Da lì in poi, c'erano le terre dei barbari.
Per essere precisi, era il 1996. Più giravano tra i motori di ricerca esistenti, più Page e Brin si convincevano che si poteva fare molto meglio. Una volta ne scoprirono uno che non trovava se stesso. Si chiamava Inktomi. Se digitavi Inktomi non aveva risposte! Era urgente fare qualcosa.
Come abbiamo detto il problema principale era la classificazione dei risultati: come dare un ordine gerarchico alle tonnellate di pagine che venivano fuori se facevi una ricerca.
Quando andava bene, i motori di ricerca esistenti mettevano per prime le pagine in cui la parola cercata ricorreva più volte. Era sempre meglio che niente. Per questo Page passava il suo tempo a vedere come se la cavava il migliore di quei motori di ricerca, AltaVista. E fu lì che incominciò a notare qualcosa che attirò la sua attenzione. Erano parole o frasi sottolineate: se ci cliccavi sopra finivi direttamente in una pagina web. Si chiamavano links. Adesso noi li usiamo correntemente, ma ai tempi (dieci anni fa, pensa te), si stava giusto imparando a usarli. Tanto che AltaVista non sapeva nemmeno bene che farsene: li elencava, e si metteva il cuore in pace.
Per Page e Brin, invece, fu l'inizio di tutto. Furono tra i primi a intuire che i links non erano un utile optional della rete: erano il senso stesso della rete, il suo compimento definitivo. Senza links, Internet sarebbe rimasto un catalogo, nuovo nella forma, ma tradizionale nella sostanza. Coi links diventava qualcosa che avrebbe cambiato il modo di pensare.
Uno le intuizioni le può anche avere, ma poi il problema è crederci. Page e Brin ci credettero. Cercavano un sistema per valutare l'utilità delle pagine web di fronte a una determinata ricerca: lo trovarono in un principio apparentemente elementare: sono più rilevanti le pagine verso cui punta un maggior numero di links. Le pagine che sono più citate da altre pagine.
Fate attenzione. C'è un modo molto sbrigativo e inutile di capire questa intuizione: ed è allinearlo al principio commerciale per cui vale di più quello che vende di più. Di per sé è un principio ottuso, che conduce a un circolo vizioso: quel che vende di più avrà più visibilità e quindi venderà ancora di più. Ma in realtà Page e Brin non pensavano a quello. Avevano in mente tutt'altra cosa. Erano cresciuti in famiglie di scienziati e studiosi, e avevano in mente il modello delle riviste scientifiche. Lì, potevi valutare il valore di una ricerca dal numero di citazioni che ne facevano altre ricerche. Non era una faccenda commerciale, era una faccenda logica: se alcuni risultati erano convincenti, erano usati da altri ricercatori, che dunque li citavano. Page e Brin erano convinti che si potessero considerare i links come delle citazioni di un saggio scientifico. Per cui un sito era attendibile e utile nella misura in cui altri siti lo segnalavano. Detta così, ammetterete, suona già più sottile. Azzardata, ma sottile.
La loro intuizione divenne qualcosa di davvero dirompente quando si decisero a fare il passo dopo. Capirono che, a voler essere ancora più efficaci, si sarebbe dovuto tener conto del valore del sito da cui partiva il link. In pratica, e tornando al caso delle riviste scientifiche, se a citarti è Einstein è un conto, se a farlo è tuo cugino, è un altro. Come stabilire, nel mare magnum del web, chi era Einstein e chi tuo cugino? La risposta che diedero non faceva una piega: Einstein è il sito verso cui punta il maggior numero di links. Dunque un link che parte da Yahoo è più significativo di un link partito dal sito personale di Mario Rossi. Non perché Rossi sia un fesso o abbia un nome meno bello: ma perché ci sono migliaia di links che, da ogni parte, puntano a Yahoo: verso Rossi, se va bene, ce ne sono un paio (la figlia, il circolo delle bocce).
Google nasce da lì. Dall'idea che le traiettorie suggerite da milioni di links avrebbero scavato i sentieri guida del sapere. Restava da trovare un algoritmo di mostruosa difficoltà per tenere a bada quel calcolo vertiginoso di links che si intrecciavano: ma a quello ci pensò Page, che aveva un cervello matematico. Oggi, quando cercate "lasagne" su Google, quello che trovate è una lista infinita di cui leggerete solo le prime tre pagine: in quelle tre pagine ci sono i siti che vi servono, e Google li ha individuati incrociando molti tipi di valutazione: la ricetta è segreta, ma tutti sanno che l'ingrediente principale, e geniale, è dato da quella teoria dei links.
Alessandro Baricco
I Barbari - 2008



