Come funziona Google? Le rivelazioni del processo per abuso di posizione dominante negli USA

Google ci ha preso in giro fino ad oggi? Content is king era solo una grossa bugia?

Ho letto di recente un articolo su searchengineland.com, in questa pagina cerco di riassumerne i concetti ed il mio pensiero in merito agli argomenti trattati. Premetto anche che il tutto fa riferimento a documentazione risalente agli anni 2015/2016, per cui può benisismo essere che oggi sia tutto cambiato.

Però, se uno ti prende in giro per anni, è ancora credibile?

Immaginate di gestire il più grande motore di ricerca al mondo, che ogni giorno deve dare un senso a miliardi di query degli utenti e selezionare i risultati migliori da un oceano sterminato di contenuti sul web. Come potreste anche solo iniziare a capire di cosa parlano tutti quei documenti che volete indicizzare e come fare per soddisfare le intenzioni di ricerca delle persone?

Beh, a quanto pare nemmeno Google lo sa davvero. Siamo sempre stati convinti che dietro l’apparente “magia” di Big G ci fosse una comprensione profonda di significati e correlazioni tra parole e contenuti, ma a sorpresa l’azienda stessa ammette candidamente: “Non capiamo davvero i documenti che indicizziamo“.

OK, lo ripeto per chi non avesse ben capito la gravità dell’affermazione:

Non capiamo davvero i documenti che indicizziamo“.

Google non legge i contenuti che propone nei risultati di ricerca

In sostanza, stando a quanto emerso recentemente da documenti del processo per abuso di posizione dominanteantitrust contro la società, il gigante di Mountain View non è poi così gigantesco, anzi, è piuttosto miope e confusionario.

Google stessa dichiara di non riuscire a leggere e comprendere appieno i contenuti che poi propone agli utenti come risultati di ricerca pertinenti alle loro domande. Roba da matti vero?

E noi che pensavamo ci fosse dietro chissà quale tecnologia di intelligenza artificiale iper-evoluta in grado di assimilare ogni sfumatura di significato dai documenti che indicizza. Ci hanno intortato con BERT, con MUM, ma alla fine è solo una mera questione di click, un po’ come il passaparola nella piazza del mercato.

Già, perché Google candidamente alza le braccia e dice “non ce la facciamo a capirci granché di tutto quello che abbiamo sul web“.

La “magia” di Big G? Guardare come gli utenti reagiscono ai risultati

E allora, ci chiediamo, come accidenti fa Google a stabilire la rilevanza e la qualità dei contenuti che poi propone nelle SERP per le diverse ricerche? Se non è in grado di leggerli e comprenderli appieno?

Ebbene, il segreto sta nell’osservare le reazioni delle persone. In parole povere, Google non guarda i documenti, ma guarda gli utenti. Registra le loro risposte ai risultati proposti e da quello deduce indirettamente la bontà dei contenuti stessi.

Un meccanismo un po’ contorto no?
Per stabilire se un contenuto vale, non lo valuto direttamente, ma registro se la gente ci clicca sopra o meno. Se la reazione è positiva, deduco che il documento sia valido. Viceversa, se non ho molti click, è probabilmente da scartare.

I click degli utenti come metro di giudizio per stabilire rilevanza

Insomma, i click sembrano essere la metrica principale che Google adotta per interpretare interessi e intenzioni degli utenti. Un documento con tanti click viene premiato e posizionato in alto, mentre contenuti ignorati dagli utenti vengono penalizzati e retrocessi.

Un sistema un po’ contorto e indiretto per valutare la qualità di ciò che si indicizza, non trovate? Affidarsi alle reazioni statistiche della massa piuttosto che applicare criteri oggettivi di valutazione dei contenuti in sé.

In poche parole, “content is king” va a farsi benedire.

I limiti dell’approccio di Google: difficile interpretare i singoli casi

Certo, Google ammette che questo metodo presenta delle falle, l’associazione tra comportamento collettivo degli utenti e qualità effettiva dei risultati di ricerca è tutt’altro che solida e prevedibile.

Servono volumi enormi di traffico di ricerca per identificare tendenze statistiche indicative di interessi e preferenze. Mentre è molto difficile interpretare singoli casi e interazioni specifiche con cui trarre deduzioni universalmente valide.

Ex ingegnere Google conferma: i click contano per i ranking

Ad ogni modo, al di là delle ammissioni imbarazzanti emerse dai documenti processuali che Google tenderebbe normalmente a tenere riservate, Eric Lehman, un ex ingegnere che ha lavorato in azienda per 17 anni, ha pubblicamente confermato che i click sono sempre stati uno degli elementi essenziali su cui si basa il posizionamento nei risultati di ricerca.

Google minimizza: “Clic utili soprattutto per personalizzare ricerche”

Davanti alle rivelazioni, Big G prova un po’ a minimizzare, sostenendo che i click non sono impiegati come fattore diretto di ranking, quanto piuttosto come meccanismo per personalizzare i risultati individuali in base alla cronologia di ricerca di ciascun utente.

Insomma, Google ci avrebbe preso in giro (sorpresa sorpresa) e i click conterebbero eccome per posizionare i contenuti proposti agli utenti. Certo, in che misura non è chiaro, e l’azienda prova a minimizzare la cosa.

Tra l’altro, anche il fatto che “i segnali dal web” (traducasi “link”) siano fattori di ranking è stato appurato nello stesso dibattito:

Link-segnale-ranking

Ma a questo punto viene da chiedersi: possiamo ancora fidarci ciecamente del nostro buon vecchio motore di ricerca preferito o dobbiamo iniziare a guardarlo con un po’ di sano scetticismo?

Io la faccio da tempo ormai, anche se purtroppo è il numero uno incontrastato del settore.

L’ascesa inarrestabile dell’intelligenza artificiale

Le rivelazioni sulle lacune di Google nella comprensione profonda dei contenuti web potrebbero sembrare sorprendenti, vista la fama di leader tecnologico dell’azienda, ma è anche bene ricordare che lo sviluppo dell’intelligenza artificiale, e in particolare del deep learning, è un campo vastissimo e in rapida evoluzione.

Se oggi i sistemi AI mostrano ancora limiti nell’interpretazione del linguaggio umano, gli investimenti miliardari in ricerca e i progressi degli ultimi anni lasciano pensare che queste capacità saranno presto alla portata delle macchine.

Aziende come Google stessa, che finora sembra abbia solo fatto finta di capire cosa scriviamo, con le loro immense risorse puntano ad avere algoritmi sempre più capaci di comprendere testi, immagini, video e a conversare in linguaggio naturale.
In futuro (o nell’immediato presente), quindi, potrebbe anche essere che Google arrivi a fare quello che da anni ci propina come una verità assodata ma che in realtà era solo una bugia ben raccontata.

L’ascesa dell’AI è inarrestabile e anche un colosso come Google deve tenerne il passo, pena rischiare di essere presto sorpassato dai concorrenti. La sfida per primeggiare nello sviluppo di intelligenza artificiale è più aperta che mai.