tiistai 8. maaliskuuta 2016

Googlen liioitteleva hakutulosten määrä

Google antaa aina liian suuren määrän hakutuloksia eli sivuja, joilla hakusanat esiintyvät. Tämän tosin huomaa melko nopeasti siirtymällä seuraavalle hakutulossivulle, jolla esitetään pienempi määrä hakutuloksia kuin edellisellä sivulla. Jäljellä olevien hakutulosten määrä on selvästikin pienempi kuin sivunvaihdosta aiheutunut kymmenen tuloksen vähennys. Googlen liioittelu voi olla jopa useita dekadeja eli sata- tai tuhatkertainen.

Koska Google käyttää haussa ns. sumeaa logiikkaa, se aiheuttaa suurta liioittelua. Hakusanoista käytetään kaikenlaisia variantteja, mikä lisää väärien hakutulosten määrää ja usein niin, että suurin osa hakutuloksia on vääriä.

Hyvä esimerkki Googlen suunnattomasta liioittelusta on sana ”quieton”. Google antaa sille ”vaatimattomat” noin 4 930 000 tulosta. Tyhmemmänkin pitäisi ymmärtää, että se ei voi olla mahdollista. Jos yritys perustettiin vajaa vuosi sitten, on täysi mahdottomuus, että olisi olemassa noin 4,9 miljoonaa erilaista sivua, joilla yrityksen nimi esiintyisi.


Jos ”quieton” laitetaan lainausmerkkeihin, Google käyttää pelkästään tuota merkkijonoa hakusanana ja jättää kaikki variantit pois. Nyt tulosten määrä on enää noin 38 100, joka sekin on aivan liikaa. Menemällä eteenpäin hakutulossivuilla saadaan selville hakutulosten todellinen määrä, joka onkin niin pieni kuin 260.


Noista 260 tuloksesta osa on sellaisia, joilla ei käytännössä ole juuri mitään tekemistä itse yrityksen kanssa.

Jos verrataan 260 tulosta 4,9 miljoonaan tulokseen, havaitaan, että Googlen liioittelu on log(4900/0,26) = 4,3 eli yli neljä dekadia. Lainausmerkkien kera liioittelu on 2,2 dekadia.

Ilman lainausmerkkejä hakutulosten todellinen määrä on vain 315.


On epäselvää, miksi Google on ohjelmoitu antamaan suunnattomasti liioitellun hakutulosten määrän. Ehkäpä Google haluaa sillä korostaa omaa ”hyvyyttään” verrattuna muihin hakukoneisiin, jotka antavat vähemmän mutta oikeampia hakutuloksia. Google tosin käyttää sanaa ”noin” ilmoittaessaan hakutulosten määrän. Googlen mielestä 4,9 miljoonaa on ”noin” 260 tai 315.

Ei kommentteja:

Lähetä kommentti