Sanahaku

Hakukoneet ovat hyviä renkiä, mutta huonoja isäntiä. Ilman riittävää tietämystä hakukoneen toiminnoista tiedonetsijä eksyy nopeasti epäolennaisen informaation ryteikköön. Teknisen tietämyksen lisäksi sanahakua käytettäessä tarvitaan ennakkotietoja haettavasta asiasta.

Tiedonhaun yhteydessä oppilaat on hyvä harjaannuttaa avainsanaluetteloiden laadintaan, sillä tällaiset avainsanalistat helpottavat hakujen rajausta. Esimerkki: satojen tuhansien Virtasten joukosta pitäisi löytää haluttu Virtanen. Minkälaisten hakusanojen avulla hakua voitaisiin tarkentaa?

Miten sanahaku toimii?

Sanahaussa haetaan merkkijonoja, joihin voidaan tehdä erilaisia rajauksia ja lisäyksiä. Yleensä sanahaussa on mahdollista käyttää joko ns. perushakua tai ns. lisähakutoimintoa (advanced). Viime vuosiin asti hakukoneiden hakukieli on perustunut yleensä ns. altavistan standardiin, jossa hakusanojen väliin ripotelluilla komennoilla määrätään sanat mukaan tai pois hakutulosjoukosta. Tällä hetkellä tehokkaimmiksi hakukoneeksi mainostettu  Google on muuttanut Internetin tiedonhakua entistä suoraviivaisemmaksi. Googlen hakulogiikassa haetaan
 
1) sanojen yhdistelmää (fraasia)
2) asiakirjoja, joissa esiintyvät kaikki sanat
3) jokin hakusana esiintyy

Kaikkien hakukoneiden ongelmana on se, että hakukoneet eivät ole tarpeeksi kattavia. Tehokkaimmatkin hakukoneet kattavat vain n. 20 % kaikista www-sivuista. Hakukoneiden tavoittamattomissa olevia www-sivuja kutsutaan nimellä ”Invisible Web” tai ”Deep Web”. Näistä sivuista suurin osa kuuluu tietokantoihin, joiden sivustoihin ei ole linkkejä. Tällaisia ovat tieteelliset tai tekniset tietokannat tai vaikkapa urheilun tulospalvelut.

Lisäongelmia tiedon etsijälle aiheuttaa suomenkielisten sanojen taivutus. Tällä  hetkellä hakukoneet eivät kunnolla tunnista sananvartaloita. (esimerkki sisällisso tai kekko) Etsittävä sana on siis kirjoitettava siinä muodossa kuin sen halutaan tekstissä esiintyvän. Suositeltavaa on aloittaa haku sanan perusmuodolla (sisällissota, kekkonen)

Mitä hakutulos kertoo?

Tiedonhaun tehokkuuden kannalta on syytä käydä oppilaiden kanssa läpi millä perusteella hakukone tuloksensa kertoo; ts. millä perusteella hakukone priorisoi hakutuloksessa esiintyvät www-sivut.

Altavista 

Google

Sanan esiintyminen otsikossa, metasanana tai sanan esiintyminen useita kertoja dokumentin sisällä vaikuttavat sijoittumiseen hakutuloksissa. 

Hakutuloksen kärjessä sivut, joihin paljon linkkejä; Olettamuksena tässä on siis mitä parempi sivu, sitä enemmän linkkejä ja sitä parempi listasijoitus hakutuloksissa

Lisäksi on syytä käydä läpi mitä tietoja hakukoneen yksittäinen osuma kertoo. Tulosten esittämisessä on tässäkin mielessä eroja. Google välittää seuraavat tiedot  (hakusanoina öljykriisi suomi)

Maksettu näkyvyys

Edellä mainittu hakutulosten priorisointi ei kuitenkaan pidä aivan täysin paikkaansa, sillä kaikki suuret hakukoneet tarjoavat ns. maksettua näkyvyyttä. Esimerkiksi Altavistassa ja Googlessa hakusana ”e-oppiminen” sijoittaa hakutulosten kärkeen yrityksiä, jotka ovat maksaneet sijoittumisestaan kärkeen. Maksettu näkyvyys vääristää näin objektiivisia hakutuloksia.