TKK:n kotisivulleYTK:n kotisivulle

 

 

 

 

Yhdyskuntasuunnittelun tiedonlähteet - Pitkä kurssi

   
4.3 INTERNETIN HAKUVÄLINEET SISÄÄNTULOSIVULLE

 

TEHTÄVÄOHJEESEEN

Hakukoneet

Internetin tarjoamat hakuvälineet jaetaan useimmiten kahteen ryhmään - hakukoneisiin ja aihehakemistoihin - vaikka ne monessa tapauksessa ovat muistuttavat toisiaan. Niistä käytetään nimityksiä hakuohjelmat, hakukoneet ja hakurobotit. Ne tarjoavat samankaltaisia palveluita: aihehakemistoihin on tullut hakutoiminto ja hakukoneisiin on liitetty luokitettuja linkkikokoelmia. Mukana saattaa olla uutispalvelua, ilmaisia sähköpostiosoitteita, uutuustiedotteita, räätälöitäviä aloitussivuja, jolloin voidaankin jo puhua hakuportaaleista.

Hakukoneet - kuten Google ja AltaVista - ovat tiedonhakupalveluita, joiden avulla voi hakea kaikentyyppistä tietoa mistä aiheesta tahansa. Hakukoneen avulla ei kuitenkaan voi hakea kaikkia mahdollisia Internetin verkkodokumentteja, vaan hakukoneella tehty haku kohdistuu verkkosivuihin, joita koskeva tieto on tallennettu hakukoneen tietokantaan. Hakukoneeksi kutsuttu palvelu koostuukin kolmesta osasta: indeksoivasta robotista, tietokannasta ja hakukoneesta. Indeksoiva robotti kerää sivuja automaattisesti "hakukoneen" tietokantaan, josta tiedohakija tietoa varsinaisesti etsii.

 

Tiedonhaku hakukoneilla

Hakukoneet tarjoavat yleensä ensin mahdollisimman yksinkertaista hakumahdollisuutta. Useimpiin hakukoneisiin on luotu myös edistyneempi hakulomake, jonka avulla haun voi tehdä esim. tarkalla ilmaisulla tai kohdistaa sen tiettyyn tiedostotyyppiin, kuten PDF-dokumentteihin. Yleisesti käytetyillä tai yksittäisillä sanoilla haettaessa hakutulos on tavallisesti hyvin suuri, ettei edes hakutoksen verkkosivujen järjestäminen oletetun relevanssin mukaan auta löytämään osuvia sivuja tuloksen ensimmäisten verkkosivujen joukosta.

Hakukoneiden käyttäminen on hyvin samankaltaista, mutta silti kannattaa tutustua hakukoneiden omiin ohjeisiin.. Lisätietoja hakemisesta löytyy palveluiden Ohjeet-, Help-, FAQ- tai Advanced Search- tai Power Search -linkin takaa. Käytön opettelu säästää aikaa ja auttaa parempien hakutulosten saamisessa. Kun yhtä hakukonetta on käyttänyt säännöllisesti, voi tutustua seuraavaan.

Hakukoneilla tiedonetsintä onnistuu parhaiten, kun
- on löydettävä tarkasti määritelty dokumentti, esim. Yhdyskuntasuunnittelu ammattina
- haetaan verkkosivuja, joilta löytyy tietty merkkijono kuten henkilön tai paikan nimi
- hakuaihe on riittävän tuttu, jolloin tarkat hakusanat ovat tiedossa tai helposti löydettävissä

Hakukoneiden ongelmia
- asiaan kuulumattomiaen dokumenttien löytyminen, varsinkin, jos hakulauseke ei ole muotoiltu tarkasti
- haussa mainittujen sanojen esiintyminen vain sivumainintana
- dokumenttien sisällön kontrolloimattomuus
- hakutuloksen toimimattomat linkit tai sama linkki useampaan kertaan

 

Hakuohjeita tiivistetysti

Hakutuloksen suuruuteen ja sisällön määrittelyyn kannattaa panostaa.

Hakutulksen tarkkuutta parantaa haun aloittaminen mahdollisimman rajaavalla hakusanalla ja täsmällisellä hakulauseella, esim. fraasilla tai erikoistermillä. Jotkut hakukoneet hyväksyvät kokonaisen lauseen "miten asennan Windows XP:n", jolla saa paremman tuloksen kuin kirjoittamalla vain "Windows".
Yleisimpiä hakusanoja on hyvä välttää (esim. Internet), samoin artikkeleita ja prepositioita.
Boolen-operaaattorien (AND,OR,NOT) käyttöä yksinkertaisessa hakumahdollisuudessa kannattaa välttää, ellei ole varma, että hakukone mahdollistaa sen.

Hakutuloksen järjestykseen yritettävä vaikuttaa haun muotoilulla, koska automaattisesta järjestämisperiaatteesta ei saa tarkkaa tietoa.

Haun kannalta tärkeimmät sanat kirjoitetaan alkuun.

Edistyneempi haku ja rajausmahdollisuudet auttavat monimutkaisemmissa hauissa ja hakutuloksen parantamisessa.

Monet hakukoneet tarjoavat aika- ja kielirajausta, maantieteellistä ja tiedostotyypin rajausta. Plus- ja miinus-merkeillä voi joissakin tapauksissa painottaa / estää tietyn sanan esiintymisen hakutuloksessa. ym.
Edistynyt haku (power, advanced, expert jne.) tarjoaa yleensä laajan valikoiman rajausmahdollisuukisa
Hakutulosta pystyy monesti muokkaamaan ja järjestämään uudelleen.

Erikoishakupalveluiden käyttö tehokasta, kun etsitään tietyntyyppistä tietoa: keskusteluryhmät, kuvat, paikka kartalla.

 

Haun rajaamiseen ja tarkentamiseen välineitä

Hakukoneen ominaisuuksista riippuu mitä keinoja ja millä tavalla tiedonhakua voi rajata tai tarkentaa. Hakukoneet ovat melko samankaltaisia, joten niistä löytyy hyvin samoja ominaisuuksia. Kannattaa kuitenkin aina tarkistaa hakukoneen ohjeista mahdollisuudet tarkemmin.

Fraasihaku (phrase search)
hakuehtona on sanojen peräkkäinen esiintyminen. Haussa saatetaan käyttää lainausmerkkejä. Fraasin voi myös yhdistää muihin hakuehtoihin. Monesti toiminto löytyy edistyneemmästä hakutoiminnosta.

Sanan katkaisua (truncation)
voi käyttää monissa hakukoneissa. Jos ei ole täysin varma sanan muodosta tai haluaa mukaan eri taivutusmuotoisia sanoja, voi käyttää katkaisumerkkiä (yleensä *).

Boolen operaattorit
Englanninkielisten Boolen operaattoreiden AND, OR, NOT sijasta joissakin suomenkielisissä palveluissa voi käyttää sanoja JA, TAI, EI. Boolen operaattoreita ei voi kuitenkaan käyttää kaikissa palveluissa. Monesti operaattoreita ei tarvitse kirjoittaa itse, vaan ne löytyvät valmiina edistyneemmästä hakutoiminnosta. Operaattori-haun voi myös yhdistää muihin tarkentaviin hakumahdollisuuksiin.

Hakukentät (field search)
Useimmissa Internetiin luoduissa hakupalveluissa, myös hakukoneissa, on erilaisia mahdollisuuksia tarkentaa hakua kohdistamalla haku tiettyyn tietoon verkon dokumenteissa. Nämä mahdollisuudet löytyvät hakukoneissa yleensä kehittyneemmästä hakutoiminnosta. Haun rajausmahdollisuudet laitetaan tavallisesti valikoihin valmiiksi. Tarkempaa tietoa hakupalveluiden hakukentistä.

Hakukieli (search by language)
Useimmissa hakupalveluissa voi valita hakukielen ja kielivalikoima voi suurimmissa palveluissa vaihdella kymmenen jopa kolmenkymmenen vaihtoehdon välillä. Monesti haun voi suoraan rajata koskemaan vain esim. suomenkielisiä verkkosivuja.

Tiedostohaku (esim. pdf-teidostot, kuvahaku, musiikkitiedostot)
Haun voi kohdistaa myös eri tiedostotyyppeihin, kuten .pdf, .MP3 , .ftp , .wav. Mahdollisuudet voi valita yleensä edistyneemmästä hakutoiminnosta suoraan.

 

Hakukoneiden toimintaperiaatteista tarkemmin

Hakukoneen hakurobotiksi tai hämähäkiksi kutsuttu ohjelma (spider, crawler, robot, bot) vierailee selaimen tapaan Internetin palvelimilla olevilla verkkosivuilla. Se tallentaa hakukoneen tietokantaan tiedonhakua varten sivuilla olevasta informaatiosta osia eli indeksoi sivun informaatiota tietokantaan. Hakukoneen hakutuloksen koko riippuu hakurobotin tehokkuudesta ja tietokannan koosta.

Tallennetun tiedon määrä, sisältö ja päivitysaikataulu riippuvat indeksoivasta ohjelmasta. Toiset robotit indeksoivat koko tekstin, toiset otsikon ja pari ensimmäistä lausetta tai dokumentissa olevat URL-osoitteet ja muutamat indeksoivat myös META-elementin tai muita piiloelementtejä. Myös indeksoinnin syvyydessä on eroja. Toiset robotit indeksoivat vain "ylimmän tason" dokumentit, toiset taas kaikki dokumentit syvimmästä tasosta lähtien. Robotit siirtyvät dokumentista toiseen linkkejä pitkin, jonka seurauksena eniten viitatut dokumentit tulevat varmimmin indeksoiduksi. Mm. näistä syistä sama haku Googlella tai Altavistalla voi tuottaa erilaisen hakutuloksen. Tiedonetsijä voi hakukoneen avulla hakea tietoa vain hakukoneen tietokantaan sivuista tallennetusta tiedosta.

Hakukone on käyttöliittymä tietokannan sisältämään informaatioon, jonka avulla tiedonetsijä tekee hakuja tietokantaan ja saa hakutuloksen tutkittavakseen. Hakukone etsii tietokannastaan linkkejä, jotka vastaavat hakijan käyttämiä hakusanoja. Hakukone järjestää hakutuloksen yleensä tärkeysjärjestykseen (relevance).

Periaatteet, joilla hakukone määrittää tärkeysjärjestyksen ja kriteerit, joilla verkkosivut hakutulokseen päätyvät, riippuvat hakukoneesta. Hakukoneista ei yleensä saa kovin tarkkaa tietoa siitä, millä periaatteilla tulos järjestetään. Tätä perustellaan sillä, että sivujen tekijät käyttäisivät tietoa hyödykseen saadakseen sivunsa hakutulosluettelon alkuun.

On hyvä myös muistaa, että kaikkea hakukoneet eivät indeksoi - yleensä esimerkiksi erillisten tietokantojen sisältöä tai dynaamisesti muodostuvia tietokantapohjaisia palveluja ja sivuja ei indeksoida.

Koska hakukoneiden toiminta perustuu automatiikkaan ja tietoon, jota ei ole tarjolla, on hakijan vastuulla tarkastella haussa saamansa aineiston luotettavuutta. Nykyisin käyttössä olevin automaattisin välinein on vaikeaa arvioida aineiston laatua, informaation kontekstia ja sopivuutta tiedonetsijän tarpeisiin. Mikään hakukone ei ole ylivertaisesti toisia parempi; katteessa, tulosten esittämistavassa, päivitystiheydessä yms. on eroja. Kokemus opettaa valitsemaan eri hakupalvelujen välillä. Jos haluaa kattavaa hakua tai varmistua tuloksestaan, kannattaa käyttää useampaa hakupalvelua.

Google esimerkkinä

 

Hakukoneiden erityispalveluista

Internetin hyödyntämiseen kehitetyt välineet pyrkivät uusia palveluita luomalla tarjoamaan parempia välineitä informaation etsintään. Erityistarpeisiin kehitettyjä välineitä kaivataankin, koska informaation määrä Internetissä kasvaa jatkuvasti. Erityisesti asiatiedon löytyminen vaikeutuu, koska Internetissä on tarjolla eniten kaupallisia palveluita - erityisesti aikuisviihdettä. Tieteellisen tiedon osuuden arvioidaan olevan muutama prosentti.

Palveluita luodaan tietyn aihe-alueen tai dokumenttityyppin hakuun. Hakukoneista löytyy monesti keskusteluryhmähaku, sähköpostiosoitehaku-, kuvahaku- tai esim. karttahakupalvelu. Googlen avulla pystyy rajaamaan haun esim. vain PDF-tiedostomuodossa julkaistuun aineistoon, joka on luontevaa, jos uskoo, että aineisto, jota tarvitsee olisi esim. PDF-muotoisia raportteja.

Kuvahaun ja keskusteluryhmähaun kaltaisten erityispalveluiden idea on siinä, että aivan erityisen median aineisto erottuu muusta Internet-aineistosta, jolloin on todennäköisesti helpompi löytää haluamansa - tietokantoihin indeksoidaan vain tietyn tyyppisiä dokumentteja. Jos haetaan tietoa jostain aivan uudesta asiasta, voi haun rajaaminen esimerkiksi keskusteluihin tuottaa tulosta.

Esimerkiksi Google on kehittänyt Googlen Groups -uutisryhmähakupalvelun. Sen avulla voi etsiä vastausta mihin asiaan tahansa, josta olettaa keskustelua käydyn. Viesteissä saattaa olla hyvin yksityiskohtaisia vastauksia ongelmiin, ovathan viestien kirjoittajat usein asialleen omistautuneita.

Google Groups: http://groups.google.com/

Hakukoneita voi hyödyntää myös omien sivujen markkinoinnissa. Niissä on yleensä toiminto, jolla pystyy itse lisäämään sivun hakukoneen tietokantaan. Lisäksi voi käyttää Open Directory Project -palvelua, jonka hakemistoa käytetään mm. Googlen ylläpidossa: http://dmoz.org/add.html

 

Metahakukoneet

Internetissä on hakupalveluita, jotka tekevät ns. monihakuja eli hakevat monen hakupalvelun tietokannasta samalla kertaa (Meta-search Engines). Ne yhdistävät ja analysoivat muiden hakukoneiden hakutulokset ja antavat yhdistetyn hakutuloksen selattavaksi.

Vivisimo - antaa koko hakutuloksen lisäksi tuloksen aihealueisiin jaoteltuna
http://vivisimo.com/

ProFusion - kertoo mitä hakukoneita se käyttää tiedonhaussa
http://www.profusion.com/

Ixquick :
http://www.ixquick.com/

Dogpile:
http://www.dogpile.com/

 

Lisäinfoa hakukoneista

Hakukoneisiin liittyvää tietoa löytyy lisää esim. Search Engine Watchin verkkosivulta. Hakukoneiden ominaisuuksia käsittelevät artikkelit saattavat olla hyödyllisiä http://searchenginewatch.com/

Internet-aineistojen kasvun vuoksi syntyy jatkuvasti myös uusia hakukoneita, jotka pyrkivät korjaamaan aiempien hakukoneiden puutteita. Search Engine Watchin verkkosivulta löytyy erityistarpeisiin hakukoneita ja niiden palveluita http://searchenginewatch.com/links/article.php/2156351

Esimerkiksi Scirus-hakukone keskittyy tieteellisen tiedon etsintään http://www.scirus.com/

 

  Sivun alkuun
Sisällysluetteloon
  MUITA LINKKEJÄ :
 

YTK:n tietopalvelu

 

sivu on päivitetty 11.09.2005 palaute maria.soderholm@tkk.fi