|
|||
|
|
||
4.3 INTERNETIN HAKUVÄLINEET | SISÄÄNTULOSIVULLE | ||
|
TEHTÄVÄOHJEESEEN | ||
Internetin tarjoamat hakuvälineet
jaetaan useimmiten kahteen ryhmään - hakukoneisiin ja aihehakemistoihin
- vaikka ne monessa tapauksessa ovat muistuttavat toisiaan. Niistä käytetään nimityksiä hakuohjelmat, hakukoneet ja hakurobotit.
Ne tarjoavat samankaltaisia palveluita: aihehakemistoihin on
tullut hakutoiminto ja hakukoneisiin on liitetty luokitettuja linkkikokoelmia.
Mukana saattaa olla uutispalvelua, ilmaisia sähköpostiosoitteita,
uutuustiedotteita, räätälöitäviä aloitussivuja,
jolloin voidaankin jo puhua hakuportaaleista.
Hakukoneet - kuten Google ja AltaVista - ovat tiedonhakupalveluita, joiden avulla voi hakea kaikentyyppistä tietoa mistä aiheesta tahansa. Hakukoneen avulla ei kuitenkaan voi hakea kaikkia mahdollisia Internetin verkkodokumentteja, vaan hakukoneella tehty haku kohdistuu verkkosivuihin, joita koskeva tieto on tallennettu hakukoneen tietokantaan. Hakukoneeksi kutsuttu palvelu koostuukin kolmesta osasta: indeksoivasta robotista, tietokannasta ja hakukoneesta. Indeksoiva robotti kerää sivuja automaattisesti "hakukoneen" tietokantaan, josta tiedohakija tietoa varsinaisesti etsii.
Hakukoneet tarjoavat yleensä ensin mahdollisimman yksinkertaista hakumahdollisuutta. Useimpiin hakukoneisiin on luotu myös edistyneempi hakulomake, jonka avulla haun voi tehdä esim. tarkalla ilmaisulla tai kohdistaa sen tiettyyn tiedostotyyppiin, kuten PDF-dokumentteihin. Yleisesti käytetyillä tai yksittäisillä sanoilla haettaessa hakutulos on tavallisesti hyvin suuri, ettei edes hakutoksen verkkosivujen järjestäminen oletetun relevanssin mukaan auta löytämään osuvia sivuja tuloksen ensimmäisten verkkosivujen joukosta. Hakukoneiden käyttäminen on hyvin samankaltaista, mutta silti kannattaa tutustua hakukoneiden omiin ohjeisiin.. Lisätietoja hakemisesta löytyy palveluiden Ohjeet-, Help-, FAQ- tai Advanced Search- tai Power Search -linkin takaa. Käytön opettelu säästää aikaa ja auttaa parempien hakutulosten saamisessa. Kun yhtä hakukonetta on käyttänyt säännöllisesti, voi tutustua seuraavaan. Hakukoneilla tiedonetsintä onnistuu parhaiten,
kun Hakukoneiden ongelmia
Hakutuloksen suuruuteen ja sisällön määrittelyyn kannattaa panostaa.
Hakutuloksen järjestykseen yritettävä vaikuttaa haun muotoilulla, koska automaattisesta järjestämisperiaatteesta ei saa tarkkaa tietoa.
Edistyneempi haku ja rajausmahdollisuudet auttavat monimutkaisemmissa hauissa ja hakutuloksen parantamisessa.
Erikoishakupalveluiden käyttö tehokasta, kun etsitään tietyntyyppistä tietoa: keskusteluryhmät, kuvat, paikka kartalla.
Haun rajaamiseen ja tarkentamiseen välineitä Hakukoneen ominaisuuksista riippuu mitä keinoja ja millä tavalla tiedonhakua voi rajata tai tarkentaa. Hakukoneet ovat melko samankaltaisia, joten niistä löytyy hyvin samoja ominaisuuksia. Kannattaa kuitenkin aina tarkistaa hakukoneen ohjeista mahdollisuudet tarkemmin. Fraasihaku (phrase search) Sanan katkaisua (truncation) Boolen operaattorit Hakukentät (field
search) Hakukieli (search by language) Tiedostohaku (esim. pdf-teidostot, kuvahaku,
musiikkitiedostot)
Hakukoneiden toimintaperiaatteista tarkemmin Hakukoneen hakurobotiksi tai hämähäkiksi kutsuttu ohjelma (spider, crawler, robot, bot) vierailee selaimen tapaan Internetin palvelimilla olevilla verkkosivuilla. Se tallentaa hakukoneen tietokantaan tiedonhakua varten sivuilla olevasta informaatiosta osia eli indeksoi sivun informaatiota tietokantaan. Hakukoneen hakutuloksen koko riippuu hakurobotin tehokkuudesta ja tietokannan koosta. Tallennetun tiedon määrä, sisältö ja päivitysaikataulu riippuvat indeksoivasta ohjelmasta. Toiset robotit indeksoivat koko tekstin, toiset otsikon ja pari ensimmäistä lausetta tai dokumentissa olevat URL-osoitteet ja muutamat indeksoivat myös META-elementin tai muita piiloelementtejä. Myös indeksoinnin syvyydessä on eroja. Toiset robotit indeksoivat vain "ylimmän tason" dokumentit, toiset taas kaikki dokumentit syvimmästä tasosta lähtien. Robotit siirtyvät dokumentista toiseen linkkejä pitkin, jonka seurauksena eniten viitatut dokumentit tulevat varmimmin indeksoiduksi. Mm. näistä syistä sama haku Googlella tai Altavistalla voi tuottaa erilaisen hakutuloksen. Tiedonetsijä voi hakukoneen avulla hakea tietoa vain hakukoneen tietokantaan sivuista tallennetusta tiedosta. Hakukone on käyttöliittymä tietokannan sisältämään informaatioon, jonka avulla tiedonetsijä tekee hakuja tietokantaan ja saa hakutuloksen tutkittavakseen. Hakukone etsii tietokannastaan linkkejä, jotka vastaavat hakijan käyttämiä hakusanoja. Hakukone järjestää hakutuloksen yleensä tärkeysjärjestykseen (relevance). Periaatteet, joilla hakukone määrittää tärkeysjärjestyksen ja kriteerit, joilla verkkosivut hakutulokseen päätyvät, riippuvat hakukoneesta. Hakukoneista ei yleensä saa kovin tarkkaa tietoa siitä, millä periaatteilla tulos järjestetään. Tätä perustellaan sillä, että sivujen tekijät käyttäisivät tietoa hyödykseen saadakseen sivunsa hakutulosluettelon alkuun. On hyvä myös muistaa, että kaikkea hakukoneet eivät indeksoi - yleensä esimerkiksi erillisten tietokantojen sisältöä tai dynaamisesti muodostuvia tietokantapohjaisia palveluja ja sivuja ei indeksoida. Koska hakukoneiden toiminta perustuu automatiikkaan ja tietoon, jota ei ole tarjolla, on hakijan vastuulla tarkastella haussa saamansa aineiston luotettavuutta. Nykyisin käyttössä olevin automaattisin välinein on vaikeaa arvioida aineiston laatua, informaation kontekstia ja sopivuutta tiedonetsijän tarpeisiin. Mikään hakukone ei ole ylivertaisesti toisia parempi; katteessa, tulosten esittämistavassa, päivitystiheydessä yms. on eroja. Kokemus opettaa valitsemaan eri hakupalvelujen välillä. Jos haluaa kattavaa hakua tai varmistua tuloksestaan, kannattaa käyttää useampaa hakupalvelua.
Hakukoneiden erityispalveluista Internetin hyödyntämiseen kehitetyt välineet pyrkivät uusia palveluita luomalla tarjoamaan parempia välineitä informaation etsintään. Erityistarpeisiin kehitettyjä välineitä kaivataankin, koska informaation määrä Internetissä kasvaa jatkuvasti. Erityisesti asiatiedon löytyminen vaikeutuu, koska Internetissä on tarjolla eniten kaupallisia palveluita - erityisesti aikuisviihdettä. Tieteellisen tiedon osuuden arvioidaan olevan muutama prosentti. Palveluita luodaan tietyn aihe-alueen tai dokumenttityyppin hakuun. Hakukoneista löytyy monesti keskusteluryhmähaku, sähköpostiosoitehaku-, kuvahaku- tai esim. karttahakupalvelu. Googlen avulla pystyy rajaamaan haun esim. vain PDF-tiedostomuodossa julkaistuun aineistoon, joka on luontevaa, jos uskoo, että aineisto, jota tarvitsee olisi esim. PDF-muotoisia raportteja. Kuvahaun ja keskusteluryhmähaun kaltaisten erityispalveluiden idea on siinä, että aivan erityisen median aineisto erottuu muusta Internet-aineistosta, jolloin on todennäköisesti helpompi löytää haluamansa - tietokantoihin indeksoidaan vain tietyn tyyppisiä dokumentteja. Jos haetaan tietoa jostain aivan uudesta asiasta, voi haun rajaaminen esimerkiksi keskusteluihin tuottaa tulosta. Esimerkiksi Google on kehittänyt Googlen Groups -uutisryhmähakupalvelun. Sen avulla voi etsiä vastausta mihin asiaan tahansa, josta olettaa keskustelua käydyn. Viesteissä saattaa olla hyvin yksityiskohtaisia vastauksia ongelmiin, ovathan viestien kirjoittajat usein asialleen omistautuneita. Google Groups: http://groups.google.com/ Hakukoneita voi hyödyntää myös omien sivujen markkinoinnissa. Niissä on yleensä toiminto, jolla pystyy itse lisäämään sivun hakukoneen tietokantaan. Lisäksi voi käyttää Open Directory Project -palvelua, jonka hakemistoa käytetään mm. Googlen ylläpidossa: http://dmoz.org/add.html
Internetissä on hakupalveluita, jotka tekevät ns. monihakuja eli hakevat monen hakupalvelun tietokannasta samalla kertaa (Meta-search Engines). Ne yhdistävät ja analysoivat muiden hakukoneiden hakutulokset ja antavat yhdistetyn hakutuloksen selattavaksi.
Vivisimo - antaa koko hakutuloksen lisäksi tuloksen aihealueisiin jaoteltuna ProFusion - kertoo mitä hakukoneita se käyttää tiedonhaussa Ixquick : Dogpile:
Lisäinfoa hakukoneista Hakukoneisiin liittyvää tietoa löytyy lisää esim. Search Engine Watchin verkkosivulta. Hakukoneiden ominaisuuksia käsittelevät artikkelit saattavat olla hyödyllisiä http://searchenginewatch.com/ Internet-aineistojen kasvun vuoksi syntyy jatkuvasti myös uusia hakukoneita, jotka pyrkivät korjaamaan aiempien hakukoneiden puutteita. Search Engine Watchin verkkosivulta löytyy erityistarpeisiin hakukoneita ja niiden palveluita http://searchenginewatch.com/links/article.php/2156351 Esimerkiksi Scirus-hakukone keskittyy tieteellisen tiedon etsintään http://www.scirus.com/ |
|
||
Sivun
alkuun Sisällysluetteloon |
|||
MUITA LINKKEJÄ : | |||
|
|||
sivu on päivitetty
11.09.2005
palaute maria.soderholm@tkk.fi
|