Skip to Main Content

Tiedonhaun opas: Tiedonhaku ja tekoäly

Tutustu tieteelliseen tiedonhakuun, aina aiheen jäsentämisestä ja hakusanojen valinnasta tiedonlähteiden valintaan ja hakutulosten arviointiin.

Tekoälyn hyödyntäminen tiedonhaussa

Tällä sivulla käsitellään tekoälyä korkeakouluopinnoissa. Sisällön painopisteenä on tekoälyn hyödyntäminen tiedonhaussa, mutta nostamme esille myös tekoälyn herättämiä eettisisiä kysymyksiä. Tekoäly ja sen sovellukset kehittyvät nopeasti, samalla tavalla tämä opas on koko ajan työn alla, käy tarkistamassa päivitykset ja seuraa alan kehitystä. 

Tekoäly on laaja käsite, joka tarkoittaa tietokonejärjestelmien kykyä suorittaa tehtäviä ja prosesseja, jotka normaalisti vaativat ihmisen älykkyyttä. Tällaisia tehtäviä voivat olla esimerkiksi kuvantunnistus, puheentunnistus, ongelmanratkaisu ja päätöksenteko. Tekoälyä hyödynnetään arjessamme jo monessa: erilaisten sovellusten antamissa suosittelulistoissa, kielenkääntämisessä, mainonnan kohdentamisessa ja asuntojen hintojen ennustamisessa jne.

OpenAI-niminen yritys julkaisi tekstiä generoivan ChatGPT-palvelun vapaasti käytettäväksi marraskuussa 2022 ja alkuvuodesta 2023 se nousikin laajasti julkisuuteen


Keskeisiä käsitteitä

  • Tekoäly -Tekoälyllä tarkoitetaan koneen kykyä käyttää perinteisesti ihmisen älyyn liitettyjä taitoja, kuten päättelyä, oppimista, suunnittelemista tai luomista.
  • Koneoppiminen - Koneoppiminen on tekoälyn osa-alue, jonka juuret ovat tilastotieteessä. Koneoppimismenetelmät oppivat annetun datan pohjalta ilman erillistä sääntöjen ohjelmointia. Ne parantavat suorituskykyään tietyssä tehtävässä sitä mukaa kuin lisää kokemusta tai dataa kertyy.
  • Suuret kielimallit - Suuri kielimalli (”large language model”, LLM) tarkoittaa sanojen ja sanajonojen esiintymisen todennäköisyyksille perustuvaa mallia. Ne ennustavat annetulle tekstisyötteelle jatkoa tai tuottavat pyydetyn mukaista tekstiä.
  • Generatiivinen tekoäly - Generatiivinen tekoäly yhdistää koneoppimisen, syväoppimisen ja tekoälyn tehon. Se pystyy luomaan vastauksena sille annettuun pyyntöön alkuperäistä sisältöä esimerkiksi tekstiä, videoita, ääntä, koodia tai kuvia. Generatiivista tekoälymallia koulutetaan datan ja palautteen avulla ja tämän perusteella se pystyy luomaan yhä uusia innovatiivisia tuotoksia.

Korkeakouluyhteisön linjaukset

Useat eri tahot ovat antaneet ohjeita ja suosituksia tekoälyn ja erityisesti ChatGPT:n käytöstä opinnoissa, näin myös meillä. Kokosimme tähän Tampereen korkeakouluyhteisössä annettuja ohjeita. 

Tampereen yliopiston opiskelija

Tiivistelmä suosituksesta:

  • Kielimallien käyttö on lähtökohtaisesti sallittua.
  • Jos opiskelija käyttää kielimallia tehtävässä tai opinnäytetyössä, esimerkiksi osana tekstinhuoltoa, on tästä aina mainittava.
  • Opiskelija on aina itse vastuussa palauttamansa tekstin sisällöstä.

Ohjeistusta päivitetään ja tarkennetaan korkeakouluyhteisön verkkosivuilla!

TAMKin opiskelija

Tiivistelmä opiskelijan ohjeesta:

  • Opiskelijoita suositellaan tutustumaan tekoälypohjaisiin sovelluksiin ja käyttämään niitä yhtenä työvälineenä oppimisessaan.
  • Opiskelijat ovat aina itse vastuussa omien opiskelutehtäviensä sisällöistä ja arvioinnin kohteena olevista materiaaleista. 
  • TAMK edellyttää opiskelijoilta vastuullista ja eettistä tekoälysovellusten käyttöä opinnoissa. 

Ohjeistusta päivitetään ja tarkennetaan korkeakouluyhteisön verkkosivuilla!

ChatGPT

ChatGPT on OpenAI:n palvelu, jossa voi käyttäjän valinnan mukaan käyttää eritasoista kielimallia, mm. ChatGPT (ilmainen) ja GPT4 (maksullinen). Sovellus löytyy osoitteesta https://chat.openai.com/chat. Se käyttäminen vaatii OpenAI:n tunnukset.

Palvelua käytetään niin, että sille kirjoitetaan tekstiä (prompt) ja se vastaa käyttäjän antamaan tekstisyötteeseen. Palvelun kanssa voi siis ikään kuin käydä dialogia käyttäjän haluamasta aiheesta.

ChatGPT on koulutettu valtavilla tekstimassoilla, se generoi oppimiensa tekstien pohjalta tilastollisen mallin perusteella vastaukset. Yksinkertaistettuna sitä voi verrata kännykän ennakoivaan tekstinsyöttöön. Se ei siis tiedä mitään, sillä ei ole pääsyä internettiin, eikä sitä voi käyttää tietolähteenä. Se ei myöskään osaa arvioida tuottamansa tekstin luotettavuutta ja voikin väittää tosiksi epätosia asioita. OpenAI ei ole luovuttanut tietoja ChatGPT:n kouluttamiseen käytetyistä tiedoista. Kannattaa myös muistaa, että tekoälymallit ovat tunnetusti puolueellisia.

Huom! Open AI päivitti syyskuussa 2023 maksullisen ChatGPT-4, se pystyy nyt hyödyntämään internetiä. 

ChatGPT tiedonhaun apuna

Aiheeseen orientoituminen

  • Voit käyttää ChatGPT:tä inspiraation apuna tutkimuskysymystä ideoidessa ja muotoillessa. Varaudu siihen, että se saattaa sisällyttää keskusteluun ennakkoluuloisia oletuksia. Ja muista, että sitä on koulutettu vuoteen 2021 asti olevilla tiedoilla, sillä ei ole tietoa uusimmista tutkimustuloksista. 

Haun valmistelu

  • ChatGPT voi auttaa löytämään hyviä hakusanoja tiedonhakuusi. Kannattaa pyytää ChatGPT:tä täydentämään sen antamaa hakusanalistaa useita kertoja, eikä tyytyä ensimmäiseen vastaukseen. Huomaa, että se ei kuitenkaan korvaa tarvetta tutustua alan sanastoihin ja tarkistaa alan asiantuntijoiden käyttämiä termejä. 
  • ChatGPT voi auttaa sinua tunnistamaan aiheeseesi sopivia työkaluja tai tietokantoja. Huomaa, että se ei välttämättä anna kattavaa vastausta saatavilla olevista alakohtaisista tietokannoista. Se ei myöskään osaa kertoa, tilaako kirjastomme tietyn tietokannan. Kattavan tiedon alakohtaisista ja monialaisista tietolähteistä saat kirjaston Tietokannat A-Z -listalta.
  • Huomaa, että ChatGPT:tä ei ole koulutettu muotoilemaan hakulauseita tieteellisen tiedon etsimistä varten. Jos pyydät sitä rakentamaan sinulle hakulauseita, joudut todennäköisesti muokkaamaan ja muotoilemaan ne uudelleen. 

Haun suorittaminen

  • ChatGPT ei voi auttaa sinua varsinaisessa tiedonhaussa. Se ei osaa hakea tietoa järjestelmällisesti ja läpinäkyvästi. 
  • ChatGPT voi kertoa, miten tietokanta toimii. Suosittelemme kuitenkin, että tarkistat käyttöohjeet suoraan valitsemastasi tietokannasta. Toiminnot ovat saattaneet muuttua vuoden 2021 jälkeen, ja ChatGPT:n vastaus voi hyvinkin olla vanhentunut.

Tulosten arviointi

  • Et voi käyttää ChatGPT:tä hakutulosten arviointiin. Tiedon arviointi on inhimillinen taito, joka perustuu kriteereihin, joita itse pidät merkityksellisinä. Tutkijana tai opiskelijana, tiedonhakijana, sinun on päätettävä, onko lähde merkityksellinen työsi kannalta.
  • Voit kuitenkin käyttää ChatGPT:tä vaikeiden tekstien selventämiseen ja kääntämiseen, sillä se on hyvä tiivistämään tai muotoilemaan tekstiä uudelleen. Muista kuitenkin lähdekriittisyys eli älä usko kaikkea ja että palvelu voi esittää puolueellisia näkemyksiä.

Viittaaminen ja lähdeviitteet

  • ChatGPT ei pysty antamaan oikeita lähteitä kirjoittamilleen teksteille. Se pystyy kyllä tuottamaan lähdeluettelon pyydettäessä, mutta yleensä lähteet ovat virheellisiä tai täysin keksittyjä.
  • ChatGPT ei myöskään pysty luomaan lähdeluetteloita viittausmallien mukaisesti. Viitteidenhallintaohjelmat, kuten Zotero ja muut vastaavat tukevat lukemattomia viittaustyylejä ja ovat hyviä työkaluja siihen tarkoitukseen.

Huomioi aina käyttäessäsi tekoälysovelluksia, miten ne käsittelevät syöttämääsi dataa. Lähtökohtaisesti kaikki tekoälypalveluihin syötetty materiaali tallentuu EU/EEA-alueen ulkopuolelle eikä ole sieltä poistettavissa. Palveluihin ei saa syöttää esimerkiksi henkilötietoja, yrityssalaisuuksia, luottamuksellisia tietoja tai salassa pidettäviä tietoja.

Ohje miten rajoitat syötteittesi käytön tekoälyn kouluttamisessa ChatGPT:ssä.

Tekoälyyn viittaaminen

Pitäisikö minun viitata ChatGPT:hen?

Kyllä, jos olet käyttänyt ChatGPT:tä työssäsi, sinun on mainittava kaikki sen käyttö. Tarkista oman korkeakoulusi ohjeet:

Miten teet lähdeviitteen ChatGPT:hen tietyn viittaustyylin mukaan? Katso ohjeita esim.: https://www.scribbr.com/ai-tools/chatgpt-citations/.

  • Esimerkiksi APA-tyylisen lähdeviitteen kaava: 
    OpenAI. (Year). ChatGPT (Month Day version) [Large language model]. https://chat.openai.com

Omien tekstien (vastaukset tehtäviin, esseet jne.) kirjoittaminen ChatGPT:llä katsotaan useimmissa oppilaitoksissa plagioinniksi tai epärehellisyydeksi, vaikka mainitsisitkin lähteen. ChatGPT:n käyttämistä tällä tavoin ei suositella.

Voitko käyttää ChatGPT:tä tehtävässäsi?

Muokattu kuvasta ”Is it safe to use ChatGPT for your task?” By Aleksander Tiulkanov CCBY

Tekoäly akateemisessa tiedonhaussa

Vaikka generatiivisen tekoälyn sovellukset, kuten ChatGPT, eivät ainakaan tällä hetkellä sovellu tieteellisen tiedon hakuun, löytyy kuitenkin useita erilaisia sovelluksia, joissa tekoälyä hyödynnetään juuri artikkelihaussa. Tässä esitellään niistä muutama. 

HUOM! Alla esiteltäviin palveluihin ei ole organisaatiolisenssiä ja niiden kokeileminen ja käyttö on käyttäjän omalla vastuulla, muista tietoturva (ks. Tekoäly ja tietoturva). Huomaa myös, että palvelut voivat muuttua maksullisiksi tai hävitä markkinoilta. 

Tekoälyä käyttäviä artikkelihaun työkaluja:

  • Käytössä maksuton ja maksullinen versio. Maksullinen versio, Keenious Plus, sisältää enemmän ominaisuuksia kuin maksuton versio. Kirjautuneena saa käyttöönsä enemmän ominaisuuksia.
  • Työkalu, joka hyödyntää olemassa olevaa tekstiä tiedonhaun pohjana, se etsii sille syötetyn valmiin artikkelin tai muun tekstin pohjalta saman aiheisia artikkeleita. Artikkelihaun lisäksi Keenious tuottaa aihelistan, jonka se tulkitsee sille syötettyyn tekstiin liittyvän. Tämän perusteella hakija voi tarkentaa hakuaan haluamaansa suuntaan.
  • Työkalua voi käyttää verkkosivun lisäksi myös Word tai Google docs plug-in:n avulla.
  • Vapaasti käytettävissä, mutta rekisteröitymällä saa käyttöönsä enemmän ominaisuuksia.
  • Haku on samantyyppinen sanahaku kuin Google Scholarissa.
  • Näyttää artikkelin viittaukset ja pyrkii löytämään viitatuimpien artikkeleiden lisäksi myös kaikkein merkityksellisimmät artikkelit. Se tekee myös artikkelisuosituksia käyttäjän valitsemien artikkeleiden pohjalta.
  • Sopii käyttäjälle, jolla on kiinnostusta suodattaa ja järjestää hakutulosta ja tallentaa artikkeleita uusien artikkelisuositusten saamiseksi.
  • Palvelun käytön aloittaminen on maksutonta, mutta käyttö edellyttää kirjautumista. Palvelu muuttuu maksulliseksi kun tietty käyttömäärä ylittyy. Käytön määrä määrittelee hinnan.
  • Työkalu hakee ja tiivistää tieteellisiä artikkeleita sille annettuun tutkimuskysymykseen tai artikkeliin perustuen. Hakutulossivulla Elicit ei ilmoita perinteisistä hakupalveluista poiketen hakutulosten määrää, vaan näyttää seitsemän relevanteinta artikkelia.
  • Elicit tarjoaa myös muita apuvälineitä akateemiseen työskentelyyn, se auttaa tutkimuskysymyksen muotoilussa ja artikkelien analysoinnissa ja tiivistelmien luonnissa.

Visualisoivia akateemisia tiedonhaun välineitä:

  • Tarjolla maksuton ja maksullinen version, joissa on eroja artikkelien ja karttojen määrässä.
  • Tekee kirjallisuuskartan yhden julkaisun tiedoilla tai vaihtoehtoisesti useammasta julkaisusta BibTeX/RIS -tiedostoilla.
  • Litmaps näyttää tieteellisten artikkelien väliset suhteet dynaamisessa verkostograafimuodossa. Tekee ehdotuksia artikkeleista artikkelien välisiin yhteyksiin perustuen, joten se auttaa löytämään artikkeleita hakusanojen ulkopuolelta.
  • Vaatii tunnusten luomista.
  • Työkalun käytön voi alkaa yhden hyvän artikkelin lisäämisellä kokoelmaan. Työkalu luo suosituksia kokoelmasi perusteella perustuen otsikoihin, tiivistelmään ja muuhun metadataan.
  • Visualisoi muodostuneet julkaisujen väliset verkostot. Voit liikkua kartalla eteenpäin, luoda uusia julkaisuverkostoja myös tekijöillä ja lähteillä. Työkalu auttaa löytämään uusia yhteyksiä tutkittavien ilmiöiden ja tutkijoiden väliltä.

Kielimallit yhdistettynä hakukoneeseen

Kielimallin yhdistäminen internettiin ja hakukoneeseen mahdollistaa kielimallin vastaukset internet-hakujen perusteella. Esim. ChatGPT+pluginit, Bing Chat, Google Bard, Perplexity.ai ja You.com.

Toimintaperiaate:

  • Kielimalli tulkitsee käyttäjän kysymyksen ja mahdollisesti muotoilee sen uudelleen.
  • Hakukoneelle syötetään mallin ymmärryksen mukaan sopivat hakusanat ohjelmistorajapinnan kautta.
  • Hakukone palauttaa parhaita tuloksia kielimallille.
  • Kielimalli vastaa kysymykseen saamiensa lähteiden perusteella.

Tässäkin tapauksessa kielimalli voi hallusinoida tai tulkita lähteitä väärin. Ole siis lähdekriittinen. Useimmat työkalut edellyttävät kirjatumista.

Microsoft Bing Chat Enterprise on keskusteleva tekoälysovellus (kielimallina GPT-4 ja kuvamallina DALL-E 3). Bing Chat Enterprise osaa hakea tietoja myös suoraan internetistä ja osaa luoda sanallisen kuvailun perusteella kuvia. Se on käytettävissä koko henkilökunnalla, mutta ei ainakaan toistaiseksi vielä opiskelijoilla. Katso ohjeet sivulta Bing Chat Enterprise (intra). Vinkkipankin jutusta: Microsoft Copilot: Kymmenen käytön pikavinkkiä voi myös olla hyötyä. 

Eettinen ja arvioiva käyttö

Generatiivinen tekoäly on työkalu, joka voi auttaa meitä jokapäiväisessä elämässä, työssä tai opiskelussa. Kuten minkä tahansa työkalun kohdalla, eettinen, arvioiva ja tarkoituksenmukainen käyttö on avainasemassa. 

  • Integriteetti
    • Saako tekoälyä käyttää tehtävässä? Jos saa niin mihin? Ja miten siitä pitää raportoida?
  • Mis- ja disinformaatio:
    • Misinformaatio on puutteellista tai väärää tietoa, jota annetaan epähuomiossa eikä tarkoitus ole tahallisesti johtaa harhaan.

    • Disinformaatio on tietoisesti jaettua väärää tietoa, jonka motiivina voi olla muun muassa: poliittinen ja yhteiskunnallinen vaikuttaminen,  taloudellinen hyöty sekä ilkivalta

  • Informaatiolukutaito
    • Tekoälytyökalut eivät välttämättä ilmoita käyttämiään alkuperäisiä lähteitä, eivätkä ne välttämättä käytä sellaisia lähteitä, jotka täyttävät tieteellisen kirjoittamisen vaatimukset. Joissakin tapauksissa lähteet ovat osoittautuneet olemattomiksi tai epätarkoiksi. Jos käytät työkalua, joka tuottaa joitakin elementtejä työstäsi, työn arvostelevan henkilön on tiedettävä, mikä on sinun ja mikä muualta peräisin.  
    • Tekoälypohjaiset hakutyökalut saattaa vaikuttaa siltä, että se tekee tieteellistä tutkimusta helposti ja nopeasti.  Opiskelijan näkökulmasta tämä voi kuitenkin tarkoittaa, että opiskelija ei opi tärkeitä taitoja, kuten tieteellisen tutkimuksen perustaitoja kuten tiedonhakua, kriittistä arviointia ja ongelmanratkaisua.
  • Yksityisyyden suoja
    • Esimerkiksi ChatGPT:n käyttöä varten on luotava tili, mikä mahdollistaa tietojen keräämisen, mikä on yksityisyyden suojaan liittyvä ongelma. Tekoälytyökalut voivat vaatia antamaan puhelinnumeron tai muita henkilökohtaisia tietoja. Verkossa tulisi olla tarkkana siitä, mitä tietoja jakaa tiliä luodessaan.
    • Muista tutustua tarkkaan ohjelman tietosuojakäytäntöön ja käyttöehtoihin. Muista, että työkaluja käyttäessäsi keskustelusi tyypillisesti tallennetaan työkalun toimesta, ja niitä käytetään työkalun tarkoituksiin.
  • Tekijänoikeudet
    • Joissakin tapauksissa tekoälytyökalut voivat käyttää verkossa olevaa materiaalia ilman tekijöiden lupaa.Tekijänoikeuksien noudattaminen on osa akateemista hyvää tieteellistä käytäntöä, minkä vuoksi on erittäin tärkeää suhtautua kriittisesti tällaisten välineiden käyttöön akateemisessa työssä.

Opiskelijan tarkistuslista

  • Keskustele kurssin opettajan tai seminaarin ohjaajan kanssa hyvissä ajoin, onko tekoälysovellusten (ja minkä) käyttö sallittua työsi tiedonhaussa.
  • Tutustu tekoälysovelluksiin etukäteen: mihin ne pystyvät tiedonhaun tukena, mihin eivät, vertaile tuloksia.
  • Mieti, mihin voit käyttää tekoälysovellusta tiedonhaussa, ja mihin et.
  • Tutustu käyttämääsi tekoälysovellukseen: kuka sitä ylläpitää ja miksi; onko sen käyttö maksullista tai rajattua, vaikuttaako se tuloksiin?
  • Lähdekritiikki on yhä edelleen sinun tehtäväsi. Ole kriittinen tulosten suhteen: tee vertailevia otantoja eri tietoa tarjoavista lähteistä ja tarkista esim. tekoälyn tarjoamia viitteitä ja niiden saamia viittauksia tietokannoista.
  • Viittaa tekoälyyn ohjeiden mukaan, jos käytät sitä.

 

Muiden kirjastojen oppaita ja ohjeita aiheesta

Lisätietoa aiheesta

Helariutta, A., Jokiranta, H. & Marjamaa, M. 2023. Tiedonhaun kokeilukulttuuria: Tekoälyä käyttävät artikkelihaun työkalut. Kreodi 2/2023 http://urn.fi/URN:NBN:fi-fe2023060752750

TEEL, Zoë (Abbie); WANG, Ting; LUND, Brady. ChatGPT conundrums: Probing plagiarism and parroting problems in higher education practices. College & Research Libraries News, [S.l.], v. 84, n. 6, p. 205, june 2023. ISSN 2150-6698. Available at: <https://crln.acrl.org/index.php/crlnews/article/view/25931>. Date accessed: 03 aug. 2023. doi:https://doi.org/10.5860/crln.84.6.205.

Mitä tekoäly on?

What is AI? A video by Museum of Science, Boston (4,38)

Logo

Email: library@tuni.fi
P. 0294 520 900

Kirjaston kotisivut | Library homepage
Andor

Palaute | Feedback