Skip to Main Content

Opiskelijan opas vastuulliseen ja avoimeen tieteeseen: Aineistonhallinta ja tietosuoja

Mitä on tutkimusaineisto?

Tutkimusaineistolla (tai tutkimusdatalla) tarkoitetaan opinnäytteessä käyttämääsi aineistoa, johon opinnäyte perustuu.

  • Aineisto voi olla itse keräämääsi, esimerkiksi kyselyitä, haastatteluita, mittaustuloksia, muistiinpanoja tai kenttäpäiväkirjoja.
  • Tutkimuksessa voidaan käyttää myös muualta saatuja ”valmiita” aineistoja, esimerkiksi arkistolähteitä, äänitallenteita, YouTube-videoita, valokuvia, kirjallisuutta tutkimuskohteena, elokuvia, verkkosivustoja, keskustelupalstojen viestiketjuja, lääketieteellisiä kuvantamisia, simulaatioita jne.
  • Aineisto voi olla myös ohjaajaltasi tai data-arkistosta saatu tutkimusaineisto.
  • Jatkokäyttöä varten arkistoituja kysely- ja haastatteluaineistoja löydät esim. Tietoarkistosta.

                                   Pikselin Soluja, Protokollaa, Vaihto                                          Haastattelu, Ihmiset, Symboli, Kuvaketta                Kuvat: Pixabay

Näiden lisäksi aineistoa voivat olla lisäksi edellä lueteltujen aineistojen pohjalta tehdyt luokittelut, kategorisoinnit, taulukot, tietokannat, visualisoinnit, muistiinpanot jne. HUOM. Tutkimusaineistolla ei tässä yhteydessä tarkoiteta lähdekirjallisuutta tai tutkimusjulkaisuja.

Olemassa olevien aineistojen käyttö tutkimuksessa

Mahdollisuus uudelleen käyttää aineistoja, jotka olet aiemmin kerännyt tai saanut käyttöösi aiemmista hankkeista tai data-arkistoista, nopeuttaa ja edistää tutkimustyötä ja saattaa parhaimmillaan mahdollistaa uudenlaisten vertailuasetelmen muodostamisen. Aineistojen uudelleenkäyttö säästää myös tutkittavien aikaa, kun esimerkiksi tietyn kohderyhmän henkilöiden ei tarvitse vastata uudelleen ja uudelleen tutkijoiden heille esittämiin kysymyksiin. Aineistojen uudelleenkäyttö on myös asia, johon tieteen rahoittajat kannustavat.

Jotta voisit käyttää tutkimuksessa valmiita aineistoja, pitäisi aineiston olla laadukkaasti tuotettua, kuvailtua, järjestettyä ja sen käyttöoikeudet määritelty. Uudelleenkäyttö edellyttää myös sitä, että aineiston jatkokäytöstä on sovittu sen tuottamiseen osallistuneiden tahojen kanssa mahdollisimman täsmällisesti. Esim. kun pyydät tutkittavilta suostumusta tutkimukseen, määrittele tietosuojailmoituksessa selkeästi, miten pitkään ja mihin tarkoituksiin kerättyjä tietoja tulet käyttämään ja missä niitä säilytät tai arkistoit hankkeiden välillä. 

Hyödynnä erilaisia data-arkistoja etsiessäsi tutkimukseen soveltuvia aineistoja. Ennen käyttöä, tutustu huolellisesti aineiston käyttöehtoihin ja mahdollisiin käyttölisensseihin.

Erilaisia tutkimusmateriaalien ja -aineistojen arkistoja on olemassa lukematon määrä. Alla olevaan listaan on lueteltu niistä yleisimpiä.

Data-arkistoja:

  • Palveluportaali Aila (Tietoarkisto) – Tietoarkistoon (FSD) arkistoidut aineistot ovat saatavilla Aila-palveluportaalin kautta, jonne on tallennettu myös tutkimusaineistojen kuvailevat tiedot, eli metadata, suomeksi ja englanniksi.
  • Zenodo – Avoin data-arkisto, joka on tehty osana OpenAIRE-projektia, ja sen palvelun tuottaa CERN.
  • EUDAT – EU:n Horisontti 2020 -hankkeen rahoittama palvelu, joka mahdollistaa tutkimusaineistojen säilyttämisen, avaamisen, jakamisen ja hakemisen.
  • Figshare – Monitieteinen data-arkisto
  • Kielipankki (FIN-CLARIN) – Palvelukokonaisuus kieliaineistoja käyttäville tutkijoille. Kielipankin peruskäyttö on tutkijoille ja opiskelijoille maksutonta.
  • Kansallisarkisto – Kansallisen kulttuuriperinnön asiakirjojen säilyttämiseen keskittyvä arkisto
  • Array Express EMBL-EBL – Tarjoaa tutkijoille biologian ja bioinformatiikan aloilta big data -aineistoja
  • Dryad – Kuratoitu luonnontieteisiin ja lääketieteisiin keskittynyt data-arkisto, jossa säilytetään tieteellisiin julkaisuihin liitettyä tutkimusdataa.
  • Worldwide Protein Data Bank PDB - Arkisto, jonne tallennettu muun muassa 3D-kuvia biologisista makromolekyyleistä. Sisältää myös aineistojen metatietoja
  • Sosiaali- ja terveydenhoitoalan rekisteriaineistot, joihin käyttöluvan myöntää Findata

Muita datapalveluita:

Mitä suunnitelmallisella aineistonhallinnalla tarkoitetaan?

Vastuullinen aineistonhallinta on olennainen osa opinnäytteen tekemistä ja lisäksi tärkeä työelämätaito. Tässä muutamia olennaisia asioita, joita sinun pitää ottaa aineistonhallinnassa huomioon,  sisältö on saatavilla myös sway-esityksen muodossa.

  • Aineistonhallinnalla tarkoitetaan opinnäytteessä käytettävien aineistojen keräämistä, käsittelyä, kuvailua, tallentamista ja säilyttämistä.
  • Aineistonhallintasuunnitelmassa nämä prosessit on kuvattu ja kirjoitettu ylös jo ennen kuin varsinaista aineiston keruuta.
  • Aineistonhallintasuunnitelmaa myös päivitetään ja täydennetään, kun työ etenee ja suunnitelmat tarkentuvat tai muuttuvat.

Aineistonhallintasuunnitelman tarkoituksena on:

  • Ennakoida mahdollisia tietosuojariskejä ja varmistaa, että aineisto pysyy turvallisissa käsissä ja käyttökelpoisena koko projektin ajan.
  • Parantaa tutkimuksen tai harjoitustyön luotettavuutta ja tulosten toistettavuutta
  • Edistää kerätyn tutkimusaineiston jatkokäyttöä.

Aineistonhallintasuunitelman kirjoittamissa voit hyödyntää lomakepohjaa, josta löydät myös tällä sivulla olevan ohjeistuksen. Ohjeet löytyvät myös aineistonhallintasuunnitelmien kirjoittamiseen tarkoitetusta palvelusta DMPTuulista.

Aineiston esittely

  • Kerro lyhyesti tutkimusaineistostasi: millaisen aineiston keräät tai tuotat tai millaista olemassa olevaa aineistoa käytät?
  • Kuinka paljon tallennustilaa tarvitset aineistollesi?
  • Varmista, että keräämäsi aineisto on riittävän laadukasta tutkimukseesi. Kerää ensin esimerkiksi pieni testiaineisto ennen varsinaista aineiston keruuta: tee koehaastattelu, testaa kyselylomaketta
  • Jos käytät aiemmin kerättyä aineistoa, perehdy siihen huolella ja arvioi pystytkö sen avulla vastaamaan tutkimuskysymyksiisi.

Aineiston dokumentointi ja metatiedot

Aineiston keräys ja käsittely pitäisi kuvata sillä tarkkuudella, että joku muu kuin sinä itse ymmärrät, mistä aineistossa on kysymys. Aineisto kannattaa kuvata niin tarkasti, että jos jostain syystä joutuisit keskeyttämään opinnäytteesi tekemisen esimerkiksi vuodeksi tai kahdeksi, voisit silti kohtuullisen turvallisin mielin jatkaa opinnäytettäsi siitä, mihin olit jäänyt.

Kuvaa aineiston kerääminen ja käsittely

  • Mitä aineiston tiedostot sisältävät?​
  • Milloin aineisto kerättiin?​
  • Missä aineisto kerättiin?​
  • Miksi aineisto kerättiin?​
  • Miten aineistoa on käsitelty tai muokattu?
  • Taulukkomuotoisessa aineistossa sarakkeiden ja rivien otsikot, datan koodaukset (mukaanlukien tieto puuttuvista tiedoista), mittayksiköt jne.
  • Avaa käyttämäsi lyhenteet.

Tiedostojen nimeäminen ja kansiorakenne

  • Kiinnitä huomiota tiedostojen ja kansioiden nimiin sekä järjestykseen.
  • Fiksut tiedostojen nimet ovat lyhyitä, informatiivisia ja yhtenäisiä. Merkitse esimerkiksi päivämäärät vakioidusti YYYYMMDD.
  • Käytä versionumerointia tiedostojen nimissä ja pidä alkuperäinen tiedosto erillään muokkaustiedostoista.
  • Jo yhdestä haastattelusta kertyy helposti kolme tiedostoa: alkuperäinen äänitiedosto, litteroitu tekstitiedosto ja haastattelun muistiinpanot.
  • Älä käytä henkillöihin liittyviä tunnisteellisia tietoja tiedostojen nimissä!

Aineistoon liittyvät oikeudet

Ota huomioon:

  • Muualta saamaasi aineistoon liittyvät mahdolliset tekijänoikeudet tai käyttöehdot.
  • Kaikki netissä saatavilla oleva aineisto ei ole välttämättä sellaisenaan käytettävissä omassa työssäsi. Tutustu käyttämäsi palvelun käyttöehtoihin ja selvitä, onko aineistojen tutkimuskäyttö luvallista.
  • Katso video tutkimusaineistojen immateriaalioikeuksista ja tietosuojasta (Youtube, englanninkielinen, 5:02):

Kuvat, tekstit, muut tuotokset:

  • Näihin liittyy todennäköisesti myös tekijänoikeuksia.
  • Erityisesti jos lataat kuvia tai tekstejä omalle koneellesi, sinun tulisi varmistaa, että sinulla on tähän oikeus.
  • Joskus kuvien ja tekstien lupaehdot on määritelty lisensseissä.
  • Jos käytät aineistonasi esimerkiksi sosiaalisen median viestejä, varmista palvelun käyttöehdoista, että voit tarvittaessa ladata viestejä koneellesi.
  • Ks. kuvien käytöstä Aalto-yliopiston ImagOA-opas
  • Lue Kopioston lakimiehen ohjeet, miten opiskelija saa käyttää kuvia opinnäytetyössään?
  • Jos saat ohjaajaltasi aineiston käyttöösi, kannattaa epäselvyyksien välttämiseksi sopia, kuka aineistoa saa käyttää ja mitä aineistolle tehdään opinnäytteen valmistumisen jälkeen tai entä jos opinnäyte jää kesken?
  • Samoin, jos teet opinnäytettäsi yhteistyössä esimerkiksi yrityksen kanssa. Jääkö aineisto yrityksen käyttöön, saatko itse käyttää aineistoa myöhemmin vai pitääkö aineisto hävittää?

 

Aineiston tallennus ja tietoturva

Aineiston käsittelyssä käytettävät laitteet

  • Kyselylomakejärjestelmät O365 Forms ja LimeSurvey (intra)
  • Haastattelut – sanelimet (intra)
  • Zoom ja Teams (intra) ovat Tietosuojalain ja EU:n tietosuoja-asetuksen (GDPR) kanssa yhteensopivia intranetin ohjeiden mukaisesti tuni-tunnuksilla kirjauduttaessa. Tallenne tallentuu haastattelijan tietokoneelle.
  • Kannettavat tietokoneet (intra): Huolehdi oman tietokoneesi tietoturvasta.
  • Ulkoiset kovalevyt: Suojaa ulkoiset kovalevyt ainakin salasanalla.
  • Käytä yliopiston tallennusratkaisuja (intra), joita ovat OneDrive for Business, Tuni Groups ja henkilökohtainen verkkoasema.
  • Kuluttajakäyttöön tarkoitetut kaupalliset pilvipalvelut eivät aina sovellu luottamuksellisten tietojen, kuten henkilötietojen käsittelyyn.

Mitä teen aineistolleni opinnäytteen valmistuttua?

Henkilötietoja sisältävä aineisto yleensä tuhotaan opinnäytteen valmistumisen ja hyväksymisen jälkeen. Olennaista on tutkittavien informointi jatkokäytöstä. Informoi tutkittavia, jos aiot käyttää aineistoa myös opinnäytteesi jälkeen esimerkiksi jatkotutkinnossa tai teet opinnäytteesi pohjalta julkaisun. Julkaisussa käytettävää aineistoa voi olla tarpeen säilyttää tutkimuksen todentamista varten. Ota huomioon myös opinnäytteesi toimeksiantajan mahdolliset intressit aineistoon.

Aineiston avaaminen tai jatkokäyttö tai säilyttämien vaatii ennakointia. Suunnittele aineiston jatkokäyttöä tai avaamista jo ennen aineistonkeruuta!

  • Aineiston avaamiseksi jatkokäyttöön muiden käyttöön tarvitset luvan tutkittavilta.
  • Aineiston avaaminen tehdään arkistoissa, jollainen on esimerkiksi Tampereen yliopiston yhteydessä toimiva Tietoarkisto (FSD). Pro gradu -aineistoja he ottavat arkistoitavaksi harkinnanvaraisesti. Aineiston tulisi olla riittävän laaja vertailututkimuksen, menetelmäopetuksen tai uuden tutkimuksen tarpeisiin. Lue lisää Tietoarkiston vastaanottamista aineistoista.           
  • Ota yhteyttä esimerkiksi Tietoarkistoon ja kysy avaamisen mahdollisuuksista.
  • Yliopiston tallennusratkaisujen käyttöoikeus päättyy valmistumiseen – ota aineisto talteen, jos et tuhoa sitä.                          
  • EU-rahoitteinen Zenodo-palvelu soveltuu monentyyppisten aineistojen säilyttämiseen. Aineiston näkyvyyden voi tarvittaessa rajat niin, että vain sinä pääset siihen käsiksi, mutta myös avaaminen on mahdollista Zenodon kautta.

Tietosuoja

Tietosuojalla tarkoitetaan henkilötietojen suojaamista. Tietosuoja on perusoikeus, joka turvaa tutkimukseen osallistuvien henkilöiden oikeuksien ja vapauksien toteutumisen henkilötietojen käsittelyssä. Tietosuojan tarkoituksena on osoittaa, milloin ja millä edellytyksillä henkilötietoja voidaan käsitellä. Henkilötietojen käsittelyn on aina perustuttava lakiin.

HUOM! Käytä erityistä harkintaa aihetta valitessasi. Jos aiot käsitellä hyvin arkaluonteisia aiheita, tutkia sosiaalisen median aineistoja tai haavoittuvia ihmisryhmiä kuten lapsia, potilaita ja vanhuksia, huomaa, että aiheet voivat olla tietosuojan ja tutkimusetiikan näkökulmasta haastavia. 

Mitä on henkilötieto?

Henkilötiedoksi katsotaan mikä tahansa tieto, jonka avulla henkilö on tunnistettavissa joko suoraan tai välillisesti.

Esimerkiksi haastattelututkimusta tehdessäsi käsittelet melko varmasti henkilötietoja, sillä ääni katsotaan tunnisteelliseksi tiedoksi. Lisäksi tutkittavilta kerättävät osallistumissuostumukset ovat henkilötietoja. Samoin tutkittavien yhteystiedot.

Kyselytutkimuksen vastauksista muodostuu helposti tunnisteellisia. Jo taustatiedot, kuten esimerkiksi ammatti, asuinkunta, ikä ja sukupuoli voivat yhdistettyinä tehdä henkilöstä tunnistettavan. Huomaathan, ettet käytä tunnisteellisia tietoja tiedostojen nimissä.

Suunnittele sitaattien käyttö huolellisesti. Jos käytät sosiaalisen median aineistoja tai keskustelupalstoilta kerättyjä aineistoja, niiden suorat lainaukset muodostavat todennäköisesti tunnisteellisen tiedon. Palvelun käyttäjälle voi tulla lisäksi yllätyksenä, että hänen viesteistään poimitaan sitaatteja ja esitetään uudessa paikassa asiayhteydestään irrotettuina, mikä voi olla myös eettinen ongelma.  Marko Ahteensuu käsittelee Sosiaalisen median aineistojen eettisiä ongelmia vastuullinentiede.fi-sivustolla julkaistussa artikkelissaan.

Lue lisää henkilötiedon määritelmästä Tietoarkiston aineistonhallinnan käsikirjasta.

Riskiarvio

Perusmuotoinen riskiarvio on tehtävä aina ennen henkilötietojen käsittelyä. Riskejä arvioidaan tutkittavan näkökulmasta. Riskiarvio on dokumentoitava.

Vaikutusten arviointi (DPIA = Data protection impact assessment) on tehtävä, jos riskiarvio osoittaa, että henkilötietojen käsittely aiheuttaa korkean riskin tutkittaville. Katso kriteerit vaikutusten arviointiin sekä riskiarvion ja vaikutusten arvioinnin mallipohja ja ohjeet.


Tutkittavien informointi ja tutkimusluvat

Tutkittavien informointi tutkimuksestasi ja eettisen osallistumissuostumuksen (tietoon perustuva suostumus) pyytäminen on osa hyviä tieteellisiä käytäntöjä. Informoinnin yhteydessä tutkittavia tulisi informoida henkilötietojen käsittelystä Tietosuojalain (1050/2018) edellyttämällä tavalla.

Tietosuojailmoitus

Tietosuojailmoituksen tarkoituksena on informoida tutkittavia henkilötietojen käsittelystä.

Tutkimustiedote

Tutkimustiedotteessa tutkittaville kerrotaan perustiedot tutkimuksesta. Olennaista on, että siitä käy selkeästi ilmi, mihin tutkittava suostuu.

Tietoon perustuva suostumus

Ennen tutkimukseen osallistumista tutkittavilta tulee kerätä eettinen osallistumissuostumus. Ihmistieteissä tämä voi olla allekirjoitettu suostumuslomake, sähköpostivahvistus tai esimerkiksi haastattelutallenteen alussa annettu suullinen suostumus. Jos tutkimuksessa puututaan fyysiseen koskemattomuuteen tai käsitellään arkaluonteisia henkilötietoja, suosittelemme allekirjoitettua suostumuslomaketta. Huomaathan, että eettinen osallistumissuostumus ei ole sama asia kuin suostumus henkilötietojen käsittelyperusteena.

Lupa jatkokäyttöön

Yleensä tutkittavilta pyydetään osallistumissuostumus vain rajattua tutkimushanketta varten. Aineiston käyttö on sallittua vain rajauksen piiriin kuuluvaan tutkimukseen. Jos aineisto halutaan arkistoida ja jakaa käytettäväksi muuhun tutkimukseen, tästä on informoitava tutkittavia.

Tutkimusluvat

Jos opinnäytteesi käsittelee jonkun organisaation työntekijöitä tai opiskelijoita, tarvitset todennäköisesti tutkimusluvan kyseisestä organisaatiosta. Esimerkiksi kaupungeilla ja kunnilla on tyypillisesti omat käytännöt tutkimusluville. Lisätietoja tutkimusluvista yliopiston intrasta.

Miten toimin käytännössä?

Suunnittele ennen aineiston keräämistä, miten toteutat tutkittavien informoinnin (tutkimustiedote ja tietosuojailmoitus) ja miten pyydät heiltä osallistumissuostumuksen. Voit liittää tutkimustiedotteen esimerkiksi sähköpostiviestiin, osaksi kyselylomaketta tai antaa sen paperilomakkeena. Tyyli on vapaa, kunhan tutkittava saa olennaiset tiedot hankkeestasi.

Myös osallistumissuostumuksen voit pyytää eri tavoin. Esimerkiksi haastatteluissa suostumuksen voi pyytää suullisesti haastattelun alkuun. Kyselytutkimuksessa käyttäjää voi pyytää rastittamaan valintaruudun, että on hän tutustunut tutkimustiedotteeseen.

Vältä suorien tunnisteiden, kuten nimien käsittelyä esimerkiksi pseudonymisoimalla aineisto. Poista suorat tunnisteet tai korvaa esimerkiksi nimet koodeilla, jotka vain sinä voit tarvittaessa avata. Tietoarkistolla on hyviä ohjeita aineiston anonymisointiin ja pseudonymisointiin

Älä käytä tunnisteellisia tietoja myöskään tiedostojen nimissä.

 

Muista:

  • Arvioi, käsitteletkö henkilötietoja. Tietosuoja-asetuksen (GDPR) mukaan henkilötiedolla tarkoitetaan kaikkia tunnistettuun tai tunnistettavissa olevaan luonnolliseen henkilöön liittyviä tietoja.
  • Tietosuojalaki. Tietosuojalla tarkoitetaan henkilötietojen suojaamista. Henkilötietojen käsittelyn on aina perustuttava lakiin.
  • Tietojen arkaluontoisuus, sensitiivisyys, esimerkiksi lapset.
  • Muu luottamuksellinen tieto, kaupallinen data, yritystiedot, liikesalaisuudet, sotilaalliset tiedot, sensitiiviset lajitiedot?
  • Tutkimuslupa (intra) tai eettinen ennakkoarviointi?(HUOM! perustutkintovaiheen opinnäytetöille ei haeta eettistä ennakkoarviointia kuin erityistapauksissa)
  • Arvioi, minkälaisia riskejä henkilötietojen käsittelyyn liittyy, ja miten hallitset niitä.

Linkkejä Sosiaalisen median aineistojen käytöstä tutkimuksessa

Facebook-aineistojen käytöstä The Conversation -kanavalla.

Apua ja neuvontaa

Jos sinulla on kysymyksiä liittyen opinnäytetyösi aineiston keruuseen, käsittelyyn, hallinnointiin tai tietosuojaan liittyvissä asioissa, voit olla yhteydessä Kirjaston datatukeen: researchdata@tuni.fi

Logo

Email: library@tuni.fi
P. 0294 520 900

Kirjaston kotisivut | Library homepage
Andor

Palaute | Feedback