Skip to Main Content

Tutkimusaineistojen hallinta: Opiskelijan aineistonhallinnan ohjeet

Aluksi

Vastuullinen aineistonhallinta on olennainen osa niin opinnäytteen tekemistä kuin työelämätaitojakin. Tähän ohjeeseen on pyritty tiivistämään olennaiset asiat, jotka opiskelijan tulisi ottaa aineistonhallinnassa huomioon. Oppaan sisältö on saatavilla myös sway-esityksen muodossa.

Aineistonhallinnalla tarkoitetaan opinnäytteessä käytettävien aineistojen keräämistä, käsittelyä, kuvailua, tallentamista ja säilyttämistä. Aineistonhallintasuunnitelmassa nämä prosessit on kuvattu ja kirjoitettu ylös jo ennen kuin varsinaista aineiston keruuta. Aineistonhallintasuunnitelmaa myös päivitetään ja täydennetään, kun työ etenee ja suunnitelmat tarkentuvat tai muuttuvat. Suunnitelman tarkoituksena on esimerkiksi ennakoida mahdollisia tietosuojariskejä ja varmistaa, että aineisto pysyy turvallisissa käsissä ja käyttökelpoisena koko projektin ajan. Huolellisella aineistonhallinnalla pyritään parantamaan tutkimuksen tai harjoitustyön luotettavuutta ja tulosten toistettavuutta, sekä edistämään kerätyn tutkimusaineiston jatkokäyttöä.

Aineistonhallintasuunitelman kirjoittamissa voit hyödyntää lomakepohjaa, josta löydät myös tällä sivulla olevan ohjeistuksen. Ohjeet löytyvät myös aineistonhallintasuunnitelmien kirjoittamiseen tarkoitetusta palvelusta DMPTuulista.

Mitä on tutkimusaineisto?

Tutkimusaineistolla (tai tutkimusdatalla) tarkoitetaan opinnäytteessä käyttämääsi aineistoa, johon opinnäyte perustuu. Aineisto voi olla itse keräämääsi kuten esimerkiksi kyselyitä, haastatteluita, mittaustuloksia, muistiinpanoja tai kenttäpäiväkirjoja.

Tutkimuksessa voidaan käyttää myös muualta saatuja ”valmiita” aineistoja, kuten arkistolähteitä, äänitallenteita, YouTube-videoita, valokuvia, kirjallisuutta tutkimuskohteena, elokuvia, verkkosivustoja, keskustelupalstojen viestiketjuja, lääketieteellisiä kuvantamisia, simulaatioita jne. Aineisto voi olla myös ohjaajaltasi tai data-arkistosta saatu tutkimusaineisto. Jatkokäyttöä varten arkistoituja kysely- ja haastatteluaineistoja, joita sinäkin voit hyödyntää omassa opinnäytteessäsi, voit etsiä esimerkiksi Tietoarkistosta

Näiden lisäksi aineistoa voivat olla lisäksi edellä lueteltujen aineistojen pohjalta tehdyt luokittelut, kategorisoinnit, taulukot, tietokannat, visualisoinnit, muistiinpanot jne. Tutkimusaineistolla ei tässä yhteydessä tarkoiteta lähdekirjallisuutta tai tutkimusjulkaisuja.

Aineiston esittely

 • Kerro lyhyesti tutkimusaineistostasi: millaisen aineiston keräät tai tuotat tai millaista olemassa olevaa aineistoa käytät?
 • Kuinka paljon tallennustilaa tarvitset aineistollesi?
 • Varmista, että keräämäsi aineisto on riittävän laadukasta tutkimukseesi. Kerää ensin esimerkiksi pieni testiaineisto ennen varsinaista aineiston keruuta: tee koehaastattelu, testaa kyselylomaketta…
 • Jos käytät aiemmin kerättyä aineistoa, perehdy siihen huolella ja arvioi pystytkö sen avulla vastaamaan tutkimuskysymyksiisi.

Aineistoon liittyvät oikeudet

Huomioi erityisesti muualta saamaasi aineistoon liittyvät mahdolliset tekijänoikeudet tai käyttöehdot. Muista myös, että kaikki netissä saatavilla oleva aineisto ei ole välttämättä sellaisenaan käytettävissä omassa työssäsi. Tutustu käyttämäsi palvelun käyttöehtoihin ja selvitä, onko aineistojen tutkimuskäyttö luvallista.

Jos aineistosi sisältää muiden valokuvia, tekstejä tai muita tuotoksia, niihin todennäköisesti liittyy myös tekijänoikeuksia. Erityisesti jos lataat kuvia tai tekstejä omalle koneellesi, sinun tulisi varmistaa, että sinulla on tähän oikeus. Joskus kuvien ja tekstien lupaehdot on määritelty lisensseissä. Jos käytät aineistonasi esimerkiksi sosiaalisen median viestejä, niin varmista palvelun käyttöehdoista, että voit tarvittaessa ladata viestejä koneellesi.

Jos saat ohjaajaltasi aineiston käyttöösi, kannattaa epäselvyyksien välttämiseksi sopia, kuka aineistoa saa käyttää ja mitä aineistolle tehdään opinnäytteen valmistumisen jälkeen. Entä jos opinnäyte jää kesken? Samoin, jos teet opinnäytettäsi yhteistyössä esimerkiksi yrityksen kanssa. Jääkö aineisto yrityksen käyttöön, saatko itse käyttää aineistoa myöhemmin vai pitääkö aineisto hävittää?

Aineiston dokumentointi ja metatiedot

Aineisto, sekä sen keräys ja käsittely pitäisi kuvata sillä tarkkuudella, että joku muu kuin sinä itse ymmärrät, mistä aineistossa on kysymys. Aineisto kannattaa kuvata niin tarkasti, että jos jostain syystä joutuisit keskeyttämään opinnäytteesi tekemisen esimerkiksi vuodeksi tai kahdeksi, voisit silti kohtuullisen turvallisin mielin jatkaa opinnäytettäsi siitä, mihin olit jäänyt.

Kuvaa aineiston kerääminen ja käsittely

 • Mitä aineiston tiedostot sisältävät?​
 • Milloin aineisto kerättiin?​
 • Missä aineisto kerättiin?​
 • Miksi aineisto kerättiin?​
 • Miten aineistoa on käsitelty tai muokattu?
 • Taulukkomuotoisessa aineistossa sarakkeiden ja rivien otsikot, datan koodaukset (mukaanlukien tieto puuttuvista tiedoista), mittayksiköt jne.
 • Avaa käyttämäsi lyhenteet.

Tiedostojen nimeäminen ja kansiorakenne

 • Kiinnitä huomiota tiedostojen ja kansioiden nimiin ja järjestykseen.
 • Fiksut tiedostojen nimet ovat lyhyitä, informatiivisia ja yhtenäisiä. Merkitse esimerkiksi päivämäärät vakioidusti YYYYMMDD.
 • Käytä versionumerointia tiedostojen nimissä ja pidä alkuperäinen tiedosto erillään muokkaustiedostoista.
 • Jo yhdestä haastattelusta kertyy helposti kolme tiedostoa: alkuperäinen äänitiedosto, litteroitu tekstitiedosto ja haastattelun muistiinpanot.
 • Älä käytä henkillöihin liittyviä tunnisteellisia tietoja tiedostojen nimissä.

Aineiston tallennus ja tietoturva

Aineiston käsittelyssä käytettävät laitteet

 • Kyselylomakejärjestelmät O365 Forms ja LimeSurvey (intra)
 • Haastattelut – sanelimet (intra)
 • Zoom ja Teams (intra) ovat Tietosuojalain ja EU:n tietosuoja-asetuksen (GDPR) kanssa yhteensopivia intranetin ohjeiden mukaisesti tuni-tunnuksilla kirjauduttaessa. Tallenne tallentuu haastattelijan tietokoneelle.
 • Kannettavat tietokoneet (intra): Huolehdi oman tietokoneesi tietoturvasta.
 • Ulkoiset kovalevyt: Suojaa ulkoiset kovalevyt ainakin salasanalla.
 • Käytä yliopiston tallennusratkaisuja (intra), joita ovat OneDrive for Business, Tuni Groups ja henkilökohtainen verkkoasema.
 • Kuluttajakäyttöön tarkoitetut kaupalliset pilvipalvelut eivät aina sovellu luottamuksellisten tietojen, kuten henkilötietojen käsittelyyn.

Mitä teen aineistolleni opinnäytteen valmistuttua?

Henkilötietoja sisältävä aineisto yleensä tuhotaan opinnäytteen valmistumisen ja hyväksymisen jälkeen. Informoi tutkittavia, jos aiot käyttää aineistoa myös opinnäytteesi jälkeen esimerkiksi jatkotutkinnossa tai teet opinnäytteesi pohjalta julkaisun. Julkaisussa käytettävää aineistoa voi olla tarpeen säilyttää tutkimuksen todentamista varten. Ota huomioon myös opinnäytteesi toimeksiantajan mahdolliset intressit aineistoon.

Aineiston avaamiseksi jatkokäyttöön muiden käyttöön tarvitset luvan tutkittavilta. Aineiston avaaminen tehdään arkistoissa, jollainen on esimerkiksi Tampereen yliopiston yhteydessä toimiva Tietoarkisto (FSD). Pro gradu -aineistoja he ottavat arkistoitavaksi harkinnanvaraisesti. Aineiston tulisi olla riittävän laaja vertailututkimuksen, menetelmäopetuksen tai uuden tutkimuksen tarpeisiin. Lue lisää Tietoarkiston vastaanottamista aineistoista.

EU-rahoitteinen Zenodo-palvelu soveltuu monentyyppisten aineistojen säilyttämiseen. Aineiston näkyvyyden voi tarvittaessa rajat niin, että vain sinä pääset siihen käsiksi, mutta myös avaaminen on mahdollista Zenodon kautta.

Ennakoi aineiston jatkokäyttöä tai avaamista jo ennen aineistonkeruuta. Ota yhteyttä esimerkiksi Tietoarkistoon ja kysy avaamisen mahdollisuuksista. Olennaista on tutkittavien informointi jatkokäytöstä. Yliopiston tallennusratkaisujen käyttöoikeus päättyy valmistumiseen – ota aineisto talteen, jos et tuhoa sitä.

Tietosuoja

Tietosuojalla tarkoitetaan henkilötietojen suojaamista. Tietosuoja on perusoikeus, joka turvaa rekisteröidyn oikeuksien ja vapauksien toteutumisen henkilötietojen käsittelyssä. Tietosuojan tarkoituksena on osoittaa, milloin ja millä edellytyksillä henkilötietoja voidaan käsitellä. Henkilötietojen käsittelyn on aina perustuttava lakiin.

Mitä on henkilötieto?

Henkilötiedoksi katsotaan mikä tahansa tieto, jonka avulla henkilö on tunnistettavissa joko suoraan tai välillisesti.

Esimerkiksi haastattelututkimusta tehdessäsi käsittelet melko varmasti henkilötietoja, sillä ääni katsotaan tunnisteelliseksi tiedoksi. Lisäksi tutkittavilta kerättävät osallistumissuostumukset ovat henkilötietoja. Samoin tutkittavien yhteystiedot.

Kyselytutkimuksen vastauksista muodostuu helposti tunnisteellisia. Jo taustatiedot, kuten esimerkiksi ammatti, asuinkunta, ikä ja sukupuoli voivat yhdistettyinä tehdä henkilöstä tunnistettavan. Huomaa, että tunnisteellisia tietoja voi esiintyä myös tiedostojen nimissä.

Käytä sitaatteja suunnitelmallisesti erityisesti, jos käytät esimerkiksi sosiaalisen median aineistoja tai keskustelupalstoilta kerättyjä aineistoja. Näistä otetut suorat lainaukset muodostavat todennäköisesti tunnisteellisen tiedon. Palvelun käyttäjälle voi tulla lisäksi yllätyksenä, että hänen viesteistään poimitaan sitaatteja ja esitetään uudessa paikassa asiayhteydestään irrotettuina, mikä voi olla myös eettinen ongelma. Marko Ahteensuu käsittelee Sosiaalisen median aineistojen eettisiä ongelmia vastuullinentiede.fi-sivustolla julkaistussa artikkelissaan.

Lue lisää henkilötiedon määritelmästä Tietoarkiston aineistonhallinnan käsikirjasta.

Riskiarvio

Perusmuotoinen riskiarvio on tehtävä aina ennen henkilötietojen käsittelyä. Riskejä arvioidaan tutkittavan näkökulmasta. Riskiarvio on dokumentoitava.

Vaikutusten arviointi (DPIA = Data protection impact assessment) on tehtävä, jos riskiarvio osoittaa, että henkilötietojen käsittely aiheuttaa korkean riskin tutkittaville. Katso kriteerit vaikutusten arviointiin sekä riskiarvion ja vaikutusten arvioinnin mallipohja ja ohjeet.


Tutkittavien informointi ja tutkimusluvat

Tutkittavien informointi tutkimuksestasi ja eettisen osallistumissuostumuksen (tietoon perustuva suostumus) pyytäminen on osa hyviä tieteellisiä käytäntöjä. Informoinnin yhteydessä tutkittavia tulisi informoida henkilötietojen käsittelystä Tietosuojalain (1050/2018) edellyttämällä tavalla.

Tietosuojailmoitus

Tietosuojailmoituksen tarkoituksena on informoida tutkittavia henkilötietojen käsittelystä.

Tutkimustiedote

Tutkimustiedotteessa tutkittaville kerrotaan perustiedot hankkeesta. Olennaista on, että siitä käy selkeästi ilmi, mihin tutkittava suostuu.

Tietoon perustuva suostumus

Ennen tutkimukseen osallistumista tutkittavilta tulee kerätä eettinen osallistumissuostumus. Ihmistieteissä tämä voi olla allekirjoitettu suostumuslomake, sähköpostivahvistus tai esimerkiksi haastattelutallenteen alussa annettu suullinen suostumus. Jos tutkimuksessa puututaan fyysiseen koskemattomuuteen tai käsitellään arkaluonteisia henkilötietoja, suosittelemme allekirjoitettua suostumuslomaketta. Huomaathan, että eettinen osallistumissuostumus ei ole sama asia kuin suostumus henkilötietojen käsittelyperusteena.

Lupa jatkokäyttöön

Yleensä tutkittavilta pyydetään osallistumissuostumus vain rajattua tutkimushanketta varten. Aineiston käyttö on sallittua vain rajauksen piiriin kuuluvaan tutkimukseen. Jos aineisto halutaan arkistoida ja jakaa käytettäväksi muuhun tutkimukseen, tästä on informoitava tutkittavia.

Tutkimusluvat

Jos opinnäytteesi käsittelee jonkun organisaation työntekijöitä tai opiskelijoita, tarvitset todennäköisesti tutkimusluvan kyseisestä organisaatiosta. Esimerkiksi kaupungeilla ja kunnilla on tyypillisesti omat käytännöt tutkimusluville. Lisätietoja tutkimusluvista yliopiston intrasta.

Miten toimin käytännössä?

Suunnittele ennen aineiston keräämistä, miten toteutat tutkittavien informoinnin (tutkimustiedote ja tietosuojailmoitus) ja miten pyydät heiltä osallistumissuostumuksen. Voit liittää tutkimustiedotteen esimerkiksi sähköpostiviestiin, osaksi kyselylomaketta tai antaa sen paperilomakkeena. Tyyli on vapaa, kunhan tutkittava saa olennaiset tiedot hankkeestasi.

Myös osallistumissuostumuksen voit pyytää eri tavoin. Esimerkiksi haastatteluissa suostumuksen voi pyytää suullisesti haastattelun alkuun. Kyselytutkimuksessa käyttäjää voi pyytää rastittamaan valintaruudun, että on hän tutustunut tutkimustiedotteeseen. Tapoja on monia.

Vältä suorien tunnisteiden, kuten nimien käsittelyä esimerkiksi pseudonymisoimalla aineisto. Poista suorat tunnisteet tai korvaa esimerkiksi nimet koodeilla, jotka vain sinä voit tarvittaessa avata.

Älä käytä tunnisteellisia tietoja myöskään tiedostojen nimissä.

Logo

Email: library@tuni.fi
P. 0294 520 900

Kirjaston kotisivut | Library homepage
Andor

Palaute | Feedback