Skip to Main Content

Tutkijan opas vastuulliseen ja avoimeen tieteeseen

Kirjaston opas tutkimuksen ja tutkijan tueksi

Mitä vastuullinen aineistonhallinta on?

Vastuullisessa aineistonhallinnassa korostuu aineistojen elinkaaren huolellinen suunnittelu sekä tutkimusetiikan periaatteiden huomioiminen aineiston keräämisessä, käsittelyssä ja avaamisessa. ​Hyvä tieteellinen käytäntö ​koskee kaikkea tutkimusta ja sen perusperiaatteita ovat luotettavuus, rehellisyys, arvostus ja vastuunkanto.​ Hyvän tieteellisen käytännön mukaisesti tutkimusaineistojen hankkimisen, käsittelyn ja tallentamisen tulee täyttää tieteellisen tutkimuksen kriteerit ja olla eettisesti kestävää. Lisäksi eri aloilla tehtävää tutkimusta voi säädellä alakohtaiset eettiset ohjeistukset, joita tulee noudattaa aina aineistoja kerättäessä ja käsiteltäessä.

Esimerkkejä ala- ja aihekohtaisista eettisistä ohjeistuksista ja suosituksista:

Tarkista myös aina, millaista keskustelua oman tieteenalasi kontekstissa käydään tutkimusetiikasta ja millaisiin keskeisiin lähteisiin viitataan. Useilla aloilla on alakohtaisesta eettisestä pohdinnasta olemassa painettua kirjallisuutta sekä verkkotekstejä (mm. historian tutkimus, internet-tutkimus, lasten ja nuorten tutkimus, tekniikan alat, median ja viestinnän tutkimus).

Tutkijanuralla kehittyminen edellyttää vastuullisen aineistonhallinnan osaamista ja eettisten periaatteiden sisäistäminen on osa jokaisen tutkijan perustaitoja. Jokainen tutkija ja tutkimusryhmän jäsenet ovat vastuussa siitä, että tutkimuksen tekemisessä noudatetaan sekä yleisiä että alakohtaisia tutkimuseettisiä periaatteita. Vastuullisuus pohjaa suunnitelmallisuuteen ja aineistojen kohdalla niiden elinkaaren huolelliseen suunnitteluun. Aineiston elinkaaren suunnittelussa ja hallinnassa auttaa aineistonhallintasuunnitelma

 

Kaavio: Esimerkki aineiston eettisen elinkaaren suunnittelusta

 

Vastuullisessa aineistonhallinnassa osaat tunnistaa tutkimuseettiset näkökulmat ja käsitellä niiden mukaisesti aineistoja sekä tutkittavia. Sekä aineistonhallinta että tutkimusetiikka on hyvä ymmärtää koko tutkimusprosessia läpileikkaavana asiana​. Usein tutkimuseettisiin kysymyksiin on hankalaa antaa yhtä oikeaa ratkaisua, sillä eettiset haasteet vaihtelevat tutkimuskysymyksestä ja aineistosta riippuen.

Tutkimusaineistolla, eli tutkimusdatalla tarkoitetaan tieteellisessä tutkimuksessa tuotettuja, muokattuja ja käytettyjä aineistoja, joihin tutkimuksen tulokset perustuvat. Tutkimusdata koostuu lisäksi datan kontekstia, aineistokokonaisuutta tai havaintoyksikköä kuvailevista metatiedoista. Myös tutkimus- kehittämis- ja innovaatioprojekteissa (TKI) käytetyt ja tuotetut materiaalit, menetelmät ja tulokset ovat tässä yhteydessä tutkimusaineistoja.

Erilaisilla aineistotyypeillä voi olla erilaisia vaatimuksia aineistonhallinnalle, jotka tutkijan tulee osata ymmärtää. 

  • Arkistosta kerättävä aineisto
    • Aineistolla on jo omistaja ja säilytyspaikka sekä aineisto on jo valmiiksi pitkäaikaistallennuksessa ja jatkokäytettävää. Arkistossa olevaa aineistoa ei siten avata uudelleen. Arkistoaineiston metatiedot ovat myös tyypillisesti jo saatavilla. Tutkijan kannattaa kuitenkin tuottaa kuvailevaa tietoa käyttämästään arkistoaineistosta erityisesti silloin, jos aineistoa kerätään useasta eri arkistosta. Koko aineistokokonaisuuden ja sen keräämisen kuvailu ja sen julkaiseminen voi hyödyttää muita tutkijoita.
  • Kuva-aineisto
    • Se mistä ja miten kuva kerätään tai saadaan, vaikuttaa aineistonhallintaan. Muiden tuottamien kuvien kohdalla tekijänoikeus voi rajoittaa kuvan käyttämistä ja erityisesti sen avaamista. Kuvien julkaisemisessa tutkimusjulkaisuissa voi myös olla rajoitteita. Tutkittavilta saatuihin kuviin liittyy myös tekijänoikeus ja tutkittavilta tulee saada lupa käyttää kuvaa haluamallaan tavalla. Mikäli kuvassa on henkilöitä, sisältää se henkilötietoa, jolloin kuvia tulisi käsitellä henkilötietoaineistona. Kuvissa esiintyviltä henkilöiltä tulisi saada suostumus kuvan julkaisuun. Kuvien ja muun tekijänoikeuden alaisen aineiston käyttöön vaikuttaa lisäksi tekijänoikeuden suoja-aika.  
  • Jonkin laitteen tuottama numeerinen data
    • Datan määrä voi olla suuri, joten säilytystilaa saatetaan tarvita paljon. Myös laskentakapasiteetille voi olla tarvetta. Raakadataa ei välttämättä ole aina tarpeen julkaista tai edes säilyttää. Raakadatan mahdollinen tuhoaminen tulee siis miettiä. Metadatassa on keskeistä kuvata mm. laitteisto, testitilanne, testaukset, sensorit, protokollat ja muut datan keräämiseen ja käsittelyyn liittyvät keskeiset elementit. 
  • Kudosnäyte tai muu biologinen näyte
    • On tyypillisesti fyysinen näyte, jolloin sen kerääminen, siirtäminen ja säilyttäminen tapahtuu fyysisessä, kontrolloidussa  ympäristössä. Näytettä ei voi tyypillisesti avata jatkokäyttöön. Näytteiden saaminen voi usein edellyttää lupaa tai hakemusta (mm. Biopankit).
  • Ääniaineisto
    • Ääni on henkilötietoja, joten ääniaineistojen keräämisessä tulee aina huomioida tietosuoja ja sen edellytykset. Ääniaineisto tyypillisesti litteroidaan ja litteroitu teksti anonymisoidaan. Ääninauhojen säilytys pitää miettiä huolella henkilötietojen vuoksi, ja pitää nauhat erillään anonymisoiduista litteraateista. Äänitiedostojen avaaminen on tietosuojan vuoksi usein mahdotonta. Kielipankki vastaanottaa äänitiedostoja, mutta tarkista kriteerit aina Kielipankista. 

Vastuullinen aineistonhallinta tutkijan uran suunnittelussa

Vahvalla aineistonhallintataitojen osaamisella pyritään tuottamaan laadukasta ja vaikuttavaa tutkimusta, jossa käytetyt prosessit ja saadut tuotokset ovat toistettavia ja läpinäkyviä. Vankka aineistonhallintaan liittyvä osaaminen on tärkeää tutkijanuran kaikissa vaiheissa. 

Yliopiston määrittämien tutkimusosaamisen yleisten periaatteiden mukaan, yliopisto ”arvostaa tutkimusosaamista ja tarjoaa tukea ja välineitä sen hankkimiseksi, arvioimiseksi, kehittämiseksi ja ylläpitämiseksi koko tutkijanuran ajan.” Taitojen ylläpitämiseksi jokaisen yliopiston tutkijan ”tulee varmistaa henkilökohtainen perustason osaaminen ainakin tutkimusetiikassa, tietosuojassa, datanhallinnassa ja tutkimusmenetelmien hallinnassa sekä avoimessa tieteessä.”

Saavuttaakseen perustason osaamisen aineistonhallinnan osalta tutkijan tulisi:

 

Tutkijan uran myöhemmissä vaiheissa aineistonhallintaosaamisen perustason lisäksi tutkijan tulee hallita paljon projektin johtamiseen liittyviä aineistonhallintavastuita. Hankkeen johdon hyvä aineistonhallintaosaaminen toimii esimerkkinä muille tutkimukseen osallistuville tutkijoille ja on tae huippututkimuksen tekemiselle. Hyvin johdettu aineistonhallintatyö mahdollistaa:

  1. Systemaattisemman ja projektityöskentelyä sujuvoittavan aineistonhallintasuunnitelman tekemisen. 
  2. Selkeän vastuunjaon tutkimusprojektin eri vaiheisiin liittyville aineistonhallintatoimenpiteille, jolloin tutkimuksen vastuullisen johtajan työkuorma helpottuu. 
  3. Tutkimusaineistoon kohdistuvien lainsäädännöllisten ehtojen, tutkimuseettisten periaatteiden sekä rahoittajien ja oman organisaation vaatimusten systemaattisen ja ennakoivan huomioimisen. 

Projektin johtajan aineistonhallintavastuita ovat: 

  • Vastata hankkeen aineistonhallintasuunnitelman ylläpitämisestä. 
  • Pystyä johtamaan aineistonhallintaa niin että rahoittajien ja oman organisaation vaatimukset täyttyvät.
  • Huolehtia tutkimusaineistoihin liittyvistä sopimuksista. Hänellä tulee olla kokonaisnäkemys mm. lainsäädännön vaatimuksista kaikissa projektin vaiheissa.
  • Määritellä datanhallinnan vaatimat resurssit (aika, raha, työkalut ja palvelut).
  • Johtaa yhteisiä aineistonhallinnan käytäntöjä. 
  • Tutkimusryhmän datanhallintatehtävien roolitus, eli nimetä henkilöt, joilla on vastuu tietyistä datanhallinnan osa-alueista.
  • Sitouttaa tutkimusryhmänsä hyvään aineistonhallintaan ja pitää huoli siitä, että ryhmällä on pääsy tarvittaviin työvälineisiin. Hänen tehtävänään on myös varmistaa, että kaikilla projektissa on tarvittava koulutus siitä aineistonhallinnan osa-alueesta, josta on vastuussa.
  • Ottaa huomioon aineistonhallinnan erityispiirteet kotimaisissa ja kansainvälisissä konsortiohankkeissa. Tutkimuksesta vastaavan johtajan kannattaa jakaa omaa vastuutaan muiden hankkeeseen osallistuvien kanssa.
  • Osallistua oman organisaation data-asioiden kehittämiseen mm. kommentoimalla, tekemällä aloitteita ja nostamalla esiin kehityskohteita sekä puutteita. 

Jotta edellä esitetyt, projektin johtamiseen liittyvät osaamistavoitteet toteutuvat, tulee tutkimuksen vastaavan johtajan pitää huolta myös omasta aineistonhallintaan liittyvästä osaamisestaan. Tutkimuksen johtajan tulee:

  • Ylläpitää omaa datanhallinnan perustason osaamistaan ja varmistaa, että kaikilla hankkeessa on riittävä datanhallinnan osaaminen.
  • Tuntee datanhallinnan tukipalvelut ja käyttää niitä aktiivisesti.

Aineistoista sopiminen

Sovi aina tutkimusta tehtäessä aineistojen käyttöoikeuksista, omistajuudesta, vastuunjaosta, henkilötietojen käsittelystä sekä arkaluontoisten aineistojen hallinnasta jo ennen aineiston keruun aloittamista. Näin varmistat ja selkeytät omat ja muiden tutkijoiden käyttöoikeudet aineistoihin. Jos dataan liittyviin oikeuksiin liittyviä asioita ei ole otettu huomioon tarpeeksi ajoissa, datan jakaminen ja avaaminen eivät välttämättä onnistu. Aineistoista, tutkijoiden oikeuksista, vastuista ja velvollisuuksista sopiminen on myös osa hyvää tieteellistä käytäntöä. Lisäksi tutkimuksen rahoittajilla voi olla rahoitusehdoissaan edellytyksiä sopimuksiin, oikeuksiin ja omistajuuteen liittyen.

Aineistoista sopiminen korostuu tutkimushankkeissa. Hankkeen vastuullisen johtajan velvollisuutena on huolehtia tarvittavien sopimusten solmimisesta. Sopimus on varminta tehdä kirjallisesti ja sitä tulee tarvittaessa päivittää. Näin voidaan määritellä ja varmistaa tutkijoiden käyttöoikeudet sekä määrittää taho, joka tekee aineistoon liittyvät päätökset.

Sovi aina myös aineistojen tekijyydestä hankkeessa. Tekijyyden määrittely auttaa tutkimusaineistojen jatkokäyttäjiä viittaamaan tekijään oikein. Tietoaineistojen tuottaminen ja jakaminen lasketaan  lisäksi tutkijan ansioluettelomallissa tieteelliseksi ansioksi. Tekijyyden määrittely on keskeistä myös hyvän tieteellisen käytännön näkökulmasta. Sovi tutkimusaineistojen tekijyydestä heti tutkimushankkeen alussa. Mallina voi käyttää Tutkimuseettisen neuvottelukunnan suositusta Tieteellisten julkaisujen tekijyydestä sopimiseksi (PDF).

Mitä aineistoista sovittaessa kannattaa huomioida?

  • Mitkä aineistot on tarkoitus luovuttaa jatkokäyttöön?
  • Mikäli yksi tai useampi tutkija on tuonut tutkimushankkeeseen mukaan aiempaa tutkimusaineistoa, sisällytetäänkö tämä jatkokäyttöön luovutettavaan aineistoon?
  • Milloin aineisto tai osia aineistosta voidaan luovuttaa jatkokäyttöön?
  • Mihin käyttötarkoituksiin aineisto luovutetaan (esimerkiksi vain tutkimuskäyttöön, opetus- ja opiskelukäyttöön)?
  • Kenellä on oikeus tehdä arkistointisopimus tutkimusaineistosta?
  • Halutaanko jatkokäytölle asettaa ehtoja?
  • Mikäli jatkokäyttö halutaan tehdä luvanvaraiseksi, kuka  päättää luvan myöntämisestä?

Tutkimukseen liittyvien sopimusten laatimiseen saat apua yliopiston lakipalveluista. Yleisempien sopimusten sopimusmallit löydät yliopiston intrasta. Tutkimushankkeisiin voi liittyä muiden muassa seuraavia sopimuksia:

  • tutkimussopimus
  • oikeuksiensiirtosopimus
  • konsortiosopimus
  • salassapitosopimus
  • arkistointisopimus
  • tietosuojaan ja henkilötietojen käsittelyyn liittyviä sopimuksia
    • tietojenkäsittelysopimus
    • tutkittavan suostumus
    • sopiminen yhteisrekisterinpitäjyydestä

Lisenssit

Aineistoihin liittyviin oikeuksiin kuuluu myös julkaistavan aineiston lisenssistä päättäminen. Lisensointi varmistaa aineistojen käytettävyyden selkeiden ehtojen mukaisesti. Tampereen korkeakouluyhteisön Avoimen tieteen linjauksen mukaisesti aineistojen julkaisemisessa tulee suosia jatkokäytön sallivia koneluettavia lisenssejä. Myös rahoittajilla voi olla ehtoja datalle ja metadatalle annettavista lisensseistä. CC-lisenssit vaativat, että työtäsi käyttävät henkilöt mainitsevat sinut alkuperäisenä tekijänä haluamallasi tavalla, mutta työtäsi voidaan jakaa ja muokata asettamiesi ehtojen mukaisesti. Tutkimusaineistolle suositeltavia Creative Commons -lisenssejä ovat CC BY ja CC0. Metadatalle suositellaan CC0-lisenssiä. Lue lisää lisenssin valinnasta Creative Commons -välilehdeltä.

Sosiaalisen median aineistot

Sosiaalisen median aineistojen tutkimuskäyttö on lisääntynyt. Somedatan houkuttelevina puolina ovat aineistojen määrä ja monipuolisuus, sekä mahdollisuus tutkia somea eri menetelmillä ja näkökulmilla. Sosiaalisen median aineistojen tutkimukseen ei ole yhtä oikeaa tapaa. Sosiaalinen media asettaa datan keräämiselle ja käytölle reunaehtoja, jotka tulee aina huomioida ennen kuin aineistoa ryhdytään keräämään. 

Somedatan keräämisen ja käyttämisen kohdalla tulee huomioida erityisesti nämä seikat:

  • Erilaiset alustat ja niiden käyttöehdot.
    • Käyttöoikeudet: alustoilla voi olla rajoituksia, miten sieltä saatavaa dataa voi kerätä, käyttää ja jakaa​. Automatisoitu kerääminen tai harvestointi on usein kiellettyä. Samoin datan jakaminen kolmannelle osapuolelle on tyypillisesti kielletty.
    • Alustojen käyttöehtoja voi olla vaikea tulkita. Ehdot voivat muuttua usein ja ennakoimattomasti.
    • Alustojen intressit ovat ensisijaisesti kaupallisia ja tyypillisesti ne omistavat käyttäjien alustoille tuottaman datan. Tutkija on kolmas osapuoli palvelua tuottavan alustan ja sisältöä tuottavan käyttäjän välissä. 
    • Alustat eivät juuri mahdollista datan keräämistä laajamittaisesti.
      • Tutkimusmyönteisin ollut X, datan kerääminen on kuitenkin muuttunut maksulliseksi. 
      • Metan CrowdTangle-työkalua ei tällä hetkellä suositella käytettäväksi korkeakouluyhteisössä.

  • Somedata on usein muiden tuottamaa aineistoa (tekstiä, kuvaa, videota, jne.), jota ei voi käyttää vapaasti.
    • Tekijänoikeuslakia sovelletaan muiden tuottaman sisällön käyttämiseen. Tarvitset luvan hyödyntää aineistoa haluamallasi tavalla. 
    • Et todennäköisesti voi jakaa tekijänoikeuden alaista aineistoa eteenpäin ja esimerkiksi arkistoida sitä.
  • Somedata sisältää usein tietoa ihmisistä.
    • Sovelletaan tietosuoja-asetusta​ eli edellytetään tietosuojaperiaatteiden noudattamista.
    • Se, mitä ja miten tutkitaan, määrittää tietosuojan huomioimisen. Vaikka et tutkisi suoraan yksittäisiä henkilöitä, voi heitä olla vaikea irrottaa ilmiöstä tai asiasta.
    • Profiilin takana voi olla feikkiprofiili tai botti.
    • Tutkittavien informointi voi olla hankalaa tai mahdotonta. Mieti, miten informointi ja suostumus osallistua tutkimukseen on mahdollista toteuttaa.
      • Informoinnista poikkeaminen voi vaatia laajan vaikutustenarvioinnin
      • Mikäli poiketaan tietoon perustuvasta suostumuksesta, edellyttää se ihmistieteiden eettistä ennakkoarviointia. 
      • Kun keräät aineistoa julkisista lähteistä, voit julkaista tietosuojailmoituksen ja tutkimustiedotteen esimerkiksi tutkimusryhmäsi nettisivulla.
  • Sosiaalisen median data on aineistona hyvin monipuolista.
    • Se voi sisältää tekstiä, kuvaa, multimedia, ääntä, videoita, pelejä, elokuvia, kollektiivisia teoksia (joissa esim. tekijänoikeus monella eri taholla), jne. 
    • Osa aineistosta on nopeasti poistuvaa. Sen kerääminen ja säilyttäminen tulee suunnitella huolellisesti.
  • Rajat julkisen ja yksityisen välillä eivät ole kaikissa tapauksissa selkeitä.
    • Huomaa, että sosiaalisessa mediassa julkaistu aineisto ei monessa tapauksessa ole julkista, eikä vertaudu esimerkiksi sanomalehtikirjoitteluun. Alustojen, sivustojen ja ryhmien yksityisyysasetukset voivat muuttua.
    • Ole varovainen julkisen tai julkiselta vaikuttavan materiaalin hyödyntämisen kohdalla ja varmista sivuston ylläpitäjältä tai sisällön tuottajalta, että voit hyödyntää materiaalia tutkimustarkoituksiin. 
  • Somesta kerätyn aineiston avaaminen jatkokäyttöön ei välttämättä onnistu.
    • Alustat voivat kieltää datan jakamisen kolmannelle osapuolelle käyttöehdoissaan.
    • Aineiston arkistointi esimerkiksi Tietoarkistoon on mahdollista seuraavin reunaehdoin:
      • data on kerätty suomalaisesta palvelusta,
      • palvelun tarjoaja hyväksyy arkistoinnin,
      • tutkittavat (palvelua käyttävät ihmiset) ovat saaneet informaatiota arkistoinnista,
      • data on anonymisoitavissa.

Lue lisää:

Ahteensuu, Marko (2019), Käytätkö somedataa tutkimuksessasi? Vastuullinen tiede-sivusto.

Laaksonen, Salla-Maaria. Sosiaalinen media tutkimusaineistona. Laadullisen tutkimuksen verkkokäsikirja, Tietoarkisto.

Laaksonen, Salla-Maaria (2018). Taitavasti eettistä verkkotutkimusta. Vastuullinen tiede-sivusto.

Kosonen, M., Laaksonen, S.-M., Rydenfelt, H., & Terkamo-Moisio, A. (2018). Sosiaalinen media ja tutkijan etiikkaMedia & viestintä41(1). https://doi.org/10.23983/mv.69924 (PDF).

Rossi, Arianna (2022). The Hitchhiker's Guide to the Social Media Data Research Galaxy - A Primer. In: Bieker, F., Meyer, J., Pape, S., Schiering, I., Weich, A. (eds) Privacy and Identity Management. Privacy and Identity 2022. IFIP Advances in Information and Communication Technology, vol 671. Springer, Cham. https://doi.org/10.1007/978-3-031-31971-6_6

 

Esimerkkejä tutkimuksista, joissa käytetty somedataa:

Hiippala, T., Hausmann, A., Tenkanen, H., Toivonen, T., (2019) Exploring the linguistic landscape of geotagged social media content in urban environments, Digital Scholarship in the Humanities, Volume 34, Issue 2, June 2019, 290–309, DOI: https://doi.org/10.1093/llc/fqy049.

Chen, Y., Sherren, K., Smit, M., & Lee, K. Y. (2023). Using social media images as data in social science research. New Media & Society25(4), 849-871. DOI: https://doi.org/10.1177/14614448211038761.

Jauho, M., Pääkkönen, J., Isotalo, V., Pöyry, E. & Laaksonen, S-M., (2023) How do trendy diets emerge? An exploratory social media study on the low-carbohydrate diet in Finland, Food, Culture & Society, 26:2, 344-369, DOI: 10.1080/15528014.2021.1971436.

Ohme, J., Araujo, T., Boeschoten, L., Freelon, D., Ram, N., B. Reeves, B., N. Robinson, T.,  (2023) Digital Trace Data Collection for Social Media Effects Research: APIs, Data Donation, and (Screen) Tracking, Communication Methods and Measures, DOI: 10.1080/19312458.2023.2181319.

Valaskivi, K., Jääskeläinen, P., Huhtamäki, J., & Sumiala, J. (2023). ”Holy shit!!! Jos tuo ei herätä ihmisiä niin sitten ei mikään!” Salaliittoteoreettinen populistinen kuvittelu ja tunnestruktuurit sosiaalisessa mediassa. Media & viestintä46(1), 67–91. DOI: https://doi.org/10.23983/mv.128479

 

Muiden yliopistojen ohjeistuksia

Helsingin yliopisto: Aineisto-opas: somedata

Logo

Email: library@tuni.fi
P. 0294 520 900

Kirjaston kotisivut | Library homepage
Andor

Palaute | Feedback