Skip to Main Content

Tutkijan opas vastuulliseen ja avoimeen tieteeseen

Kirjaston opas tutkimuksen ja tutkijan tueksi

Aineiston avaaminen

Kun tallennat aineistosi data-arkistoon, se tallennetaan sinne toistaiseksi. Arkistointiaikaa ei siis määritellä vuosissa. Mikäli aineistoa on tarkoitus säilyttää vain rajattu aika hankkeen jälkeen tulosten verifiointia varten eikä aineiston jakamiseen ole mahdollisuuksia esimerkiksi tietosuojasyistä, omat työskentelyyn tarkoitetut tallennustilat voivat olla sopivin ratkaisu.

Tutkimusaineistojen avoimuus on keskeinen osa vastuullista ja eettistä tutkimustoimintaa. Tutkimusaineistojen avoimuuden aste voi vaihdella täysin avoimesta, osittain avoimeen tai pelkästään luvanvaraiseen käyttöön. Arvioi mikä osa aineistosta kannattaa tai voidaan avata, ja mikä osa aineistosta pitää tuhota pysyvästi. Noudata aineistojen jakamisessa ja avaamisessa periaatetta "niin avointa kuin mahdollista, niin suljettua kuin välttämätöntä". Jos et voi avata varsinaista aineistoa, julkaise kuitenkin sen metadata eli kuvailutiedot.

Datan avaamisen ajoitus riippuu paljon sinusta itsestäsi. Mistä vaiheessa haluat ja voit avata aineistosi muiden käyttöön? Sinun valintasi on, avaatko aineistosi tutkimustyön aikana vai jälkeen. Esimerkiksi Suomen Akatemia linjaa näin: ”Tuotetut tutkimusaineistot tulee saattaa avoimesti saataviksi mahdollisimman pian tutkimustulosten julkaisemisen jälkeen.”

Tutkimusaineistojen avaamisesta on hyötyä sinulle itsellesi, tiedeyhteisölle ja myös laajemmin yhteiskunnassa. Tutkimusaineistojen avaamisen myötä aineisto on käytössä sinulle itsellesi ja muille jopa vuosikymmenien päästä, tutkimuksesi saa enemmän näkyvyyttä ja julkaisusi enemmän viittauksia. Lisää tieto avatuista aineistoista ansioluetteloosi, sillä avattu aineisto on tutkijalle meriitti. Aineistojen avaaminen lisää myös tutkimuksen läpinäkyvyyttä ja toistettavuutta.

Monet tahot kannustavat tutkimusaineistojen avaamiseen. Tampereen yliopistossa ja Tampereen ammattikorkeakoulussa tuotettu tutkimusdata, tieteelliset julkaisut ja opinnäytetyöt sekä käytetyt tutkimusmenetelmät ovat lähtökohtaisesti yhteiskäyttöisiä ja avoimia.

Aineiston avaaminen data-arkistossa

Tutkimusaineistot kannattaa avata ensisijaisesi oman tieteenalan kannalta tärkeässä kansallisessa tai kansainvälisessä data-arkistossa tai tallennuspalvelussa. Tietoarkisto (FSD) ja Kielipankki ovat suomalaisia data-arkistoja, joilla on Core Trust Seal -sertifikaatti. Sertikaatti on osoitus siitä että organisaatio säilyttää sähköisiä aineistoja luotettavasti ja mahdollistaa tehokkaasti aineistojen jatkokäytön. Kansainvälisiä monitieteisiä data-arkistoja ovat esimerkiksi Zenodo ja Figshare. Arkistoja voit etsiä re3data-rekisteristä.  

Data-arkistoa valitessa kiinnitä huomiota, että:

  • arkisto antaa datalle pitkäaikaistunnisteen, kuten DOI tai URN.
  • arkisto julkaisee koneluettavan metadatan ja käyttää tunnettua metadatastandardia.
  • arkistolla on selkeät ehdot dataan pääsystä ja sen käyttämisestä.
  • arkisto antaa sinun valita minkälaisilla käyttöehdoilla (esimerkiksi embargo, jolla voidaan teknisesti rajoittaa milloin aineisto on saatavilla) ja lisensseillä (esimerkiksi CC-BY-lisenssit) tutkimusaineistosi on jatkokäytettävissä.
  • arkistolla on toiminnan luotettavuutta osoittava sertifikaatti (esimerkiksi Core Trust Seal ja ISO 16363 standardi).
  • arkistolla saattaa olla tiettyjä vaatimuksia arkistoitavalle datalle, joten sinun kannattaa olla yhteydessä tutkimusaineistollesi sopivaan arkistoon jo tutkimusprojektisi alkuvaiheessa.

Arkistot tarjoavat erilaisia vaihtoehtoja siitä, miten rajattu tai laaja joukko voi aineistoasi käyttää. Esimerkiksi Kielipankilla on kolme käyttöoikeusluokkaa: PUB-luokka täysin julkinen jakelu, ACA-luokka tutkimus- ja opetuskäyttö, RES-luokka vaatii henkilökohtaisen luvan.

Tietoarkiston käyttöoikeusluokat ovat hyvin samankaltaiset: A vapaasti käytettävät aineistot, B tutkimukseen, opetukseen, opiskeluun käytettävät aineistot, C vain tutkimukseen ja ylempiin opinnäytteisiin käytettävä aineistot ja D vain luovuttajan luvalla käytettävät aineistot.

Data-arkistoissa aineistosi kuvailutiedot (metadata) ovat julkisesti näkyvillä. Sehän taas on vain hyvä asia, koska jo kuvailutiedot tekevät tutkimustasi näkyväksi ja markkinoivat työtäsi.

Aineiston avaaminen tutkimusartikkelin osana

Monet tieteelliset julkaisut edellyttävät tutkimusaineistojen avaamista tutkimustulosten todentamisen ja läpinäkyvyyden lisäämisen vuoksi. Tutkimusaineiston avaaminen lehtiartikkelin oheismateriaalina ei tee aineistosta välttämättä avointa, jos siihen pääseminen edellyttää esimerkiksi lehden maksullista tilausta tai artikkelin ostamista. Nykyisin monet kustantajat suosittelevat kuitenkin käyttämään data-arkistoja.

Aineiston avaaminen/kuvaileminen data-artikkelissa

Data-artikkelissa kuvataan avattu tutkimusaineisto(t) perusteellisesti eli kuvataan aineiston sisältö sekä sen kerääminen, käsittely ja käytetyt työkalut. Data-artikkelit eivät yleensä sisällä tutkimustuloksia tai keskustelua (poikkeuksena voi olla keskustelu erilaisista aineistonkeruumenetelmistä). Data-artikkeleita voidaan julkaista datalehdissä tai tieteellisen lehden erillisessä "Data Papers" -osiossa. Dataan keskittyviä lehtiä ovat esimerkiksi Scientific Data (Springer Nature), Data in Brief (Elsevier) ja Research Data Journal for the Humanities and Social Sciences (Brill).

Metadatan avaaminen

Arkistoinnin yhteydessä tutkimusaineisto myös kuvaillaan ja kuvailutiedosta tulee julkinen. Data-arkistot käyttävät usein metadastandardeja, jolloin kuvailutieto on rakenteista ja näin helposti koneluettavaa. Tutkimusaineistosta kannattaa tehdä julkinen kuvailutieto myös silloin kun aineistoa ei voi avata. Kuvailutiedossa kerrotaan aineiston sisällöstä, käyttöoikeuksista ja siinä näkyy myös tunnistetiedot.

Tutkimusaineiston julkisen kuvailun tekemiseen sopiva työkalu on CSC:n tuottama ja ylläpitämä Qvain. Qvain tukee kontrolloitujen sanastojen käyttöä, tarjoaa kattavan listan lisensseistä ja luo metadatallesi pysyvän tunnisteen. Qvaimen verkkosivuilta löydät kenttäkohtaisen kuvailuohjeen. Lisäksi Qvaimen avulla voit julkaista metadatasi suoraan tukimusaineistojen kansallisessa Etsin-hakupalvelussa.

Muistilista aineiston avaajalle:

  • Suunnittele aineiston avaaminen etukäteen! Aineistonhallintasuunnitelmasta on apua.
  • Muista informoida tutkittavia aineiston avaamisesta ja pyytää heiltä siihen suostumus. Tietoarkistolla on erinomaiset ohjeet arkistoinnista informointiin.
  • Kuvaile tutkimusaineistosi huolella, jotta muutkin ymmärtävät mistä aineistossasi on kyse.
  • Tarkista, etteivät eettiset tai lainsäädännölliset seikat estä tutkimusaineiston julkaisemista ja avaamista
  • Suosi data-arkistoa, joka tarjoaa aineistolle pysyvän tunnisteen (esimerkiksi DOI, URN), ja mahdollistaa siten viittaamisen aineistoon.
  • Määritä tutkimusaineistolle selkeät käyttöehdot esimerkiksi lisensseillä tai arkistojen omilla käyttöehdoilla.

Rahoittajien vaatimukset aineiston avaamisesta

Nykyisin monet tutkimusrahoittajat edellyttävät tutkimusaineiston avaamista. Rahoitusta hakiessa kannattaakin tarkistaa rahoittajien ajantasaiset vaatimukset. Tässä esimerkkejä muutamilta rahoittajilta:

  • Bill & Melinda Gates:
    • julkaistujen tutkimustulosten taustalla oleva tutkimusaineisto on avattava välittömästi
    • eettiset ja lainsäädännölliset syyt voivat estää aineisto avaamisen
    • aineisto suositellaan tallennettavaksi ensisijaisesti oman tieteenalan keskeiseen arkistoon

  • Business Finland:
    • suosittelee tutkimusaineistojen avaamista soveltuvin osin

  • Horizon Europe:
    • aineisto on avattava niin pian kuin mahdollista ja noudatettava aineistohallintasuunnitelmassa määriteltyä aikataulua
    • aineiston avaamiseen on käytettävä luotettavaa data-arkistoa (tarkista onko rahoitusohjelmassa erityisiä vaatimuksia arkistolle)
    • aineiston käyttöehdot on määriteltävä Creative Common -lisenssillä tai vastaavalla. Suositeltavia Creative Commons -lisenssejä ovat CC BY ja CC0. Avatun tutkimusaineiston kuvailutietojen käyttöoikeudet on määriteltävä CC0-lisenssillä.
    • perustelluista syistä aineiston voi jättää avaamatta. Perusteltuja syitä ovat esimerkiksi IPR-oikeudet.
  • Koneen säätiö:
    • suosittelee, että tutkimusten yhteydessä kerätyt aineistot arkistoidaan jatkokäyttöä varten.
  • NordForsk:
    • aineistot on avattava projektin päätyttyä
    • aineisto on avattava sertifioidussa data-arkistossa
    • perustelluista syistä aineiston voi jättää avaamatta. Perusteltuja syitä ovat esimerkiksi lainsäädännön ja sopimusten asettamat rajoitukset.

  • Suomen Akatemia:
    • aineistot on avattava mahdollisimman pian tutkimustulosten julkaisemisen jälkeen
    • aineistot on avattava tutkimusorganisaation tai tieteenalan kannalta tärkeässä kansallisessa tai kansainvälisessä data-arkistossa
    • perustelluista syistä aineistolla voi olla erilaisia avoimuuden asteita.
    • aineiston avaajan on varmistettava, ettei julkaiseminen ole viranomaisten toiminnan julkisuudesta annetun lain, tietosuojalain tai tekijänoikeuslain vastaista
    • aineiston lisenssoinnista on huolehdittava.
  • Sherpa/Juliet Service on hakupalvelu, joka tarjoaa uusimman tiedon rahoittajien linjauksista ja vaatimuksista avoimeen tieteeseen, julkaisemiseen ja arkistointiin liittyen.

Aineiston avaaminen vertaisarviontia varten

Artikkelikäsikirjoituksen arvioijat voivat vaatia pääsyä tutkimusdataan. Zenodon kautta pystyt jakamaan linkin tutkimusdataan siten, että kaksoissokkomenettely arvioinnissa ei vaarannu. Huom. Zenodon linkki dataan on väliaikainen, voimassa vain kuukauden ajan datan lisäämisestä arkistoon.  

Datan lisääminen Zenodoon arvioijia varten (pdf)

Data availability statement (DAS)

Datan saaatavuustieto eli Data Availability Statement (DAS) on hyvä liittää osaksi tutkimusjulkaisua. DASin avulla kerrot julkaisusi taustalla olevasta datasta ja sen saatavuudesta. DAS edistää tutkimusprosessin avoimuutta sekä tuo tutkimusdatallesi näkyvyyttä ja löydettävyyttä. DAS tukee myös FAIR-periaatteiden toteutumista tutkimuksessasi. Myös koodin saatavuudesta on tärkeää kertoa. Sen voit tehdä DASin yhteydessä tai omalla Code Availability -tiedolla.

Näin kirjoitat data availability statementin

  • Tutustu kustantajan ja rahoittajan ohjeisiin.
  • Kirjoita DAS, vaikka kustantaja tai rahoittaja ei sitä vaatisikaan.
  • Jos hyödynnät kustantajan tarjoamia mallilauseita, varmista, että ne kuvaavat dataasi. Muokkaa niitä tarvittaessa. Mallilauseiden esimerkkejä datan saatavuudesta löydät esimerkiksi täältä: SpringerNature, Taylor & Francis. Koodin saatavavuuden mallilauseiden esimerkkejä tarjoaa PLOS.
  • Kerro saatavuudesta datakohtaisesti.
    • Kerro missä data on saatavissa ja liittyykö saatavuuteen ehtoja.
    • Ilmoita arkisto ja pysyvän tunnisteen linkki. Ilmoita mahdollinen lisenssi.
    • Jos data on saatavissa tutkijalta, kerro miten ja mistä data on mahdollista saada käyttöön. Mieti kuinka kauan sinulla tutkijana on mahdollista säilyttää dataa.
    • Jos datan käyttöön liittyy rajoituksia, kerro mistä rajoitukset johtuvat ja millä ehdoilla dataa olisi mahdollista käyttää.
    • Jos data ei ole saatavissa, kerro mistä syystä.
  • Jos julkaisussa ei ole käytetty dataa, kerro tästä DAS-ilmoituksessa.
  • Jos käytit jonkun muun tuottamaa dataa, tee asianmukainen viittaus.

Tutkimusaineistoihin viittaaminen

Tutkimusaineistoon viittaamalla huomioidaan alkuperäisen tutkijan asema käytetyn tutkimusaineiston tuottajana tai kerääjänä. Viittauskäytäntöjä ohjaavat tekijänoikeuslaki, käytetyn data-arkiston ohjeet ja tutkimusyhteisön normit.

Aineiston säilytyspalveluilla on omia yleisempiä ohjeita, jonka lisäksi yksittäisten aineistojen metadata saattaa sisältää viittausohjeita. Mikäli tarkempia viittausohjeita ei ole saatavilla, aineistoon viitataan kuten mihin tahansa julkaisuun.

Tutkimuksen vastuullista arviointia koskevissa linjauksissa korostetaan entistä painokkaammin tutkimusdataan viittaamista yhtenä osana tutkimustuotosten moninaisuuden huomioimista. Vastuu dataviittausten vakiinnuttamisessa on niin tutkimusorganisaatioilla, tiedepoliittisilla toimijoilla, rahoittajilla, julkaisijoilla kuin myös yksittäisillä tutkijoilla. 

CrossCite on työkalu, joka auttaa dataviitteen tekemisessä.

Lue lisää:

Datan pitkäaikaissäilytys (PAS)

Pitkäaikaissäilytys (PAS) turvaa digitaalisen tutkimusaineiston säilymisen ymmärrettävänä ja käytettävänä useiden kymmenien ja jopa satojen vuosien ajan. Tampereen yliopistolla on oma PAS-prosessi, jossa ensin tunnistetaan merkittävät tutkimusaineistot ja tämän jälkeen siirretään ne PAS-palveluun. Ota yhteyttä Datapalveluun (researchdata@tuni.fi), jos arvelet aineistojesi soveltuvan pitkäaikaissäilytykseen.

Tutkimukseen osallistuneille henkilöitä tulee jo aineiston keruuvaiheessa informoida siitä, kauanko heihin liittyvää aineistoa tullaan tutkimuksen puitteissa säilyttämään. Aineistojen säilytys on muutenkin hyvä suunnitella jo mahdollisimman alkuvaiheessa tutkimuksen alkaessa. Mikäli aineistoon kohdistuisi esim. pitkäaikaissäilytyksen tarvetta, ennakoiva säilytyksen suunnittelu (mm. säilytyspaikat, pitkäaikaissäilytykseen optimoidut tiedostoformaatit jne.) edesauttaa aineiston säilytykseen siirtämistä tutkimuksen päätyttyä.

Lähdekoodin avaaminen ja lisenssit

Tarttuvat ja sallivat lisenssit

Avoimet lisenssit voidaan karkeasti jakaa kahteen luokkaan: tarttuviin (copyleft) ja salliviin lisensseihin. Molemmissa tapauksissa kuka tahansa voi vapaasti käyttää tai kopioida alkuperäisen ohjelman. Lisenssien ero näkyy johdannaisteosten lisensoinnissa. 

  • Tarttuva lisenssi tarkoittaa, että ohjelmistoon tehtävät muutokset on jatkossa lisensioitava samoilla ehdoilla kuin alkuperäinen ohjelmisto. Jos ohjelma A:lla on GPL-lisenssi (niin, että se voidaan vapaasti kopioida), myös sen johdannaisohjelmilla A¹ ja A² on oltava GPL-lisenssi (eli myös ne ovat vapaasti kopioitavissa).
  • Salliva lisenssi mahdollistaa ohjelmiston muuttamisen ja levittämisen myös kaupalliseen tarkoitukseen. Esimerkiksi, jos ohjelma B on lisensoitu BSD-lisenssillä, siitä voidaan tehdä kaupalliset versiot B¹,  B² jne. Johdannaisohjelmille voitaisiin antaa myös GPL-lisenssi, jolloin näiden johdannaiset olisi lisensoitava GPL-lisenssillä.

Sallivat lisenssit saattavat kiinnostaa enemmän kaupallisia toimijoita ja tarttuvat lisenssit puolestaan itsenäisiä ohjelmiston kehittäjiä. Kumpikaan lisenssityyppi ei aseta suoria rajoitteita ohjelmiston kaupalliselle käytölle. Vapaata ohjelmaa voidaan käyttää yksityisessä liiketoiminnassa ja esimerkiksi ohjelman tukipalveluita voidaan myydä. Yritys voi maksaa ohjelmiston kehittäjälle lisäominaisuuksien toteuttamisesta.

Lisenssin valitseminen lähdekoodille

Lähdekoodin lisensoinnista tulee huolehtia asianmukaisesti. Ohjelmiston itsenäinen kaupallistaminen voi olla perusteena käytetyn lisenssin valinnalle. Valinnassa tulee ottaa huomioon myös tapauskohtaiset vaatimukset tulevista lisensoinnin tarpeista. Lisenssivalinnasta on syytä keskustella myös esimiehen, laboratorion vetäjän tai dekaanin kanssa. Jos ohjelmistoon liittyy kaupallisia intressejä, ota yhteyttä yliopiston innovaatiopalveluihin inventions@tuni.fi.

Jos jatkat jo olemassa olevan lähdekoodin kehittämistä, käytä samaa lisenssiä kuin alkuperäisessä ohjelmassa. Saman lisenssin käyttäminen voi olla pakollista ja joka tapauksessa se on melkein aina järkevää. Jos aloitat tyhjästä, valitse tunnettu lisenssi, kuten MIT, GNU GPL tai BSD. Älä rajoita ohjelman käyttöä vain johonkin tiettyyyn tarkoitukseen. Rajoitukset estävät usein koodin integroimisen johonkin suurempaan ohjelmaan.

 

Creative Commons -lisenssit

Lisensseillä määrität avaamallesi datalle käyttöehdot. Creative Commons -lisenssit sopivat tutkimusaineistolle ja metadatalle. CC-lisenssit vaativat, että työtäsi käyttävät henkilöt mainitsevat sinut alkuperäisenä tekijänä haluamallasi tavalla, mutta työtäsi voidaan jakaa ja muokata asettamiesi ehtojen mukaisesti. Tutkimusaineistolle suositeltavia Creative Commons -lisenssejä ovat CC BY  ja CC0 lisenssit. Metadatalle suositellaan CC0-lisenssiä.

Katso eri lisenssivaihtoehdoista tarkemmin tämän oppaan Tekijänoikeus-sivulta.

Logo

Email: library@tuni.fi
P. 0294 520 900

Kirjaston kotisivut | Library homepage
Andor

Palaute | Feedback