Kun tallennat aineistosi data-arkistoon, se tallennetaan sinne toistaiseksi. Arkistointiaikaa ei siis määritellä vuosissa. Mikäli aineistoa on tarkoitus säilyttää vain rajattu aika hankkeen jälkeen tulosten verifiointia varten eikä aineiston jakamiseen ole mahdollisuuksia esimerkiksi tietosuojasyistä, omat työskentelyyn tarkoitetut tallennustilat voivat olla sopivin ratkaisu.
Tutkimusaineistojen avoimuus on keskeinen osa vastuullista ja eettistä tutkimustoimintaa. Tutkimusaineistojen avoimuuden aste voi vaihdella täysin avoimesta, osittain avoimeen tai pelkästään luvanvaraiseen käyttöön. Arvioi mikä osa aineistosta kannattaa tai voidaan avata, ja mikä osa aineistosta pitää tuhota pysyvästi. Noudata aineistojen jakamisessa ja avaamisessa periaatetta "niin avointa kuin mahdollista, niin suljettua kuin välttämätöntä". Jos et voi avata varsinaista aineistoa, julkaise kuitenkin sen metadata eli kuvailutiedot.
Datan avaamisen ajoitus riippuu paljon sinusta itsestäsi. Mistä vaiheessa haluat ja voit avata aineistosi muiden käyttöön? Sinun valintasi on, avaatko aineistosi tutkimustyön aikana vai jälkeen. Esimerkiksi Suomen Akatemia linjaa näin: ”Tuotetut tutkimusaineistot tulee saattaa avoimesti saataviksi mahdollisimman pian tutkimustulosten julkaisemisen jälkeen.”
Tutkimusaineistojen avaamisesta on hyötyä sinulle itsellesi, tiedeyhteisölle ja myös laajemmin yhteiskunnassa. Tutkimusaineistojen avaamisen myötä aineisto on käytössä sinulle itsellesi ja muille jopa vuosikymmenien päästä, tutkimuksesi saa enemmän näkyvyyttä ja julkaisusi enemmän viittauksia. Lisää tieto avatuista aineistoista ansioluetteloosi, sillä avattu aineisto on tutkijalle meriitti. Aineistojen avaaminen lisää myös tutkimuksen läpinäkyvyyttä ja toistettavuutta.
Monet tahot kannustavat tutkimusaineistojen avaamiseen. Tampereen yliopistossa ja Tampereen ammattikorkeakoulussa tuotettu tutkimusdata, tieteelliset julkaisut ja opinnäytetyöt sekä käytetyt tutkimusmenetelmät ovat lähtökohtaisesti yhteiskäyttöisiä ja avoimia.
Aineiston avaaminen data-arkistossa
Tutkimusaineistot kannattaa avata ensisijaisesi oman tieteenalan kannalta tärkeässä kansallisessa tai kansainvälisessä data-arkistossa tai tallennuspalvelussa. Tietoarkisto (FSD) ja Kielipankki ovat suomalaisia data-arkistoja, joilla on Core Trust Seal -sertifikaatti. Sertikaatti on osoitus siitä että organisaatio säilyttää sähköisiä aineistoja luotettavasti ja mahdollistaa tehokkaasti aineistojen jatkokäytön. Kansainvälisiä monitieteisiä data-arkistoja ovat esimerkiksi Zenodo ja Figshare. Arkistoja voit etsiä re3data-rekisteristä.
Data-arkistoa valitessa kiinnitä huomiota, että:
Arkistot tarjoavat erilaisia vaihtoehtoja siitä, miten rajattu tai laaja joukko voi aineistoasi käyttää. Esimerkiksi Kielipankilla on kolme käyttöoikeusluokkaa: PUB-luokka täysin julkinen jakelu, ACA-luokka tutkimus- ja opetuskäyttö, RES-luokka vaatii henkilökohtaisen luvan.
Tietoarkiston käyttöoikeusluokat ovat hyvin samankaltaiset: A vapaasti käytettävät aineistot, B tutkimukseen, opetukseen, opiskeluun käytettävät aineistot, C vain tutkimukseen ja ylempiin opinnäytteisiin käytettävä aineistot ja D vain luovuttajan luvalla käytettävät aineistot.
Data-arkistoissa aineistosi kuvailutiedot (metadata) ovat julkisesti näkyvillä. Sehän taas on vain hyvä asia, koska jo kuvailutiedot tekevät tutkimustasi näkyväksi ja markkinoivat työtäsi.
Aineiston avaaminen tutkimusartikkelin osana
Monet tieteelliset julkaisut edellyttävät tutkimusaineistojen avaamista tutkimustulosten todentamisen ja läpinäkyvyyden lisäämisen vuoksi. Tutkimusaineiston avaaminen lehtiartikkelin oheismateriaalina ei tee aineistosta välttämättä avointa, jos siihen pääseminen edellyttää esimerkiksi lehden maksullista tilausta tai artikkelin ostamista. Nykyisin monet kustantajat suosittelevat kuitenkin käyttämään data-arkistoja.
Aineiston avaaminen/kuvaileminen data-artikkelissa
Data-artikkelissa kuvataan avattu tutkimusaineisto(t) perusteellisesti eli kuvataan aineiston sisältö sekä sen kerääminen, käsittely ja käytetyt työkalut. Data-artikkelit eivät yleensä sisällä tutkimustuloksia tai keskustelua (poikkeuksena voi olla keskustelu erilaisista aineistonkeruumenetelmistä). Data-artikkeleita voidaan julkaista datalehdissä tai tieteellisen lehden erillisessä "Data Papers" -osiossa. Dataan keskittyviä lehtiä ovat esimerkiksi Scientific Data (Springer Nature), Data in Brief (Elsevier) ja Research Data Journal for the Humanities and Social Sciences (Brill).
Metadatan avaaminen
Arkistoinnin yhteydessä tutkimusaineisto myös kuvaillaan ja kuvailutiedosta tulee julkinen. Data-arkistot käyttävät usein metadastandardeja, jolloin kuvailutieto on rakenteista ja näin helposti koneluettavaa. Tutkimusaineistosta kannattaa tehdä julkinen kuvailutieto myös silloin kun aineistoa ei voi avata. Kuvailutiedossa kerrotaan aineiston sisällöstä, käyttöoikeuksista ja siinä näkyy myös tunnistetiedot.
Tutkimusaineiston julkisen kuvailun tekemiseen sopiva työkalu on CSC:n tuottama ja ylläpitämä Qvain. Qvain tukee kontrolloitujen sanastojen käyttöä, tarjoaa kattavan listan lisensseistä ja luo metadatallesi pysyvän tunnisteen. Qvaimen verkkosivuilta löydät kenttäkohtaisen kuvailuohjeen. Lisäksi Qvaimen avulla voit julkaista metadatasi suoraan tukimusaineistojen kansallisessa Etsin-hakupalvelussa.
Muistilista aineiston avaajalle:
Nykyisin monet tutkimusrahoittajat edellyttävät tutkimusaineiston avaamista. Rahoitusta hakiessa kannattaakin tarkistaa rahoittajien ajantasaiset vaatimukset. Tässä esimerkkejä muutamilta rahoittajilta:
aineisto suositellaan tallennettavaksi ensisijaisesti oman tieteenalan keskeiseen arkistoon
suosittelee tutkimusaineistojen avaamista soveltuvin osin
perustelluista syistä aineiston voi jättää avaamatta. Perusteltuja syitä ovat esimerkiksi lainsäädännön ja sopimusten asettamat rajoitukset.
Artikkelikäsikirjoituksen arvioijat voivat vaatia pääsyä tutkimusdataan. Zenodon kautta pystyt jakamaan linkin tutkimusdataan siten, että kaksoissokkomenettely arvioinnissa ei vaarannu. Huom. Zenodon linkki dataan on väliaikainen, voimassa vain kuukauden ajan datan lisäämisestä arkistoon.
Datan saaatavuustieto eli Data Availability Statement (DAS) on hyvä liittää osaksi tutkimusjulkaisua. DASin avulla kerrot julkaisusi taustalla olevasta datasta ja sen saatavuudesta. DAS edistää tutkimusprosessin avoimuutta sekä tuo tutkimusdatallesi näkyvyyttä ja löydettävyyttä. DAS tukee myös FAIR-periaatteiden toteutumista tutkimuksessasi. Myös koodin saatavuudesta on tärkeää kertoa. Sen voit tehdä DASin yhteydessä tai omalla Code Availability -tiedolla.
Näin kirjoitat data availability statementin
Tutkimusaineistoon viittaamalla huomioidaan alkuperäisen tutkijan asema käytetyn tutkimusaineiston tuottajana tai kerääjänä. Viittauskäytäntöjä ohjaavat tekijänoikeuslaki, käytetyn data-arkiston ohjeet ja tutkimusyhteisön normit.
Aineiston säilytyspalveluilla on omia yleisempiä ohjeita, jonka lisäksi yksittäisten aineistojen metadata saattaa sisältää viittausohjeita. Mikäli tarkempia viittausohjeita ei ole saatavilla, aineistoon viitataan kuten mihin tahansa julkaisuun.
Tutkimuksen vastuullista arviointia koskevissa linjauksissa korostetaan entistä painokkaammin tutkimusdataan viittaamista yhtenä osana tutkimustuotosten moninaisuuden huomioimista. Vastuu dataviittausten vakiinnuttamisessa on niin tutkimusorganisaatioilla, tiedepoliittisilla toimijoilla, rahoittajilla, julkaisijoilla kuin myös yksittäisillä tutkijoilla.
CrossCite on työkalu, joka auttaa dataviitteen tekemisessä.
Lue lisää:
Pitkäaikaissäilytys (PAS) turvaa digitaalisen tutkimusaineiston säilymisen ymmärrettävänä ja käytettävänä useiden kymmenien ja jopa satojen vuosien ajan. Tampereen yliopistolla on oma PAS-prosessi, jossa ensin tunnistetaan merkittävät tutkimusaineistot ja tämän jälkeen siirretään ne PAS-palveluun. Ota yhteyttä Datapalveluun (researchdata@tuni.fi), jos arvelet aineistojesi soveltuvan pitkäaikaissäilytykseen.
Tutkimukseen osallistuneille henkilöitä tulee jo aineiston keruuvaiheessa informoida siitä, kauanko heihin liittyvää aineistoa tullaan tutkimuksen puitteissa säilyttämään. Aineistojen säilytys on muutenkin hyvä suunnitella jo mahdollisimman alkuvaiheessa tutkimuksen alkaessa. Mikäli aineistoon kohdistuisi esim. pitkäaikaissäilytyksen tarvetta, ennakoiva säilytyksen suunnittelu (mm. säilytyspaikat, pitkäaikaissäilytykseen optimoidut tiedostoformaatit jne.) edesauttaa aineiston säilytykseen siirtämistä tutkimuksen päätyttyä.
Tarttuvat ja sallivat lisenssit
Avoimet lisenssit voidaan karkeasti jakaa kahteen luokkaan: tarttuviin (copyleft) ja salliviin lisensseihin. Molemmissa tapauksissa kuka tahansa voi vapaasti käyttää tai kopioida alkuperäisen ohjelman. Lisenssien ero näkyy johdannaisteosten lisensoinnissa.
Sallivat lisenssit saattavat kiinnostaa enemmän kaupallisia toimijoita ja tarttuvat lisenssit puolestaan itsenäisiä ohjelmiston kehittäjiä. Kumpikaan lisenssityyppi ei aseta suoria rajoitteita ohjelmiston kaupalliselle käytölle. Vapaata ohjelmaa voidaan käyttää yksityisessä liiketoiminnassa ja esimerkiksi ohjelman tukipalveluita voidaan myydä. Yritys voi maksaa ohjelmiston kehittäjälle lisäominaisuuksien toteuttamisesta.
Lisenssin valitseminen lähdekoodille
Lähdekoodin lisensoinnista tulee huolehtia asianmukaisesti. Ohjelmiston itsenäinen kaupallistaminen voi olla perusteena käytetyn lisenssin valinnalle. Valinnassa tulee ottaa huomioon myös tapauskohtaiset vaatimukset tulevista lisensoinnin tarpeista. Lisenssivalinnasta on syytä keskustella myös esimiehen, laboratorion vetäjän tai dekaanin kanssa. Jos ohjelmistoon liittyy kaupallisia intressejä, ota yhteyttä yliopiston innovaatiopalveluihin inventions@tuni.fi.
Jos jatkat jo olemassa olevan lähdekoodin kehittämistä, käytä samaa lisenssiä kuin alkuperäisessä ohjelmassa. Saman lisenssin käyttäminen voi olla pakollista ja joka tapauksessa se on melkein aina järkevää. Jos aloitat tyhjästä, valitse tunnettu lisenssi, kuten MIT, GNU GPL tai BSD. Älä rajoita ohjelman käyttöä vain johonkin tiettyyyn tarkoitukseen. Rajoitukset estävät usein koodin integroimisen johonkin suurempaan ohjelmaan.
Lisensseillä määrität avaamallesi datalle käyttöehdot. Creative Commons -lisenssit sopivat tutkimusaineistolle ja metadatalle. CC-lisenssit vaativat, että työtäsi käyttävät henkilöt mainitsevat sinut alkuperäisenä tekijänä haluamallasi tavalla, mutta työtäsi voidaan jakaa ja muokata asettamiesi ehtojen mukaisesti. Tutkimusaineistolle suositeltavia Creative Commons -lisenssejä ovat CC BY ja CC0 lisenssit. Metadatalle suositellaan CC0-lisenssiä.
Katso eri lisenssivaihtoehdoista tarkemmin tämän oppaan Tekijänoikeus-sivulta.