Skip to Main Content

Tutkimusaineistojen hallinta: Käsittele ja tallenna

Tutkimusaineistojen tietoturvallinen käsittely

Tutkimusaineistojen elinkaaren infrastruktuuriin kuuluu yhtälailla tietoteknisiä ratkaisuja, prosesseja sekä ohjeita kaikissa tutkimuksen eri vaiheissa suunnittelusta käsittelyn päättämiseen asti. Nämä muodostavat yhdessä kokonaisuuden, jolla pyritään varmistamaan aineistojen tietoturvallinen käsittely niiden koko elinkaaren ajalle.

Aineiston luonteesta ja käsittelyn päälinjoista on useimmiten jo melko hyvä käsitys hakuvaiheessa. Aineistonhallintasuunnitelmassa kuvataan pääpiirteittäin käytettävät tietotekniset ratkaisut, tietojen mahdollinen sensitiivisyys ja tarvittaessa riskiarvioon perustuvat lisäsuojatoimenpiteet. Tiedon sensitiivisyyden tunnistamisesta ja arvioinnista tarkemmin intrassa.

Lainsäädännön muuttuessa ja teknisten ratkaisujen kehittyessä on tärkeää, että tutkijoilla on helposti saatavilla asiantuntevaa tukea jo tutkimuksen valmisteluvaiheessa. Tätä tarjoaa Kirjaston koordinoima Datapalvelu, joka tarjoaa yhden luukun periaatteella palveluita ja työvälineitä tutkimusdatan hallintaan Tampereen korkeakouluyhteisön henkilökunnalle ja opiskelijoille moniammatillisen tiimin voimin.

Tutkimuksen aktiivivaiheessa dataa kerättäessä on tärkeää löytää aineiston säilyttämiseen ja käsittelyyn soveltuvat työvälineet heti alussa. Korkeakouluyhteisön tietoteknisessä palveluluettelossa on tarjolla erilaisia tallennus- ja käsittely-ympäristöjä, joista soveltuvan löytämiseksi täytyy usein huomioida erilaisia näkökulmia: aineiston sensitiivisyys, tekniset reunaehdot, juridiset reunaehdot, käyttäjähallinta sekä ratkaisun kustannukset. Ratkaisun valinta perustuu aina riskiarvioon.

Aineiston elinkaarta suunniteltaessa on tärkeää pohtia tietoturvaa yksinkertaistaen ainakin kahdesta näkökulmasta: miten suojaamme aineiston häviämiseltä ja toisaalta miten varmistamme, että sitä ei ole mahdollista käsitellä luvattomasti. Korkeakouluyhteisön keskitetysti tarjoamissa palveluissa nämä näkökulmat on huomioitu mm. käyttöoikeuksien hallinnan, varmistuspolitiikan, ylläpitosääntöjen ja -sopimusten sekä auditointien ja erityisten turvaratkaisujen kautta. Säännöllisesti toteutettavilla tietoturva- sekä aineistonhallintakoulutuksilla on myös tärkeä rooli sen varmistamisessa, että aineistoja käsitellään vastuullisesti.

Aineiston elinkaaren lopussa on tärkeää huomioida, mitä aineiston säilyttämisestä on sovittu. Joissakin tapauksissa aineisto voidaan tallentaa ja julkaista pitkäaikaisesti (PAS) sekä mahdollistaa sen jatkokäyttö. Joissakin tilanteissa esimerkiksi rahoittaja edellyttää, että aineistoa säilytetään jonkin ennalta määritellyn ajanjakson ajan mutta voi myös olla, että aineisto on tuhottava tietoturvallisesti tutkimuksen päätyttyä. Tarkoituksenmukainen ratkaisu valitaan riskiperustaisesti ja tarvittaessa käytetään esimerkiksi tietoturvamateriaalin tuhoamiseen sopimuskumppanimme palveluja.

Tallennusratkaisuja

On suositeltavaa, että aineisto tallennetaan oman organisaatiosi tarjoamaan ja ylläpitämään turvalliseen paikkaan.

Kun olet valitsemassa säilytyspaikkaa tutkimusaineistollesi, sinun kannattaa arvioida seuraavia asioita:

  • millaista tutkimusaineistoa olet keräämässä ja tuottamassa? Miten aiot käsitellä sitä? (tutkimusaineiston tyyppi ja määrä saattavat rajoittaa joidenkin säilytysvaihtoehtojen käyttämistä)
  • miten aiot tallentaa, säilyttää, käyttää, varmuuskopioida tai siirtää tutkimusaineistoasi?
  • kenen kanssa aiot jakaa tutkimusaineistosi?
  • miten tutkimusaineistoon pääsyä tarvitsee rajoittaa (pääsynhallinta)?
  • aiotko muokata tutkimusaineistoasi tutkimuksen aikana?
  • sisältääkö aineistosi sensitiivistä materiaalia? Sisältääkö se henkilötietoja?

Miettimällä vastauksia yllä oleviin kysymyksiin, pystyt valitsemaan helpommin juuri sinun tutkimusaineistollesi sopivimman säilytyspaikan. Tampereen korkeakouluyhteisön tallennuspalveluita voidaan räätälöidä erilaisiin tarpeisiin.

Tutkimusaineistojen säilyttämiseen sopivat palvelut Tampereen korkeakouluyhteisössä

  • Henkilökohtainen levytila (kotihakemisto)
  • Jaetut hakemistot projekteille
  • Säilyttäminen sähköisellä serverillä
  • Office 365: OneDrive for Business
  • IDA – Tutkimusdatan säilytyspalvelu 

Lue lisää Tampereen korkeakouluyhteisön tallennuspalveluista ja laskennan ja prosessoinnin tuesta (Tuni intra).  Ota yhteyttä, jos tarvitset lisätietoja:  it-helpdesk@tuni.fi

Tiedostoformaatit

Jos mahdollista, valitse tiedostoformaatiksi sellainen, joka mahdollistaa pitkäaikaissäilytyksen. Suosi sellaisia tiedostoformaatteja, joita on tyypillisesti käytetty tutkimusalalla. Suosi seuraavia ominaisuuksia

  • Yhteentoimivuus monen alustan ja sovelluksen kanssa
  • Saatavilla ilman maksuja tai rajoituksia
  • Käytettävissä useilla eri ohjelmistoilla (ei sisällä IPR-ongelmia)

Tutkimuksenaikaiset ja pitkäaikaistallennuksen mahdollistavat tiedostoformaatit voivat olla erilaisia. Tutkimuksen aikana dataformaatin valintaan vaikuttaa esimerkiksi se, miten ja millä ohjelmilla aineistoasi käsittelet ja analysoit. Voit joutua konvertoimaan näitä työskentelytiedostoja pitkäaikaistelluksessa  käytössä oleviin tiedostomuotoihin.

Suosittelemme seuraavia tiedostoformaatteja pitkäaikaissäilyttämistä varten:

  • Pakkaaminen: TAR, GZIP, ZIP
  • Tietokannat: XML, CSV
  • Maantieteellinen tieto: SHP, DBF, GeoTIFF, NetCDF
  • Videot: MOV, MPEG (MPEG-1/2, MPEG-4), AVI, MXF
  • Äänitiedosto: WAV, AIFF, MP3, MXF
  • Tilastotieto: ASCII, DTA, POR, SAS, SAV
  • Valokuvat: TIFF, JPEG 2000, PDF/A, PNG, GIF, BMP
  • Taulukot: CSV
  • Teksti: XML (ODT, DOCX), PDF/A, HTML, ASCII (RTF, TXT)

Lisätietoa tiedostoformaateista voit lukea Tietoarkiston Aineistonhallinnan käsikirjasta ja UK Data Servicen tiedostoformaatti suosituksista.

Ota yhteyttä

Etkö löytänyt tarvitsemaasi tietoa oppaasta? Puuttuuko sieltä jokin tärkeä asia? Ota yhteyttä Tampereen yliopiston Datapalveluun, niin autamme ja opastamme sinua tutkimusaineistojen hallinnassa.

Varmuuskopiointi ja versionhallinta

Varmuuskopiointi

Varmuuskopioinnilla tarkoitetaan lisäkopioiden tekemistä datasta. Näitä kopioita voidaan käyttää, jos alkuperäinen versio vaurioituu tai tuhoutuu. Datasta kannattaa olla vähintään 3 kopiota ja ne kannattaa tallentaa eri paikkoihin.

  • alkuperäinen  - paikallinen kopio - "etäkopio"

Useat tallennusratkaisut tekevät varmuuskopion automaattisesti ja joissain on myös version hallintaan liittyviä ominaisuuksia.  Älä kuitenkaan luota pelkästään automaattisiin ratkaisuihin. Varmista, että sinulla on myös muita kopioita tutkimusaineistostasi.

  • On suositeltavaa, että vanhempia varmuuskopioita ei poisteta, eikä niiden päälle kirjoiteta.
  • Varmuuskopiot kannattaa tarkastaa ja validoida säännöllisesti vertaamalla niitä alkuperäiseen kopioon.
  • Käytä tallennusratkaisun tarjoamaa automaattista varmuuskopiointia ja pidä tämän ohella myös oma varmuuskopio.

Versionhallinta

Versionhallinnan tarkoituksena on tehdä kopioita tiedostosta sitä mukaa, kun niitä käsitellään. Tämä mahdollistaa palaamisen aiempiin tiedostoversioihin, jos se on tarpeen. Järjestelmällisellä versioiden hallinnalla voit kontrolloida tiedostojen eri versioita johdonmukaisesti. Yksinkertaisimmillaan versionhallinta voi perustua siihen, että tallennat tiedostoista useita versioita sitä mukaa, kun teet muutoksia tiedostoihin, ja nimeät tiedostot riittävän kuvaavasti, jotta tiedät mistä versiosta on milloinkin kyse. Tämä saattaa olla varsin toimiva tapa, mikäli vain sinä käsittelet tiedostoja. Mikäli useampi ihminen käsittelee samoja tiedostoja, kannattaa sopia yhteiset säännöt versionhallinnan toteuttamiseksi, jotta jokainen toimii samoilla tavoin.

Jotkut tallennuspalvelut tarjoavat versionhallinnallisia lisäominaisuuksia kuten tilannekatsauksia ja varmuuskopioiden versiointia, osa palveluista luo tiedostosta automaattisesti uuden version joka kerta, kun sitä muokataan. Jotkut tallennuspalvelut  tarjoavat uusien "haarojen luomista" (branching) ja versioiden yhdistämistä. Versionhallinnan työkalujen tarkoituksena on helpottaa sinun työtäsi, ja yleensä auttaa niissä tilanteissa, kun syystä tai toisesta käyttäjän oma versionhallinta ei toimi. Nämä automaattiset ja tekniset versionhallinnalliset työkalut eivät korvaa tutkijan omaa versionhallintaa, vaan työkalut ovat tarkoitettu auttamaan siinä tilanteessa, kun tietoja täytyy esimerkiksi palauttaa vanhoista varmuuskopioista.

Käytännön vinkkejä:

  • Päätä ennalta, montako versiota tiedostosta säilytät, mitkä versiot säilytät ja miten järjestät tiedostot
  • Nimeä tiedostot systemaattisesti ja johdonmukaisesti
  • Tallenna muutokset
  • Pidä kirjaa tiedostojen sijainneista
  • Synkronoi tiedostot
  • Alkuperäistiedostoille yksi paikka
  • Kontrolloi tarkasti sitä, kuka saa muokata tiedostoja ja miten

 

Tietoturva

Datan tietoturva tarkoittaa datan suojaamista ulkoisilta ja sisäisiltä uhilta, kuten onnettomuuksilta, virheiltä ja luvattomalta käytöltä. Datan tietoturvan tasoa kannattaa miettiä suhteessa datan luonteeseen ja mahdollisiin riskeihin. Luottamuksellisen ja henkilötietoja sisältävän datan osalta tietoturvaan kannattaa kiinnittää erityistä huomiota.

Datan tietoturvasuunnitelma kannattaa tehdä osana aineistonhallintasuunnitelmaa. Tietoturvasuunnitelma sisältää seuraavia asioita:

  • Datan tallentaminen ja tietoturva 
  • Versionhallinta
  • Datan salaaminen
  • Datan varmuuskopiointi
  • Datan eheyden tarkastaminen
  • Datan tuhoaminen

Tietoturvaa parantavat toimenpiteet:

  • salaa sensitiivinen data ennen tallentamista tai sen välittämistä ja määrittele:
    • Mikä osa datasta salataan? Erota sensitiivinen data muusta datasta, jos se vain on mahdollista.
    • Mitä salaustyökalua käytät
    • Kuka hallinnoi salausavaimia ja salasanoja
  • Huomaa, että pelkkä datan poistaminen (delete) ei tuhoa (erase) dataa
  • Älä käytä ulkoisia kovalevyjä pääasiallisena säilytysratkaisuna
  • Jos dataa voi käyttää etänä, käytä suojattua yhteyttä.
  • Käytä Tampereen korkeakouluyhteisön tukemia tallennusratkaisuja

Katso Tampereen korkeakouluyhteisön Tietoturvapolitiikka ja tarvittaessa kysy lisätietoja tietoturva@tuni.fi.

Logo

Email: library@tuni.fi
P. 0294 520 900

Kirjaston kotisivut | Library homepage
Andor

Palaute | Feedback