Skip to main content
It looks like you're using Internet Explorer 11 or older. This website works best with modern browsers such as the latest versions of Chrome, Firefox, Safari, and Edge. If you continue with this browser, you may see unexpected results.

Tutkimusaineistojen hallinta: Aineiston kuvaus

Aineiston luokittelu

Aloita aineistonhallintasuunnitelmasi kirjoittaminen kuvaamalla lyhyesti:

  • Millaista aineistoa olet keräämässä tai tuottamassa?
  • Missä tietostoformaateissa aineistot ovat?
  • Kuikan paljon aineistoa suunnilleen on?
  • Tuotatteko erityisiä koodeja tai ohjelmistoja, joita käytetään aineistojen muokkaamisessa?
  • Keräättekö henkilötietoja tai muita luottamuksellisia tietoja?

Vastauksesi seuraavaan kysymykseen muodostaa suunnitelmasi rakenteen. Luokittele hankkeessa käyttämänne aineiso esimerkiksi seuraavasti:

  1. Sinun tai tutkimusryhmäsi keräämä tai tuottama aineisto
  2. Muiden tutkijoiden tuottama aineisto
  3. Muista lähteistä, kuten rekistereistä tilastoista, mittausasemilta jne. saatu aineisto.
  4. Muut datan käsittelyyn ja tulkintaan vaadittavat aineistot, kuten koodit, ohjelmistot, laboratoriopäiväkirjat jne.

Luokittelu kannattaa muotoilla tutkimuksessa hyödyntämäsi ja tuottamasi aineiston käyttöoikeuksien ja lisenssien perusteella. Kerro lyhyesti, minkä lisenssin perusteella sinulla on oikeus aineiston (uudelleen)käyttämiseen. Luokittelu muodostaa liäsksi luontevan jäsentelyn, johon voit viitata aineistonhallintasuunnitelman muissa kysymyksissä.

Sisällytä aineistonhallintasuunnitelmaan kuvaus tarvittavasta levytilasta. Aineiston koon arviointi summittaisesti riittää (esim. alle 100 Gt, noin 1 Tt tai useita petatavuja).

Vinkkejä hyvistä käytännöistä
  • Käytä taulukkoa tai luetteloa esittämään tietotyypit, tiedostomuodot, käytettävät ohjelmat ja aineiston koko tiiviissä muodossa.
    • Mahdollisia tiedostomuotoja ovat .csv, .txt, .docx, .xslx ja .tif.
    • Muista mainita tietojen tarkasteluun tai käyttämiseen tarvittavat erityiset tai epätavalliset ohjelmat varsinkin, jos ne koodataan tai tuotetaan hankkeessasi.
    • Voit myös arvioida, kuinka paljon hankkeessa tuotetaan tai kerätään aineistoa esimerkiksi viikossa: ”Hankkeessa tuotetaan/kerätään viikoittain noin 100 Gt aineistoa.”
    • VÄLTÄ PÄÄLLEKKÄISYYTTÄ TUTKIMUSSUUNNITELMAN KANSSA! Aineiston analysointiin ja tutkimusmenetelmiin liittyvät yksityiskohdat ja prosessit kuvataan tutkimussuunnitelmassa.

Jos minulla on muuta kuin digitaalista aineistoa

Kaikkia tutkimusaineistoja ei voida kerätä sähköisesti tai muuttaa digitaaliseen muotoon. Tällaisia ovat esimerkiksi aineistot, jotka koostuvat osittain tai kokonaan paperiaineistosta, biologisista näytteistä, fossiilinäytteistä, taideteoksista, artefakteista tai muista konkreettisista objekteista, joita ei voida muuntaa digitaaliseen muotoon tai niiden muuntamiseksi digitaaliseen muotoon ei ole tarvittavia resursseja.

Riippumatta siitä, onko tutkimusaineisto digitaalinen vai ei, tutkimusaineistonhallinnan tärkeyttä ei voida liikaa korostaa. Aineiston tyypistä riippuen sen käsittely, analysointi ja säilyttämistavat vaihtelevat. Esimerkiksi ei-digitaalisten aineistojen säilyttämistä suunnitellessa ja toteuttaessa on huomioitava erilaiset fyysiset säilyttämisratkaisut (kuten arkistointikaapit), ilman kosteus- ja lämpöolosuhteet tai muut erityisjärjestelyt.

Kuvailevien tietojen, eli metadatan tärkeys korostuu yhtä lailla sekä digitaalisten että ei-digitaalisten aineistojen kohdalla. Hyvin laaditut kuvailevat tiedot takaavat aineiston ymmärrettävyyden niin keräämisen ja käsittelemisen aikana kuin myöhemmin tutkimusaineiston elinkaaren aikana. Tarkempaa tietoa tutkimusaineistojen metadatasta on välilehdellä Käsittele ja säilytä, osiossa Metadata.


Mihin ottaa yhteyttä?

  • Tampereen yliopiston laboratoriopalvelut: Palveluita ja apua muun muassa terveystieteisiin liittyviin tutkimushankkeisiin, joissa
    tarvitaan laboratorio laitteistoja tai säilytystilaa erilaisille näytteille. late@tuni.fi
  • Tampereen yliopiston asianhallinta: Auttaa tutkimustoiminnassa syntyvien asiakirjojen ja muiden asiakirjallisten tietoaineistojen käsittelyyn, julkisuuteen, säilytysaikaan liittyvissä asioissa. Lue lisää projektin aineistojen arkistoinnista ja Tutkimustoiminnan asiakirjoista. Lisätietoja sähköpostilla tau@tuni.fi.

Ota yhteyttä

Etkö löytänyt tarvitsemaasi tietoa oppaasta? Puuttuuko sieltä jokin tärkeä asia? Ota yhteyttä Tampereen yliopiston Datapalveluun, niin autamme ja opastamme sinua tutkimusaineistojen hallinnassa.

Tiedostoformaatit

Pyri käyttämään tutkimusyhteisössä laajasti käytössä olevia avoimia tiedostoformaatteja, jotka ovat:

  • Mahdollisimman yhteentoimivia ja tuettuja.
  • Maksutta saatavilla ilman rajoituksia.
  • Eri ohjelmistovalmistajien tukemia.

Analyysivaiheessa käyttämäsi tiedostoformaatti voi olla tarpeen konvertoida toiseen formaattiin pitkäaikaissäilytystä varten.

Joitain pitkäaikaissäilytykseen soveltuvia tiedostoformaatteja:

  • Pakkausformaatit: TAR, GZIP, ZIP
  • Tietokannat: XML, CSV
  • Paikkatiedot: SHP, DBF, GeoTIFF, NetCDF
  • Liikkuva kuva: MOV, MPEG-4 (mp4), AVI, MXF
  • Ääni: WAV, AIFF, MP3, MXF
  • Tilastot: ASCII, DTA, POR, SAS, SAV
  • Kuva: TIFF, JPEG 2000, PDF/A, PNG, GIF, BMP
  • Tabular data: CSV
  • Teksti: XML (ODT, DOCX), PDF/A, HTML, ASCII (RTF, TXT)

Lue lisää tiedostoformaateista

CC-lisenssi