Skip to Main Content

Aineistonhallinta

Aineiston kuvailu

Tutkimusaineiston sisällön, keruun ja muuttujien huolellinen kuvailu on edellytys aineiston käyttökelpoisuuden säilymiselle. Ilman kuvailevaa tietoa eli metadataa tutkimusaineisto on vain merkityksetön kokoelma yksittäisiä tiedostoja, numeroita ja merkkejä. Lisäksi hyvin tehty kuvailu helpottaa tutkimusaineiston löytämistä. Tutkimusaineiston perustietojen huolellinen ja kattava kuvaus (esimerkiksi julkaisun liitteessä) on tärkeä luotettavuuden osoitus myös tutkimustulosten raportoinnissa.

  • Aineiston kuvailu varmistaa että aineistosi on muiden ymmärrettävissä ja tulkittavissa.
  • Kuvailu tekee aineistosta jaettavan, haettavan, viitattavan ja mahdollistaa aineiston pitkäaikaisen hyödyntämisen.
  • Aineiston kuvailu kannattaa aloittaa välittömästi tutkimusprojektin alussa.

Seuraavassa on joitakin yleisiä ohjeita niistä asioista joita projektista ja datasta tulisi kuvailla tieteenalasta riippumatta. Minimissään tämä dokumentaatio tulee säilyttää readme.txt-tiedostona tai vastaavana yhdessä datan kanssa.

  • TITLE: Aineiston tai sen tuottaneen projektin nimi
  • CREATOR: Aineiston luoneet henkilöt tai organisaatiot osoitetietoineen
  • IDENTIFIER: Aineiston identifiointinumero, vaikka se olisi vain organisaation sisäinen projektitunnus
  • DATES: Keskeiset aineistoon liittyvät päivämäärät, ml. projektin alku- ja loppupäivät, aineiston muokkaus- ja valmistumispäivät sekä ajanjakso, jota aineisto kattaa
  • SUBJECT: Avainsanat tai ilmaukset, joilla aineiston aihetta tai sisältöä kuvataan
  • FUNDERS: Tutkimuksen rahoittajat
  • RIGHTS: Aineistoon liittyvät immateriaalioikeudet
  • LANGUAGE: Aineiston sisällön kieli (kielet), jos sellaisia on
  • LOCATION: Kun aineisto liittyy fyysiseen paikkaan, kirjaa sen alueellinen kattavuus
  • METHODOLOGY: Kuvaile, miten aineisto on koottu tai luotu, mukaan lukien käytetty välineistö ja ohjelmistot, koeohjelmat, haastattelurungot ym. seikat, joita kuvailisit myös tutkimuksenaikaisiin muistiinpanoihin

Tietoarkiston tuottamassa aineistohallinnan käsikirjassa on perusteelliset ohjeet aineistojen kuvailemisesta:

Tiedostojen nimeäminen

Suunnittele tiedostojesin nimeämiskäytäntö heti projektisi alussa. Suunnitelman tulee olla niin tarkka ja laaja, että se kattaa koko tutkimuksesi aikaiset tarpeet. Nimeämissuunnitelman  tavoitteina on

  • pystyä itse helposti tulkitsemaan, mitä tietoa kukin tiedosto sisältää (human readable filenames)
  • auttaa muita tiedostojesi hyödyntäjiä tulkitsemaan, mitä tietoa kukin tiedosto sisältää
  • pystyä hyödyntämään tietokonettasi tiedostojen järjestämisessä ja hakemisessa (computer readable filenames)
  • pystyä pitämään kaikki tutkimuksesi tiedot tallessa ja loogisessa järjestyksessä

Hyviä neuvoja nimeämiseeen:

Aineiston laatu

Aineiston laatuun vaikuttavat tallennusvaiheessa tehtävät sisällölliset ja tekniset ratkaisut. Niitä ovat esimerkiksi tietojen syöttö havaintomatriisiin tai ääni- ja äänikuvatallennuksen tekninen toteutus. Myös aineiston keruun jälkeen tehtävät aineiston käsittelyn ratkaisut vaikuttavat aineiston laatuun. Niitä ovat esimerkiksi aineistotiedostojen nimeäminen ja järjestäminen, puuttuvien tietojen määrittäminen ja muuttujien nimeäminen kvantitatiiviselle aineistolle ja tekstintäminen eli litterointi kvalitatiiviselle aineistolle.

Huolellinen dokumentaatio aineiston keruun vaiheista ja aineiston käsittelystä varmistaa tutkimuksen laadun. Aineiston dokumentointi on elintärkeää myös aineiston pitkäaikaissäilyttämisessä. Aineiston kattava kuvailu eli huolella tehty metadata mahdollistaa aineiston informoidun jatkokäytön ja pitkän elinkaaren. (Aineistohallinnan käsikirja. Tampere: Tietoarkisto)