Metaandmed

Allikas: Keeleleek

Metaandmeid (ingl metadata) on mitu erinevat liiki: kirjeldavad, kontekstuaalsed, tehnilised, strukturaalsed ning säilitamise ja administratsiooni kohta käivad metaandmed. Need on väga tähtsad andmete organiseerimise, jagamise ja otsitavuse-leitavuse jaoks, ja moodustavad seega olulise osa teadustöö kommunikatiivsest aspektist.[1]

Metaandmed öeldakse tihti olevat andmed andmete kohta, aga Bargmeyeri ja Gillmani meelest ei saa kunagi öelda, kas mingid andmed on kas metaandmed või lihtsalt andmed ja propageerivad, et see on andmete kasutus mis määrab nende olemuse[2].

Kuigi metaandmete objektiivne kvaliteedihindamine on äärmiselt raske, on kõrge kvaliteedi saavutamiseks oluline, et informatsiooni korjatakse terve teadustöö vältel ning et iga osaline teadlasest rahastajani osalevad kommunikatsioonis[1].

Alljärgnev tekst on suuresti konspekteeritud Emily Ekstrand-Brummeri DANS rapportist[1].

Kooskõlastatud metaandmed

Standardid ja skeemid

On oluline teha vahet metandmete standardite ja metaandmete skeemide vahel. Metaandme-skeem on andmete modelleerimise tulemus ja sisaldab seega andmeid kirjeldavaid elemente. Standard on mingi organisatsiooni poolt koostatud eeskiri või juhend, mis on eeskätt mõeldud koostalitlusvõime suurendamiseks. Standardid võivad kasutada või soovitada kasutada mingeid skeemisid.[1]

Kooskõlastatud metaandmete skeemide ja standardite tähtsus on aina suurenenud koos informatsioonimahu suurenemisega. Ideaalis oleks teadlastel võimalik otsida informatsiooni mitmest ja omavahel seotud infoallikast. Ühelt poolt on kooskõla tähtis teenusepakkujate jaoks, kes koguvad andmeid mitmelt poolt kokku (metadata harvesting) ja peavad seega suutma kommunikeeruda mitme erineva allika liidestega. Teiselt poolt on otsinguhnoloogiad arenenud niivõrd kõrgele tasemele, et on võimalik kasutaja otsinguid automatiseerida. Kui eelmise viisi puhul on iga allika jaoks liidest võimalik käsitsi veidi mugandada, siis automatiseeritud otsingute puhul on järjekindlad skeemid ülitähtsad, kuna arvutitel muidu puudub viis, kuidas andmeid õigesti tõlgendada.[1] Kooskõlastatud metaandmete tähtsus kajastub nt viimastel aastatel tekkinud üle-euroopaliste võrgustike arvus.

Strukturaalset ühilduvust on võimalik saavutada nt andmete rööpselt kirjeldamisel teise ja ühendava skeemi abil. Sel juhul luuakse "sild" oma skeemi ja kooskõlastatud skeemi vahel, kusjuures on vaja tõlkida ehk vastavusse seada (crosswalking) mõlema skeemi sõnavarad. Rööpskeem on sõnastik, mis seob kahe skeemi sõnavarad vastavusse. Esialgne skeem võib olla kooskõlastatud skeemist mõnevõrra täiuslikkum, aga see ei tähenda, et kooskõlastatud skeem selletõttu "lihtsam" oleks. See näitlikustab metaandmete problemaatikat, kuna nende väärtus seisneb suuresti nende kasutatavuses. Andmete kirjeldaja ja esialgne kasutaja on tihti teadlane, kellel on suur implitsiitne teadmus andmete iseloomu kohta. Andmete kooskõlastatud rööpskeemi ülesandeks on teha andmed kättesaadavaks kokkukorjajatele (harvesters) ning nende kaudu potentsiaalsete kasutajateni, kes ei pruugi jagada teadlase suurt teadmust.[1] Lisaks rööpskeemi sõnastiku kasutamisele on võimalik ka selle sõnavara omakorda kirjeldada piiratud sõnavaraga (controlled vocabulary). Piiratud sõnavara funktsioneerib sel juhul kui terminoloogiline sõnastik, mis on võimalik veel struktureerida hierarhiliselt moodustades seega tesauruse. See annab mitmeid uusis võimalusi juurde. Mitmekeelse sõnastiku abil on võimalik otsida informatsiooni mitmes keeles (teadlane pärib ühes keeles, aga saab tulemusi mitmes keeles) ja hierarhilise tesauruse abil on võimalik otsitava termini tähendust kitsendada või laiendada.[1]. Üks näide sellisest mitmekeelsest tesaurus on European Language Social Science Thesaurus[1], mis kahjuks ei sisalda eesti keelt. Eesti raamatukogudes on kasutusel taoline tesaurus Eesti märksõnastik.

Metaandmeregistrid

Kui metaandmed sisaldavad andmeid andmete kohta, siis metaandmeregistrid sisaldavad omakorda andmeid metaandmeskeemide kohta, mh nende elementide loendid ja piiratud sõnavarade tesaurusi. ISO/IEC 11179 on üks standard, mis püüab standardiseerida metaandmete kirjeldusi metaandmeregistrite jaoks.[1]

Metaandmed teadustöö eri faasides

Refereerimata tekst ...

Metaandmete tüübid

Metaandmed ei jagune selgelt piiritletavateks tüüpideks ja on võimalik erinevaid interpretatsioone. Alljärgnev püüab ainult kirjeldada üldjooni.[1]

Kirjeldavad metaandmed

Kirjeldavate metaandmete (descriptive metadata) roll on kategoriseerida andmed hoidlas ja seega aidata (teistel) teadlastel leida relevantseid andmeid. Kirjeldavaid metaandmeid võivad koostada nii teadlane kui ka hoidla. Kõige parem on koostöö nende vahel, kuna tavaliselt on see teadlane see, kes teab kõige rohkem andmete kohta, ning hoidla on see, kes paigutab ja rühmitab eri andmekogumid kokku (millejuures ühtlust on vaja).[1]

Kontekstuaalsed metaandmed

Kontekstuaalsed metaandmed (contextual metadata) paigutavad andmed konteksti ja näitab kuidas andmeid kasutada. Need kirjeldavad andmete tausta, nt kus kohas ja kuidas ja mis vahenditega need koguti, aga ka selliseid parameetreid nagu kasutatud metodoloogia. Sellised metaandmed on eriti tähtsad numbriliste andmete puhul. Kontekstulaased metaandmed koostab teadlane.[1]

Tehnilised metaandmed

Tehnilised metaandmed (technical metadata) sisaldavad nt failisuurust, loomise kuupäeva, faili vormingut jms ja on digitaalselt loodud andmete puhul tavaliselt koostatud automaatselt. Digitaliseeritud andmete puhul sisaldab see kirjeldust, kuidas ja millega andmed digitaliseeriti. Need andmed on tähtsad, kui me tahame teada, mis aparatuuriga me andmeid peame vaatama. Seetõttu on tehnilised metaandmed lähedalt seotud säilitamise kohta käivate andmetega.[1]

Säilitamise kohta käivad metaandmed

Digitaalsed andmed sõltuvad aparatuurist, millega neid salvestatakse ja kuvatakse. Kuna ei ole kindel, et tulevikus kasutatakse samu aparaate või programme kui tänapäeval, on säilitamise kohta käivad metaandmed väga olulised. Samuti on digitaalsed andmekandjad väga tundlikud ja ei säili ajas sama hästi kui näiteks paber. Seetõttu on vaja ka andmete terviklikkust regulaarselt kontrollida.[1]

Administratiivsed metaandmed

Administratiivsed metaandmed sisaldavad andmeid andmete ajakohasuse kohta (kas andmed on kõige värskemad), kirjeldab kellel on õigus ja mil moel andmeid kasutada, kuidas andmed on muutunud, ning kas andmed on autentsed.[1]

Strukturaalsed metaandmed

Kui kirjeldatud andmed koosnevad mitmest osast, kirjeldab strukturaalsed metaandmed seda, kuidas need on omavahel seotud.[1]

Kirjandus

  1. 1,00 1,01 1,02 1,03 1,04 1,05 1,06 1,07 1,08 1,09 1,10 1,11 1,12 1,13 1,14 1,15 Ekstrand-Brummer, Emily. What is Metadata? DANS.
  2. Bargmeyer, B., & Gillman, D. (2000). Metadata standards and metadata registries: An overview. Retrieved from http://stats.bls.gov/ore/pdf/st000010.pdf