tiistai 28. kesäkuuta 2011

Metatiedot: kaikkiko käy?

Capture-hankkeen yksi suurimmista haasteista liittyy suunniteltavan tietojärjestelmän tietomalliin ja hallinnoitavien aineistojen metatietoihin. Capturessa suunniteltavan tietojärjestelmän tulisi siis kyetä hallitsemaan a) analogisen aineiston viitetietoja, b) digitoitujen aineistojen viitetietoja ja itse digitoituja objekteja sekä c) syntysähköistä tiedostomuotoista aineistoa.

Ensimmäisessä vaiheessa uuteen tietojärjestelmään siirrettäisiin tietenkin Elkan nykyisessä arkistotietokannassa, erityismateriaalirekistereissä sekä ElkaD-sovelluksessa olevat viitetiedot sekä digitaaliset objektit. Syntysähköisen aineiston vastaanoton ensimmäiseksi ”kohderyhmäksi” epäilemme yritysten käytössä olevia ja jo käytöstä poistettuja verkkolevyjä. Niistä ”imaistava” aineisto on hyvin todennäköisesti varustettu erittäin niukoilla metatiedoilla, ehkäpä vain nimekkeellä ja päiväyksellä.

Myöhemmässä vaiheessa odotamme järjestelmään tulevan aineistoja suoraan rajapinnan kautta esimerkiksi Microsoft SharePointista ja erilaisista dokumenttienhallinta- ja asiankäsittelyjärjestelmistä. Viimeksi mainituissa tapauksissa – varsinkin jos/kun niihin on kytketty TOJ – aineiston voidaan olettaa sisältää huomattavan paljon kattavammat metatiedot. Mutta minkä standardin mukaan?

Haastavinta sähköisen aineiston vastaanotto lienee kuitenkin tiettyjen erityisaineistojen ja –toimialojen suhteen. Näitä ovat esimerkiksi videotuottajat, ammattivalokuvaajat, insinööri- ja suunnittelutoimistot. Näiden aineistojen hallintaan tarvitaan useita aineistotyyppikohtaisia standardeja, kuten esimerkiksi valokuvien teknisen metadatan osalta MIX (Metadata for images in XML).

Järjestelmän suunnittelun kannalta näin heterogeenisen aineiston hallinta aiheuttaa päänsärkyä. Toisaalta kun pitäisi hallinnoida perinteistä paperiaineistoa, digitoituja kokonaisuuksia, erittäin karuilla metatiedoilla varustettuja syntysähköisiä aineistoja ja sitten vielä omien standardiensa mukaan toimivia erityisaineistoja. Nyt onkin mietittävä minimitason metatiedot kaikille edellä mainituille ryhmille. Lisäksi minimitason metatiedot on kytkettävä myös säilytysajan pituuteen. Vai uskaltaako joku luvata Word-tiedoston säilyvyyden ja löydettävyyden kolmenkymmenen vuoden päähän pelkän nimekkeen ja päiväyksen turvin? En minä ainakaan. On selvää, että pysyvästi säilytettäviltä aineistoilta edellytetään huomattavasti kattavammat metatiedot. Jonkinlaisena mittatikkuna toiminee varmastikin Kansallisen Digitaalisen Kirjaston asettamat vaatimukset PAS-aineistolle.

keskiviikko 1. kesäkuuta 2011

30 vuotta, vaan ei suotta

01.6.2011 alkoi, paitsi kesä, myös allekirjoittaneen neljäs vuosikymmen Elkan palveluksessa.  Taaksepäin katsoessa voi kliseemäisesti todeta, että aika on kulunut yhdessä hurauksessa ja se on pahus soikoon vielä tottakin. Tuleehan siitä vauras olo olla talon toimi-iältään vanhin. Tosin näinä nuorekkuuden ja tehokkuuden arvostuksen aikoina tuntuu, että nallekarkkiin on lorahtanut hieman liikaa hapatetta (E234) aiheuttaen pienen sivumaun.  Iän ja virkaiän karttuessa on  myös harmikseen huomannut, että nuorempana vanhusten (40 < v.) kalkkisissa mielipiteissä on ollut myös laajentuneen perspektiiviin mukanaan tuomaa näkökulmaa. Vai johtuuko se vain siitä, että itse kuuluu nyt siihen Calsipos + -sukupolveen?



Vanhan liiton miehenä on hyvä olla, koska mukavuusalue (jääkiekko termein) on helppo tunnistaa ja löytää. Jääkiekossa sillä alueella oleskeleminen ei kyllä tuo sitä kaivattua tulosta. Tämä pitänee paikkansa myös kaukalon ulkopuolella. Toisaalta aion huolestua asiasta vasta sitten kun en enää tunnista aluetta, jolloin voidaan olettaa että suoritus on se Juhani Tammisen 90 %:nen ja tulos jotain ihan muuta.



Näiden kolmen vuosikymmenen aikana oma toimintaympäristöni Elkassa on muuttunut hyvin radikaalisti. Ensimmäinen tehtäväni 01.6.1981 oli jalostaa Halonen Oy:n lihanjalostustehtaan ulkona mustissa jätesäkeissä oleva arkisto käyttökuntoon. Tällä hetkellä taas  yritän pitää IBM:n muutaman kymmenen teratavun palvelin/tallennusjärjestelmää käyttökunnossa. Mustia kyllä nekin. Eli prosessissa on päästy lisäämisestä (input) käsittelevään prosessin osaan (putput) ja ilmeisesti kymmenen vuoden sisällä on odotettavissa tuotos, eli kypsä työntekijä (output).



Vakavasti puhuen, kuten tunnin alustuksessa (ei kai nyt….) henkilökunnan kahvitilaisuudessa toin esiin, olen ollut etuoikeutettu kun olen saanut läheltä seurata informaation käsittelyn suurinta muutosta sitten kirjapainon keksimisen. 1980 –luvulle tultaessa informaatio tuotettiin, käsiteltiin ja jaettiin paperilla. Tuskallisen hitaasti ja työläästi. Tällöin paperiarkki itsessään nousi arvoon arvaamattomaan, arvostuksessa ehkä osin ohi jopa siitä tärkeimmästä,  sisällöstä, informaatiosta. Lisäksi teksti oli se mikä oli oikeaa, ”tärkeää”.  Tämä mielestäni rasittaa asioiden kanssa askaroivien ajattelua vielä nykyäänkin, kaikkine  formaalisuuksineen. Nyt kolmekymmentä vuotta myöhemmin informaatio on biteissä. Tuottaminen, käsitteleminen ja jakeleminen on miljoonia kertoja nopeampaa, tehokkaampaa ja monipuolisempaa. Informaatiokin muuttuu yhä enemmän visuaaliseksi ja teksti alkaa saada statistin osaa.  Haasteet ja vaatimukset informaation käsittelyssä ovat perinpohjin muuttuneet. Miettikääpä montako riviä te luette ja sitten muodostatte käsityksen tietolähteestä, kun käytätte hakukoneita tai tietokantoja.



Kaiken kaikkiaan nämä vuosikymmenet ovat menneet nopeasti, aluksi pätkätöissä, tehtävien jatkuvasti vaihdellessa ja nyt lopulta tehtävässä, jossa toimintaympäristö muuttuu ja kehittyy ennen näkemättömällä vauhdilla. Hieno homma.



Kiitos Elkalle organisaationa ja erityisesti  henkilöinä ja kiitos kaikille niille joiden kanssa olen työni merkeissä ollut tekemisissä, tämä on ollut hieno reissu. Jos tämä ei olisi ollut työ, niin se olisi ollut unelmaloma teemapuistossa.



P.s. Käytät joka päivä internettiä ja sähköpostia. Ajattele, jos ne otettaisiin sinulta tänään pois, miten voisit toimia! Niin oli 21 vuotta sitten, niiden kummankin historia on vain kahden vuosikymmenen mittainen. Pesukoneeni kotona on melkein yhtä vanha.

Jari Lehtonen
aiempien aikojen ylimääräinen virkaatekevä vara-arkistoapulainen