Etusivu - opetusministeriön verkkolehti
Julkaistu 17.2.2011  

Monialainen yhteistyö edistää hyvinvointia

Opetusteknologia kehittyy

Pienten lasten median käyttöä selvitettiin

Myyräntöihin digitalkoisiin?

Suomi kuuluu EU:n innovaatiojohtajiin

Teemana maailmanlaajuinen vastuu

Kansanedustajat kysyvät - valtioneuvosto vastaa

Uusia julkaisuja

Resumé på svenska

< Etusivulle

Tarjolla myyräntöitä digitalkoissa

Kansalliskirjaston verkkosivuilla voi auttaa vanhojen sanomalehtien digitalisoinnissa pelaamalla erilaisia pelejä. Yhteensä eri pelaajien minuuteista koostuu iso työ, joka auttaa taltioimaan kansallisperintöä.


Esimerkiksi Myyräsillassa rakennetaan siltaa kirjoittamalla tunnistamattomia sanoja. Katso ohje!

Kansalliskirjasto houkuttelee netinkäyttäjiä digitointitalkoisiin, jossa nettipelejä pelaamalla korjataan sanoja Kansalliskirjaston sanomalehtiarkistoon tallennetuista suomalaisista sanomalehdistä. Sosiaalisen median avulla jokainen voi myös haastaa ystävänsä kulttuurihistoriallisesti arvokkaaseen työhön.

Sanomalehtiarkiston materiaali on siirretty digitaaliseen muotoon käyttämällä automaattista tekstintunnistusta. Tietokoneet eivät kuitenkaan kykene tunnistamaan kaikkia sanoja. Erityisesti lähdemateriaalin laadun ollessa heikko aineistoa joudutaan korjaamaan käsin, mikä vaatii valtavan määrän ihmistyötä.

Aluksi pelejä on kaksi, ja niitä pelataan Facebookin kautta. Myyräsillassa rakennetaan siltaa kirjoittamalla tunnistamattomia sanoja ja Myyräjahdissa metsästetään sanoja, jotka tietokone on tulkinnut väärin. Parhaillaan urakoitavana on Aamulehden numeroita 1800-luvulta.

Myöhemmin on tulossa laajempi valikoima erityyppisiä pelejä. Osa on kevyttä viihdettä, mutta osa on tarkoitettu historiallisista aineistoista kiinnostuneille, jotka haluavat antaa ajastaan digitoinnin hyväksi enemmänkin kuin yksittäisiä minuutteja.

Suunnitelmissa on  myös mahdollisuus auttaa artikkeleiden rakenteen korjaamisessa sekä kuvien liittämisessä artikkeleihin.

Joukkoäly hyödyksi

Joukkoälyä hyödyntävä Digitalkoot on Kansalliskirjaston ja Microtaskin yhteisprojekti, jossa suomalaista kulttuuriperintöä jalostetaan helposti haettavaan muotoon.

Siinä missä joukkoälyä tyypillisesti hyödynnetään ideoiden ja palautteen keräämisessä laajalta joukolta ihmisiä, käytetään useiden ihmisten panosta nyt skaalautuvana työvoimaresurssina.

Yksi digitoinnin päävaiheista on sanojen automaattinen tunnistus aineistoista. Se on työvaiheena altis virheille, sillä esimerkiksi lähdemateriaalin kunto ja käytetyt kirjasintyypit voivat hankaloittaa tekstin tulkintaa.

Projektissa keskitytäänkin aluksi tunnistusvirheiden korjaamiseen. Näin parannetaan digitoidun aineiston laatua ja käytettävyyttä, ja tekstihakujen luotettavuus paranee.

Käytännössä digitointiin liittyvää rutiinityötä puretaan muutaman sekunnin mittaisiksi suoritteiksi, jotka jaetaan suuren ihmisjoukon tehtäväksi. Järjestelmä myös kokoaa tehtävät takaisin yhteen ja tarkistaa ne vertaamalla kaksinkertaisina tehtyjä tehtäviä.

Tällä hetkellä Kansalliskirjastolla on digitoituna noin neljä miljoonaa sivua erilaisia aineistoja, esimerkiksi sanoma- ja aikakauslehtiä, kirjoja ja pienpainatteita. Digitoitujen aineistojen määrä lisääntyy vuosittain merkittävästi.

Jotta tämä aineisto saadaan helposti tutkijoiden ja muiden kiinnostuneiden käyttöön, se pitää jalostaa verkosta helposti haettavaan muotoon. Digitoinnissa aineistoon liitetään myös metatietoja alkuperäisestä teoksesta ja digitoinnissa syntyneen tiedoston ominaisuuksista.

- Jaana Luostarinen

Lähde: Kansalliskirjasto/ www.digitalkoot.fi

Sivun alkuun Sivun alkuun
Lähetä juttu Lähetä juttu
Tulosta Tulosta

Etusivu
ISSN 1458-8056
Päätoimittaja:
jaana.luostarinen@minedu.fi
Toimitussihteeri:
liisa.heikkila@minedu.fi
Opetus- ja kulttuuriministeriö
Viestintäyksikkö
PL 29
00023 Valtioneuvosto
Copyright 
Opetus- ja kulttuuriministeriö

webmaster@minedu.fi