Tekoäly avaa arkistot: Riita vuonna 1852 johti kipeisiin sakkoihin kalastajalle

1:54imgVideo: Tekoäly tuo historiaa paremmin saataville.
Julkaistu 21.04.2025 06:24

MTV UUTISET – STT

Kansallisarkisto opettaa koneen lukemaan historiaa.

Erikoista kalastuskannetta koskeva pöytäkirjan ote Tyrvännöstä vuodelta 1852 on kirjoitettu ruotsiksi kauniilla käsialalla, mutta nykylukijan voi olla vaikea ymmärtää sitä. 

Tekoäly muuntaa kirjoituksen kuitenkin helppolukuiseksi tekstiksi.

Kansallisarkiston tuomiokirjahausta löytyvä asiakirja kertoo, että maanviljelijä Carl Packalin vaatii tuomiota Vanajaveden Lepaan virran tukkimisesta kalastusvälineillä. 

Vastaajina ovat kalastaja Johan Henriksson ja tämän isäntä, vuorimestari Gustaf Idestam Lahdentaan kartanosta.

Todistajaksi on saatu renki Gustaf Henriksson. Hän kertookin nähneensä, että vastaaja oli asettanut kalastusvälineitä poikittain virran yli estäen näin veden virtausta.

Kantaja esittää myös pöytäkirjan, jonka mukaan käräjillä oli jo vuonna 1831 kielletty väylän virtauksen häiritseminen. Päätös oli julistettu Hattulan kirkossa kahteen otteeseen.

Koska vuorimestari oli kuollut oikeudenkäynnin aikana, kalastaja katsotaan yksin syylliseksi. Hänelle langetetaan sakkoja 20 taalaria hopearahassa sekä 9 ruplaa ja 60 kopeekkaa hopeassa. 

Mikäli tuomittu ei pysty maksamaan sakkoja, hänen tulee suorittaa 22 päivän vankeusrangaistus, josta osa vedellä ja leivällä.

Kalastaja ilmoittaa tyytymättömyytensä tuomioon, ja hän voi valittaa siitä kirjallisesti Keisarilliseen Turun hovioikeuteen.

Lue myös:

Matin loitsu meni pahasti pieleen – alkoholisoitunut talonpoika oli kuolla paiseeseen

Paavo kirosi naapurinsa ja tuomittiin kuolemaan: "En osaa noituutta sen enempää kuin muutkaan"

Valpuri Kyni on Suomen kuuluisin "noita" – tätä kaikkea hänen väitetään tehneen

"Mullistava uudistus"

Tuomiokirjojen etsiminen ja litterointi konekirjoitetuksi tekstiksi onnistuvat tekoälyyn perustuvilla tekstintunnistus- ja hakutoiminnoilla, jotka helpottavat merkittävästi Kansallisarkiston aineistojen käyttöä. 

Hyötyjiä ovat sekä sukututkijat että tieteentekijät.

Yksikönpäällikkö Ilkka Jokipii Kansallisarkistosta kertoo, että tavoitteena on käsitellä koko digitoitu kulttuuriperintöaineisto tekstintunnistuksella, jolloin sen selaaminen ja lukeminen helpottuvat merkittävästi.

Kun dokumentit käsitellään tekstintunnistuksella, niihin voi tehdä hakuja esimerkiksi omalla tai sukulaisen nimellä.

– Näen tekoälymenetelmien kehityksen mullistavana uudistuksena arkistojen käytettävyyteen, Jokipii hehkuttaa. Tuomiokirjahaku oli ensimmäinen käyttäjille avattu avoin tekoälyavusteinen palvelu. Siellä voi tehdä sanahakuja jo yli kolmeen miljoonaan 1800-luvun asiakirjaan.

Ja lisää seuraa, sillä prosessoituna on lisäksi viisi miljoonaa tiedostoa 1800-luvun ja vajaat kaksi miljoonaa tiedostoa 1700-luvun tuomiokirjoista.

Kansallisarkiston digiholveissa on kaikkiaan jo 264 miljoonaa tiedostoa.

Tuomiokirjoissa elämän kirjo

Automaattinen tekstintunnistus käsin kirjoitettuihin asiakirjoihin vaatii käsialamallien luomista.

– Dokumentit kirjoitetaan ensin puhtaaksi ihmisvoimin. Näin saadun opetusaineiston avulla tekoäly koulutetaan lukemaan vanhoja käsialoja, Jokipii taustoittaa.

Uusin käsialamalli pystyy tulkitsemaan asiakirjoja 1600-luvun alusta 1900-luvun puoliväliin. Se tekee virheitä enää keskimäärin kolmen prosentin verran.

Tuomiokirjoissa on rikos- ja riitatapausten lisäksi myös ilmoitusasioiden pöytäkirjoja, joissa käsitellään lainhuutoja, kiinnityksiä, holhousasioita ja avioehtoja. 

Niitä voi käyttää esimerkiksi sukututkimukseen ja kiinteistöjen omistajuuden selvittämisessä.

Palvelua on tehty ulkopuolisen toimijan kanssa, mutta Kansallisarkisto keskittyy nyt omien järjestelmien kehittämiseen.

Sukututkijoiden uusi työkalu

Sukututkijoita kouluttava Juha Vuorela käyttää tekoälypalveluita säännöllisesti. 

Eräs hänen käyttämistään palveluista on Kansallisarkiston avoin tekstintunnistustyökalu. 

Palvelussa voi tehdä tekstintunnistuksen asiakirjoihin 1600-luvulta 1900-luvun puoliväliin.

Työkalun käyttäminen on yksinkertaista. Käyttäjä lataa asiakirjasta kuvan palveluun, valitsee käskyn "process image", ja työkalu tulkitsee kuvassa olevan tekstin helposti luettavaan muotoon.

– Jos teksti on esimerkiksi ruotsiksi, sen voi viedä toiseen ohjelmaan käännettäväksi suomeksi. Kannattaa myös kokeilla kääntämistä ensin nykyruotsiksi ja vasta sitten suomeksi, jolloin lopputulos voi olla ymmärrettävämpi.

Työkalu käsittelee yksittäisiä kuvia, mutta sillä ei voi tehdä hakuja useammasta asiakirjasta. Tässä se eroaa tuomiokirjahausta, jossa aineistot on viety tietokantaan.

Luettelot vielä hankalia

Jos käyttäjiä ei ole ollut vähään aikaan, palvelun laskentayksikkö menee säästösyistä pois päältä.

– Työkalua ei ole ajateltu suuren mittakaavan käyttöön, vaan lähinnä esittelemään mallia yleisölle. Toki se samalla auttaa myös arkiston käyttäjiä. Lopullisena tavoitteena on tunnistaa sisältö kaikesta digitoidusta arkistoaineistosta, Jokipii kertoo.

Tekstintunnistustyökalu toimii parhaiten laadukkailla kuvilla, joissa taitto noudattelee kirjojen asettelua. 

Esimerkiksi kirkonkirjojen sarakkeet ovat sille vielä hankalia tulkita.

– Meillä on kuitenkin jo hyviä ratkaisuja tähän. Yliopistoyhteistyössä on tehty sisällöntunnistusta muun muassa väestönlaskentataulukoista, joita voi siirtää suoraan Exceliin. Myös kirkonkirjat tulevat jatkossa tekoälytunnistuksen piiriin.

Mitkä olisivat sellaisia asiakirjoja, joihin sukututkijat voisivat kaivata tekstintunnistusta?

Vuorelan mukaan niitä voisivat olla vaikkapa tuomiokirjat, pitäjän- ja kirkonkokousten pöytäkirjat ja vanhat verotusasiakirjat eli voudin- ja läänintilit. 

Monia kiinnostaisi varmasti myös vanhojen perukirjojen selventäminen.

Demokraattisuus lisääntyy

Tekoälyn avulla sukututkimuksesta tulee demokraattisempaa, pohtii sukututkimuskouluttaja Juha Vuorela.

– Sukuhistoriasta kiinnostuneen ei tarvitse enää välttämättä osata lukea vanhoja käsialoja, vaan siihen pystyy kuka vain. Yhä useammalla on mahdollisuus perehtyä esivanhempiensa tarinoihin. Tutkijat puolestaan voivat analysoida suuria aineistomääriä tehokkaammin.

Vuorela kuitenkin muistuttaa, että vastuu tutkimuksen lopputuloksesta on aina ihmisellä.

– Lisäksi mitä vanhempiin dokumentteihin mennään, ei enää riitä pelkkä litterointi ja suomentaminen. Pitäisi ymmärtää myös tekstin asiasisältö.

Suomen Kansallisarkisto on muiden pohjoismaisten kansallisarkistojen kanssa kärkijoukoissa asiakirjojen käytettävyyden parantamisessa, Jokipii arvioi. 

Pohjoismaat tekevät myös tiivistä yhteistyötä.

– Ruotsin kanssa meillä on yhteinen historia, joten jaamme aineistoa muun muassa käsialantunnistuksesta.

Suomessa väestöaineistot palvelevat erinomaisesti sukututkijoita ja tieteellistä tutkimusta. Esimerkiksi Ruotsin vallan aikaiset kirkonkirjat kuuluvat Euroopan vanhimpiin väestökirjoihin.

Kirkonkirjoja ja muita historiallisia lähteitä voi hakea Kansallisarkiston Astia-palvelun ja Karjala-tietokannan lisäksi muun muassa Digihakemistosta, Suomen Sukututkimusseuran HisKi-hakuohjelmasta ja Suomen Sukuhistoriallisen Yhdistyksen Digiarkistosta.

Tuoreimmat aiheesta

Historia