Uutisaamussa vinoutuneesta datasta puhuivat Sitran johtava asiantuntija Laura Halenius ja IT-asiantuntija Petteri Järvinen.
Big datalla, eli massadatalla, on valtava tehtävä ihmisten elämissä. Se ohjaa Googlen hakutuloksia, mainontaa ja jopa lääketeollisuutta. Big data on yhteisnimitys valtaisille datamäärille, joiden yhteydessä ei voida soveltaa perinteisiä datanhallinnointitapoja.
On kuitenkin mahdollista, että se epämääräinen ja järjestelemätön tieto kaiken arjen päätöksiä ohjaavan datan taustalla ei olekaan täysin neutraalia.
– Vinoutuneella datalla tarkoitetaan sitä, että datassa ei ole edustettuna kaikkia asioita, joita me toivoisimme, että siinä olisi päätöksenteon kannalta, Sitran johtava asiantuntija Laura Halenius selventää.
Esimerkiksi lääketutkimuksessa ei tutkita lääkkeitä naisilla, jolloin naisia koskeva data puuttuu kokonaan.
– Pahimmillaan se voi vaarantaa ihmisten terveyden, Halenius toteaa.
Lue myös: "Mies tietää ja johtaa, nainen on kaunis ja harjaa hiuksensa": Googlesta paljastui ummehtuneita sukupuolirooleja toistava ominaisuus
Kuka tahansa voi joutua datan syrjimäksi
Äärimmäisiä esimerkkejä datan vinoutumisesta voi löytää esimerkiksi Yhdysvaltojen oikeusjärjestelmästä, jossa tietyn etnisyyteen ja tuloryhmään kuuluvat ihmiset saavat herkemmin kovempia tuomioita.
– Inhimillinen elämä ei kuitenkaan ole pelkästään siinä datassa, se ei ole niissä tietyissä numeroissa ja historiatiedoissa, IT-asiantuntija Petteri Järvinen toteaa Uutisaamun haastattelussa.
Ilmiö ei ole täysin vieras Suomessakaan.
– Meillä tehdään esimerkiksi rekrytointipäätöksiä ja toimeentulotukipäätöksiä yhä enemmän koneellisesti, Petteri Järvinen muistuttaa.
Päätöksenteossa ei Järvisen mukaan riitä pelkkä dataan nojaaminen.
– Kone ottaa huomioon vain sen kapean datasetin, mikä sille on annettu, Järvinen kertoo.
Yleensä datan vinoutuminen koskee vähemmistöjä, mutta Halenius muistuttaa, että jokainen voi joutua syrjityksi.
– Esimerkiksi iän perusteella voi joutua syrjityksi, Halenius kertoo.
Yllä olevalla videolla tutustutaan muun muassa siihen, miten Googlen kääntäjä toimii datan perusteella.
Katso lisää videolta!