Kansainvälinen tutkimusyhteisö pelkää kehittyvän puheenkloonaustekniikan mahdollistavan erilaiset modernit huijaukset, kuten identiteettivarkaudet ja pankkiin tunnistautumiset.
Itä-Suomen yliopisto on mukana järjestämässä kolmatta ASVspoof-kilpailua, joka on suurin ja kattavin puhebiometristen huijaushyökkäysten teknologiaa arvioiva projekti.
Kilpailussa tutkitaan puhujantunnistuksen haavoittuvuuksia ja kehitetään huijaushyökkäysten tunnistusmenetelmiä.
Itä-Suomen yliopiston apulaisprofessori Tomi Kinnunen kertoo olevansa huolissaan ongelman laajuudesta.
Teknologian kehittyessä mahdollisuudet muokata ääntä ja jopa videokuvaa kehittyvät nopeasti, ja jo nyt voidaan luoda niin kutsuttuja DeepFake-videoita, joissa todelliset henkilöt voidaan laittaa tekemään asioita, joita he eivät ole oikeasti tehneet.
Julkisuuden uusi riski
Kaikkein helpointa tällaista materiaalia on tuottaa henkilöstä, josta on verkossa paljon tarkkalaatuista kuvaa ja ääntä. Erityisen riskiryhmän muodostavat siis julkisuuden henkilöt, kuten poliitikot.
– Kannattaa ehkä jatkossa kaikkien muidenkin miettiä, kuinka paljon materiaalia laittaa sosiaaliseen mediaan, Kinnunen toteaa.
Jos aiemmin on varoiteltu julkaisemasta itse arkaluontoista materiaalia, tulevaisuudessa kaikenlainen materiaali saattaa toimia perustana arkaluontoisen materiaalin tekemiselle.
Lue myös: Lukuisat viranomaiset ja eri tahot varoittavat suomalaisia "nettimaailman saalistajista" – nämä tunnusmerkit on syytä painaa mieleen
Toisaalta Kinnunen on huolissaan myös siitä, että jos koneella tehdystä äänestä ja videokuvasta tulee tarpeeksi korkealaatuista, ihmiset voivat myös kieltää tehneensä videoilla tai äänitallenteissa osoitettuja asioita vetoamalla siihen, että ne on luotu manipulaatiotekniikalla.
– Identiteettivarkaudet saattavat eri muodoissaan mennä aivan uudelle tasolle. Tutkijat ovat kyllä tienneet jo parikymmentä vuotta, että sormenjälkien, kasvojen ja puheen tunnistusta voidaan huijata.
Huijari voisi tunnistautua pankissa
Perinteiset tunnistustavat ovat monille tuttuja rajatarkastuksista. Tämän lisäksi on vielä puheentunnistukseen liittyvät suojat, kuten älypuhelimen lukitus tai mahdollisuus varmentaa verkkopankkikirjautuminen puhelimilla.
– Siinä voi sitten käyttää omaa mielikuvitusta, että mitä kaikkea huijauksia näin pystyy tekemään, Kinnunen sanoo.
Teknologia voi mahdollistaa siis sekä viranomaisten että yksityishenkilöiden huijaamisen.
Kinnunen uskoo, että tulevaisuudessa saatetaan hyvinkin kehittää virustorjuntatyyppisiä sovelluksia, jotka tunnistavat, soittaako meille äitimme vai huijari.
Kaksi haastetta
Kolmatta kertaa järjestettävässä kilpailussa tutkitaan tänä vuonna kahta asiaa.
Tutkimusryhmät pyrkivät selvittämään, kuinka helppoa on erottaa etukäteen nauhoitettu tallenne reaaliaikaisesta puheesta. Toinen kilpailijoille annettava haaste on tunnistaa, onko kyseessä oikea henkilö vai koneella tuotettu imitaatio.
Osallistujat saavat kilpailussa käytettävän datan käsiinsä ensi perjantaina.
Tuloksia esitellään syyskuussa puheteknologian alan Interspeech-konferenssissa Itävallassa.
Manipulaatiosta suosittu jekku?
Kinnunen toivoo, että myös viranomaistahot tarkkailisivat teknologian kehittymisen uhkia.
– Tällä hetkellä identiteetin kloonaus vaatii enemmän tällaista nörttinäpertelyä, mutta en usko että kuluu kovinkaan kauan, että puhelimissa alkaa olla ääntä ja kuvaa muuntavia sovelluksia kaikkien ulottuvilla.
Lue myös: Valepoliisit huijasivat ihmisiltä satoja tuhansia euroja – soittivat vanhukselle läpi yön niin pitkään, että saivat pankkitunnukset
ASVspoof -haasteessa on mukana tänä vuonna myös Google, joka on kehitellyt erilaisia synteettisen puheen palveluja, kuten palvelun jolla varata luonnollista puhetta mukaillen ravintolapöytiä ja kampaajia. Google osallistuu lahjoittamalla datansa tutkimuksen käyttöön.