
Aalto-yliopiston tutkijat kehittivät “vihapuhekoneen” – koneoppimiseen perustuvalla algoritmilla oli vaikeuksia tunnistaa suomenkielistä vihapuhetta
Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia. Luokittelujärjestelmällä oli tosin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla oli lisäksi varsin rajoittunut kyky tulkita keskustelun tai kommentoinnin kontekstia.
Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta muun muassa avoimista keskusteluryhmistä saatujen aineistojen perusteella. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta ja kehittämään luokittelujärjestelmän vihapuheelle.
Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.
Luokittelujärjestelmällä oli kuitenkin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.
Samoista ongelmista kontekstin ja kirjoitusvirheiden tunnistamisessa on kärsinyt myös Googlen kehittämä, vihapuheen tunnistamiseen keskittynyt Perspective-luokitin, Aalto-yliopiston tiedotteessa todetaan.
Tutkijoiden mukaan vihapuhekone kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.
Vihapuhekone mahdollistaa valtavien tietomassojen seulomisen
– Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.
– Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin ’opettamiseen’ käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.
Koneen tekijät pyrkivät tunnistamaan ainakin omasta mielestään kaikentyyppisen vihapuheen.
Maahanmuutto ja turvapaikanhakijat ovat usein näkyvimpiä teemoja, mutta yhtä tärkeää on tunnistaa esimerkiksi naisiin, etnisiin vähemmistöihin tai tiettyihin poliittisiin kantoihin kohdistuva vihapuhe, Aalto-yliopiston tiedotteessa todetaan.
– Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää, väittää Reeta Pöyhtäri Tampereen yliopistosta.
– Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena, kuvailee.
Vihapuhetta ei ole mainittu Suomen laissa, ja sen määrittely on tunnetusti vaikeaa. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää.
Helsingin yliopiston, Tampereen yliopiston ja Aalto-yliopiston hanke kytkeytyy neljään Suomen Akatemian ja Koneen Säätiön rahoittamaan tutkimushankkeeseen.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita


PS: Yhdenvertaisuusvaltuutetulta rahahanat kiinni – “Puuttuu mielipiteisiin, joista ei itse pidä”

Oikeusministeriö oli mukana rakentamassa järjestelmää, jolla kytättiin vaaliehdokkaiden jokaista someviestiä

Oikeusministeriö pyrki vaikuttamaan kuntavaaleihin – yhdenvertaisuusvaltuutettu vaati puoluesihteeriä poistamaan kampanjamateriaaleja somesta

Halla-aho: Suhteellisuutta vihapuhe- ja valeuutiskeskusteluun
Viikon suosituimmat

SDP jälleen turpo-kuutamolla – kun Lulu Ranne totesi, ettei suomalainen puolustusteollisuus välttämättä hingu työntekijöiksi venäläisiä, demarit menivät välittömästi epäkuntoon
Vaikuttaisi itsestäänselvyydeltä, että suomalainen puolustusteollisuus toivoo työvoimaa, joiden lojaliteeteista voidaan kohtuullisella varmuudella mennä takuuseen. Yhtä lailla vaikuttaa itsestäänselvältä, etteivät Suomeen saapuvat venäläiset sattuneesta syystä ole puolustusvoimien ykkösrekryjä. Asian ääneensanominen aiheutti kuitenkin Hämeenlinnan valtuustossa melkoisen demariäläkän.

Yle-pomo Merja Ylä-Anttila skippasi viime viikolla kysymyksen Yleisradion vasenkallistumasta – ”Mikään tutkimus ei tällaista todista…”
EVA:n juuri julkaistu syksyn 2024 arvo- ja asennetutkimus paljastaa, että jopa 40 prosenttia suomalaisista katsoo Yleisradion uutisoinnin oleva vasemmalle kallellaan. Perussuomalaisten kansanedustaja Pekka Aittakumpu kysyi viime viikolla samasta asiasta Yleisradion toimitusjohtajalta Merja Ylä-Anttilalta, joka tuolloin katsoi, että kysymykseen vastaaminen on hankalaa.

Intia juhlii hiilenlouhinnan ennätystä – Suomi murehtii porojen röyhtäyksiä
Suomessa murehditaan lehmien pieruja ja porojen röyhtäyksiä, jotka ilmastoaktivistien mukaan tuhoavat koko maailman ilmaston. Samaan aikaan Intiassa juhlitaan sitä, että maa tuottaa enemmän hiiltä kuin koskaan. Intialaiset iloitsevat, koska edullinen fossiilinen polttoaine tarkoittaa heille halpaa energiaa, talouskasvua ja omavaraisuutta.

Päivän pointti: Helsingin Sanomat ilmastosyyllistää ja leimaa suomalaiset tuholaisiksi – vaikka Suomi on hiilinegatiivinen maa

Vihreät syyllistää suomalaisia rasismista – samaan aikaan vihreä kansanedustaja syynää julkisista tapahtumista ihmisten ihonväriä
Vihreät lähtee kunta- ja aluevaaleihin ylimielisessä woke-asennossa, eli puolue solvaa nyt äänestäjiä rasisteiksi. Kaksisuuntaisesta keskustelusta kieltäytyneen puolueen arvioidaan jo olevan kriisitilassa.

Kansalaisaloitteen tekijät: Ylen rahoitusta leikattava Ruotsin tasoon eli 76 euroon per asukas
Yle kuriin nyt! -kansalaisaloitteen laatijoiden mielestä Yleisradio on tietoisesti hakenut säästöjä kaikista näkyvimmistä ja suosituimmista toiminnoista esimerkiksi irtisanomalla työntekijöitä ja vihjaamalla katsojaluvuiltaan suosituimpien ohjelmien lopettamiseen.

Musk-viha roihuaa ja Teslat palavat – erityisesti transseksuaalit vihaavat maailman rikkainta miestä
Elon Muskin omistaman yrityksen valmistamat sähköautot ovat joutuneet vasemmistolaisten vihan kohteeksi. Tesloja on naarmutettu, sotkettu maalilla ja tuhottu polttopulloilla. Erityisesti transseksuaalit tuntuvat vihaavan Elon Muskia. Tuleeko Tesla-mellakoista uusi Black Lives Matter -ilmiö?

Vieläkö muistat? Sanna Marin kiisti kielitaidottomien hoitajien aiheuttavan ongelmia – nyt hoitajaliitto SuPer pelkää vieraskielisten hoitajien vaarantavan jo potilasturvallisuutta
Suomen lähi- ja perushoitajaliitto Superin julkaisema tuore selvitys viimeistään osoittaa kaikille, että sotealan ongelmia ei ole mahdollista korjata siten, että alalle aktiivisesti haalitaan henkilökuntaa maailman toiselta puolelta. Vielä eduskuntavaalien 2023 alla monet eturivin poliitikot kuitenkin pyrkivät kiistämään kielitaidottomien hoitajien työyhteisölle aiheuttamat ongelmat ja työyhteisölle kasaantuvan lisäkuorman.

Yle painostaa hallitusta likaisilla menetelmillä – Antikainen: Johtajat vaihtoon
Yleisradion toiminnassa on havaittu vakavia epäkohtia muutosneuvotteluiden jälkeen, ja irtisanomisten perusteet ovat herättäneet runsaasti kysymyksiä. Perussuomalaisten kansanedustaja Sanna Antikainen vaatii, että Ylen tulee leikata kustannuksiaan hallinnon ja byrokratian puolelta sen sijaan, että se lakkauttaa suositut ohjelmat ja irtisanoo arvostettuja toimittajia.

EVA:n tutkimuksen tulos on karua luettavaa Ylestä – Vigelius: ’’Puolueellisuus ei kuulu verorahoitteiseen mediaan’’
Tänään julkaistun EVA:n Arvo- ja asennetutkimuksen mukaan jopa 40 prosenttia suomalaisista arvioi Yle Uutisten painottavan tiedonvälityksessään vasemmistolaista näkökulmaa.
Uusimmat

Puola otti käyttöön Suomen mallin mukaisen rajaturvallisuuslain

Antikainen: Elokapina tulee lakkauttaa
Toimitus suosittelee

Lue lisää
PS Naiset 1/2025

Lue lisää
Perussuomalainen 1/2025

Lue lisää