Aalto-yliopiston tutkijat kehittivät “vihapuhekoneen” – koneoppimiseen perustuvalla algoritmilla oli vaikeuksia tunnistaa suomenkielistä vihapuhetta
Joukko tietojenkäsittelyn, median ja viestinnän tutkijoita ja soveltajia toteutti kevään 2017 kuntavaalien aikana vihapuheen tunnistamiskampanjan, jossa käytettiin apuna koneoppimiseen perustuvaa algoritmia. Luokittelujärjestelmällä oli tosin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla oli lisäksi varsin rajoittunut kyky tulkita keskustelun tai kommentoinnin kontekstia.
Kampanjan aluksi algoritmia opetettiin tunnistamaan vihapuhetta muun muassa avoimista keskusteluryhmistä saatujen aineistojen perusteella. Algoritmi oppi laskennallisesti vertailemaan, mikä erottaa vihapuhetta sisältävän tekstin ei-vihapuheesta ja kehittämään luokittelujärjestelmän vihapuheelle.
Tämän jälkeen luokittelujärjestelmän avulla seulottiin päivittäin kaikki kunnallisvaaliehdokkaiden tuottama avoin sisältö Facebookissa ja Twitterissä noin kuukautta ennen vaaleja. Ehdokkaiden tilit saatiin kerättyä Ylen vaalikoneaineiston avulla.
Luokittelujärjestelmällä oli kuitenkin vaikeuksia suomen kielen sanamuotojen kanssa. Algoritmilla on lisäksi ihmistä rajoittuneempi kyky tulkita keskustelun tai kommentoinnin kontekstia.
Samoista ongelmista kontekstin ja kirjoitusvirheiden tunnistamisessa on kärsinyt myös Googlen kehittämä, vihapuheen tunnistamiseen keskittynyt Perspective-luokitin, Aalto-yliopiston tiedotteessa todetaan.
Tutkijoiden mukaan vihapuhekone kykenee toimimaan valtavien aineistojen seulojana, joka tuo esiin epäilyttäviä viestejä, mutta vain ihminen voi tehdä lopulliset päätelmät vaadittavista toimenpiteistä.
Vihapuhekone mahdollistaa valtavien tietomassojen seulomisen
– Viranomaisnäkökulmasta toimenpiteitä aiheutti korkeintaan 20 viestiä. Sanojen listaus ei sinänsä ole riittävää, koska merkitys tulee niiden yhdistelystä. Toisaalta meillä ei taas olisi resursseja näin mittavaan seurantaan ilman vihapuhekoneen ja tutkijoiden apua”, kertoo yhdenvertaisuusvaltuutettu Kirsi Pimiä.
– Viestejä luokitellessa tutkija joutuu ottamaan kantaa kieleen ja kontekstiin, minkä vuoksi algoritmin ’opettamiseen’ käytettävää aineistoa on tärkeää käsitellä useamman tulkitsijan voimin”, sanoo Salla-Maaria Laaksonen Helsingin yliopistosta.
Koneen tekijät pyrkivät tunnistamaan ainakin omasta mielestään kaikentyyppisen vihapuheen.
Maahanmuutto ja turvapaikanhakijat ovat usein näkyvimpiä teemoja, mutta yhtä tärkeää on tunnistaa esimerkiksi naisiin, etnisiin vähemmistöihin tai tiettyihin poliittisiin kantoihin kohdistuva vihapuhe, Aalto-yliopiston tiedotteessa todetaan.
– Vihapuhetta on aina ollut olemassa. Sitä on aina tuotettu pönkittämään oman ryhmän asemaa ja syrjimään toisia, mutta sosiaalinen media on tehnyt siitä aikaisempaa näkyvämpää, väittää Reeta Pöyhtäri Tampereen yliopistosta.
– Tunteisiin perustuva ilmaisu ja uskomukset korostuvat, ja niitä myös kierrätetään verkossa. Jos ehdokas esimerkiksi kampanjan aikana poisti kirjoituksensa nopeasti julkaisemisen jälkeen, se saattoi silti jäädä elämään kuvakaappauksena, kuvailee.
Vihapuhetta ei ole mainittu Suomen laissa, ja sen määrittely on tunnetusti vaikeaa. Hankkeessa käytettiin Euroopan neuvoston sekä Ethical Journalism Networkin rakentamaa vihapuhemääritelmää.
Helsingin yliopiston, Tampereen yliopiston ja Aalto-yliopiston hanke kytkeytyy neljään Suomen Akatemian ja Koneen Säätiön rahoittamaan tutkimushankkeeseen.
Suomen Uutiset
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita
PS: Yhdenvertaisuusvaltuutetulta rahahanat kiinni – “Puuttuu mielipiteisiin, joista ei itse pidä”
Oikeusministeriö oli mukana rakentamassa järjestelmää, jolla kytättiin vaaliehdokkaiden jokaista someviestiä
Oikeusministeriö pyrki vaikuttamaan kuntavaaleihin – yhdenvertaisuusvaltuutettu vaati puoluesihteeriä poistamaan kampanjamateriaaleja somesta
Halla-aho: Suhteellisuutta vihapuhe- ja valeuutiskeskusteluun
Viikon suosituimmat
Tynkkynen osti Hesarin etusivun täyteen maahanmuuttopolitiikkaa
Europarlamentaarikko Sebastian Tynkkynen kertoo Helsingin Sanomissa tänään maanantaina julkaistavassa etusivun mainoksessaan "rajat auki" -politiikan jäävän historiaan katastrofaalisena kokeiluna. Kukaan ei enää pysty kiistämään niitä ongelmia, joista perussuomalaiset ovat jo vuosia varoitelleet.
Pekka Aittakumpu: “On aika tunnustaa, miten suurta vahinkoa yksisilmäinen monikulttuurisuusaatteen ihannointi on aiheuttanut”
Perussuomalaisten kansanedustaja Pekka Aittakummun mielestä on aika tunnustaa monikulttuurisuusaatteen suomalaisille arvoille aiheuttama vahinko ja seistä rohkeasti isänmaamme takana.
Joka neljäs ruotsalaisnuori aikuistuu lukutaidottomana – mitä ihmettä he tekevät seuraavat 60 vuotta ja kuka sen maksaa?
Kyky ymmärtää kirjoitettua tekstiä on ehdoton edellytys täysivaltaiselle jäsenyydelle länsimaisessa yhteiskunnassa. Jos sadat tuhannet nuoret valmistuvat peruskoulusta käytännössä lukutaidottomina, seuraukset ovat arvaamattomat. Hyviä ne eivät ole missään tapauksessa.
Lux Helsingin somekampanja yhdistää hijabin naisten voimaannuttamiseen – Lähi-idän asiantuntija: Monin paikoin maailmaa naiset on pakotettu huntuun vielä tänäkin päivänä
Lähi-idästä kotoisin olevat naiset huomasivat Lux Helsingin somekampanjan, jossa esiintyy hijabiin puettu nainen. Kampanjavideota näytettiin esimerkiksi Facebookissa. Hijab-kuvan jälkeen videolle tulee versaalein kirjoitettuna sana "empowering" (voimaannuttaa).
Ääliösuvaitsevainen valtamedia jauhoi ensin huolipuhetta naisiin kohdistuvasta väkivallasta – vähättelee nyt väkivaltaan lietsovaa graffitia eikä tunnista enää naisvihaa
Naisiin kohdistuvan väkivallan -jopa naisvihan - hyväksyminen graffiteissa taiteellisen vapauden nimissä tai väkivallan vähättely johtaa jälleen havaitsemaan median räikeät kaksoisstandardit.
Argentiinan rankka talousihme näyttäisi toimivan – inflaatio on hallinnassa eikä kansa ole noussut kapinaan
Argentiinasta kuuluu kummia. Hyperinflaatio on taitettu ja talous kasvaa. Presidentti Javier Milein anarkokapitalismi näyttäisi vuoden kokemuksella sittenkin toimivan. Milei on ankarasta vyönkiristyksestä huolimatta säilyttänyt kansan tuen, eikä sosiaalinen tahi taloudellinen katastrofi toteutunut. Ajatukset alkavat itää Suomessakin.
SDP esitti pakolaiskiintiön ja vastaanottotukien korottamista – hallitus äänesti opposition haaveet kumoon
Vasemmistopuolueet esittivät tiistaina valtion talousarviota käsittelevässä eduskunnan täysistunnossa useita muutoksia sisäministeriön hallinnonalaan ja maahanmuuttoon liittyen. Perussuomalaisten kansanedustaja Joakim Vigelius kritisoi opposition linjaa vastuuttomaksi.
Isku saksalaisella joulutorilla, saudimies kaahasi autolla väkijoukkoon – sisäministeri oli aiemmin varoittanut suuresta terrori-iskun vaarasta joulumarkkinoilla
Mies kaahasi henkilöautolla väkijoukkoon joulutorilla Magdeburgissa Saksassa. Mediatiedot kertovat useista kuolonuhrista ja kymmenistä loukkaantuneista.
SDP sai kyytiä kyselytunnilla: Demareiden veronalennuspuheisiin ei voi suhtautua vakavasti
Perussuomalaisten kansanedustaja Joakim Vigelius osui napakymppiin muistuttaessaan demareita SDP:n vaihtoehtobudjetin tuntuvista veronkorotuksista.
Tuiskun keskeltä löytyi melkoinen määrä perussuomalaisia täydessä vaalitouhussa – Jani Mäkelää harjattiin Lappeenrannassa olan takaa, mutta miksi?
Perussuomalaiset näkyivät viikonlppuna kaikkialla Suomessa. Lunta tuprutti monin paikoin olan takaa, mutta niin kuuluu jouluna ollakin. Suomen Uutiset kokosi kuvakoosteen viikonlopun vaalikentiltä.
Uusimmat
Kolumni: Ensimmäinen puolitoistavuotinen ministerinä
Ronkainen: Ansaitsisiko metsästys virallisen roolin puolustuksessa?
Toimitus suosittelee
PS Naiset 3/2024
Lue lisää
Perussuomalainen 1/2024
Lue lisää