Kuvakaappaus Linkurious-ohjelmistosta. Yle/MOT. / Yle/Linkurious
Verohallinto vaatii Yleltä Panama-vuodon tietoja – mutta onko pyyntöön mahdollista suostua?
Suomen verohallinto vaatii Yleisradiota luovuttamaan Panaman tietovuotoon liittyvän aineiston. Onko pyyntöä ylipäänsä mahdollista toteuttaa? Jotta tähän kysymykseen saataisiin selvyys, on tarpeen ymmärtää se, millainen aineisto on kyseessä, missä se sijaitsee ja kuka sitä hallinnoi.
Panama-papereiksi ristitty tietovuotoaineisto on valtavan kokoinen. Se käsittää 11,5 miljoonaa Mossack Fonseca lakitoimistosta vuodettua dokumenttia, kooltaan yhteensä noin kaksi ja puoli teratavua. Joukossa on tietoja yli 200 000 veroparatiisiyhtiöstä ja –säätiöstä.
Tietomäärän suuruutta kuvastaa hyvin eräs arvio, jonka mukaan Panama-dokumenttien tulostamiseen tarvittaisiin noin 13 tonnia A4-paperia.
Tiedot vuodettiin useissa osissa saksalaiselle Süddeutsche Zeitung –lehdelle. Kun vuodon valtava tietomäärä paljastui lehdelle, se pyysi apua Yhdysvalloissa toimivalta tutkivien journalistien yhteenliittymältä ICIL:ltä. Se kävi toimeen, ja rakensi järjestelmän, jonka avulla tietomassaa oli mahdollista penkoa ilman syvällistä ohjelmointiosaamista.
Miten tämä tehtiin?
ICIL:n tietopalvelu- ja tutkimusyksikön päällikkö Mar Cabra kertoi, että vuodettujen tietojen joukossa oli Mossack Fonseca –yhtiön sisäinen tietokanta sekä suuri määrä dokumentteja.
Tietokantojen tietoja kutsutaan strukturoiduksi dataksi. Tämä tarkoittaa sitä, että tiedot ovat järjestettyä, taulukkomuotoista dataa. Tietokanta sisälsi tietoja muun muassa yritysten toimihenkilöistä, osakkaista ja välikäsistä. Cabran mukaan tietokanta oli journalistiryhmälle erittäin arvokas, mutta tietojen analysointia hidasti niin sanotun skeeman eli tietokantarakenteen puuttuminen. Eräs ICIJ:n työntekijä joutui käyttämään kuukausikaupalla aikaa siihen, että hän sai tietokannan tiedot hakukelpoiseen muotoon.
Vielä tätäkin vaikeammaksi osoittautui sturukturoimattoman datan analysointi. Tällaisella datalla tarkoitetaan erilaisia tiedostoja, kuten pdf- ja kuvatiedostoja sekä sähköposteja. Datan joukossa oli Le Monde –lehden mukaan 4,8 miljoonaa sähköpostia, 3 miljoonaa tietokantatiedostoa, 2 miljoonaa pdf:ää ja miljoona kuvatiedostoa.
OpenNews-uutisportaalin mukaan ICIJ:n tekninen tiimi latasi tiedot ensin Amazonin pilvipalveluun. Tiedostot ja niistä tehdyt kopiot suojattiin VeraCrypt-ohjelmistolla. Viestiliikenteen salauksessa käytettiin PGP-, Hashmail-, Phreema- ja Signal-ohjelmistoja.
Vuodon tietoja oli muokattava useilla eri työkaluilla, jotta ne saataisiin käyttökelpoiseen muotoon. Tekstintunnistusta varten tiimi otti käyttöönsä 30-40 Amazon-yhtiön pilvipalvelusta vuokrattua palvelinta. Tunnistuksen jälkeen tiedot syötettiin indeksointiohjelmistoon, joka kykeni lukemaan erilaisia tiedostomuotoja kuten pdf:iä ja sähköposteja.
Varsinainen journalistien käyttöön tarkoitettu käyttöliittymä rakennettiin Project Blacklight –nimisellä ohjelmistolla. Tätä ohjelmistoa käytetään usein eri maiden kirjastoissa, mutta nyt se taivuteltiin journalistien käyttöön. Ohjelmistolla voi suorittaa rajattuja tietohakuja – esimerkiksi siten, että lyödään lukkoon tietty hakualue – esimerkiksi tietyt vuodet ja tietyn tyyppiset tiedostot – ja etsitään sitten kyseiseltä hakualueelta tiettyjen hakusanojen mukaan.
Edistyneet hakupalvelut
Kun data oli vihdoin saatu luettavaan muotoon, se siirrettiin uuteen tietokantaan. Tiimi käytti datamuunnosohjelmaa siirtääkseen tiedot Neo4j-tietokantaan. Tämä tietokanta kytkettiin Linkurious-visualisointiohjelmistoon. Nyt toimittajien käytössä oli työkalupari, jolla vuodetun datan erittäin monimutkaisia yhteyksiä oli mahdollista käydä läpi ilman ohjelmointitaitoja.
Ylen toimittajat käyttivät 4.4.2016 esitetyssä MOT-ohjelmassa Linkurious-ohjelmistoa.
Blacklight-käyttöliittymään rakennettiin Google-haun tyyppinen nimihaku, jolla oli mahdollista etsiä esimerkiksi henkilöiden nimiä tietojen joukosta. Tavallisen nimihaun lisäksi toteutettiin joukkohaku. Tämän toiminnon avulla journalistien oli mahdollista rakentaa ensin syöttää hakukoneelle lista esimerkiksi oman maansa johtavista poliitikoista ja saada hakukoneelta vastaus siihen, esiintyykö joku listalla olevista henkilöistä Panama-datan joukossa. Lisäksi ns. proximity match –toiminnon avulla löydettiin henkilöitä, vaikka haettava nimi ei ollut täsmälleen sama datassa oleva nimi.
Neo4j-tietokannan yhteydessä on mahdollista käyttää edistynyttä Cypher-kyselykieltä, esimerkiksi näin: ”listaa sellaiset henkilöt, jotka ovat kahden kytköksen päässä Vladimir Putinista”.
Journalisteille linkki ja salasana
ICIJ valitsi yhteistyökumppaneita eri maiden uutistoimistoista. Käyttäjätunnukset jaettiin noin 400 journalistille ympäri maailman. Tunnusten luovutus oli Forbes-lehden mukaan hyvin yksinkertainen – toimittajalle luovutettiin käyttöliittymälinkki sekä satunnaisgeneraattorin muodostama salasana.
Tunnuksen saanut toimittaja avasi hänelle lähetyn linkin ja syötti salasanansa. Heti tämän jälkeen hänelle avautui mahdollisuus käydä läpi Mossack Fonsecan dataa.
Toimittajan oman tietokoneen ja ICIJ:n ylläpitämän palvelimen välinen yhteys on salattu hyvin yleisellä SSL-suojauksella. Tätä salaustapaa käytetään useimmissa verkkopankeissa, Suomessakin.
Verohallinto vaatii luovutusta
Suomen Verohallinto on vaatinut, että Yle ja aineistoa tutkineet toimittajat luovuttaisivat veroviranomaisille vuodetut asiakirjat ja toimituksellisen tausta-aineiston. Verottaja on myös uhannut tehdä kotietsinnän Ylen tiloihin, ellei yhtiö luovuta veroviranomaiselle sen vaatimia tietoja. Yle on kieltäytynyt aineiston luovuttamisesta lähdesuojaan vedoten.
Verohallinnon vaatimus on hyvin vaikea toteuttaa, koska Panaman tapauksen massiivinen aineisto on saavutettavissa ainoastaan verkkopalveluiden kautta. Ylen toimittajilla on pääsy tietojen katseluun, mutta heillä ei ole mahdollisuutta koko aineiston lataamiseen. Yle ei myöskään hallinnoi ohjelmistokokonaisuutta.
Tietojen luovutus tarkoittaisi käytännössä sitä, että Ylen toimittajien olisi luovutettava käyttäjätunnuksensa sekä salasanansa verohallinnolle. Tästä ei olisi kuitenkaan suurta iloa, koska ICIJ sulkisi kyseiset tunnukset heti, kun se saisi tiedon niiden luovuttamisesta.
– Me emme voi antaa käyttäjätunnuksia eteenpäin. Jos näin tehdään, pääsy evätään heti, Minna Knus-Galán toteaa Suomen Uutisille.
Panaman tietojen julkisuudesta ei päätä Yle vaan ICIJ. Niinpä on vaikea nähdä, miten verottajan vaatimus tietojen luovutuksesta voisi toteutua.
Verottajan arkea helpottanee se, että toimittajajärjestö ICIJ on ilmoittanut julkaisevansa 200 000 yrityksen tietoja sisältävän hakukelpoisen tietokannan 9.5.2016, siis noin viikon päästä.
Kaikkea mahdollista ei ole tarkoitus julkaista – pimentoon jäävät tilitiedot, passikopiot ja sähköpostiviestit. Niiden sijaan ICIJ lupaa paljastaa bulvaaniyritysten feikkijohtajien suojissa piileskelleet todelliset omistajat ja vallankäyttäjät.
Matias Turkkila
Artikkeliin liittyvät aiheet
Mitä mieltä?
Aiheeseen liittyviä artikkeleita
Pimeä visakortti pikkurahalla, feikkijohtaja tonnilla – veroparatiisipalveluita tarjotaan netissä täysin avoimesti
Mossack Fonsecan kuuluisien asiakkaiden nimiä julki – mutta mikä taho puuttuu listalta ja miksi?
Meri: Kaikki mukaan talkoisiin harmaata taloutta ja veronkiertoa vastaan
Viikon suosituimmat
Tamponit poistetaan Facebookin konttoreiden miestenvessoista – DEI-ideologia tekee kuolemaa Amerikassa
DEI-ideologia jyllää vielä vahvasti Suomessa, varsinkin julkisella sektorilla, mutta synnyinmantereellaan DEI vetää viimeisiä henkäyksiään. Facebookin omistava Meta-konserni on liittynyt niiden suuryritysten joukkoon, jotka ovat ilmoittaneet lopettavansa DEI-hankkeensa. Käytännössä se näkyy muun muassa siten, että jatkossa Facebookin toimitilojen miestenvessoissa ei ole enää tarjolla ilmaisia tamponeja.
Jättimäinen grooming-skandaali lopulta julki: rasismisyytösten pelko ja väestösuhteiden vaaliminen tukkivat viranomaisten suut -“Suurin rauhan ajan rikos ja sen peittely Britannian historiassa”
Useamman vuosikymmenen ajan jatkunut tuhansien englantilaistyttöjen järjestelmällinen groomaus, ahdistelu ja sarjaraiskaukset ovat suurin rauhanajan rikos modernin Euroopan historiassa, kirjoittaa historioitsija ja kolumnisti Dominic Green amerikkalaisessa The Free Press -lehdessä. Nämä rikokset ovat enimmäkseen pakistanilaistaustaisten muslimimiesten tekemiä, ja valtaosa heistä ei ole joutunut vastuuseen. 2010-luvulla sekä oikeiston että vasemmiston johtamat hallitukset yrittivät hyssytellä vyyhtiä muutamien symbolisten oikeudenkäyntien jälkeen. Se näytti onnistuvan, kunnes Elon Musk perehtyi osaan oikeudenkäyntiasiakirjoista ja nosti asian esille omistamallaan X-alustalla. Nyt skandaali ravistelee Ison-Britannian yhteiskuntajärjestystä, eikä vyyhtiä voi enää hyssytellä.
DEI-ideologia ei varjellut Kaliforniaa maastopaloilta – viranomaisille kovaa kritiikkiä
Yksi kritiikin kohde Los Angelesin alueen maastopaloihin liittyen on se, että monien mielestä poliitikkojen ja pelastuslaitoksen johdon olisi pitänyt ideologisen yhdenvertaisuuspuuhastelun sijasta keskittyä perusasioihin, kuten varmistamaan palopostien toimivuus ja sammutusveden saatavuus. Los Angelesin pelastuslaitoksella on viime vuosina panostettu vahvasti DEI-ideologian edistämiseen.
Yliopistotutkimuksen karu tulos: Ulkomaalaistaustaisten yliedustus raiskauksissa jopa 7-kertainen – syrjäytyminen ei ole syynä
Suuri enemmistö kaikista Ruotsissa raiskaustuomion vuosina 2000-2020 saaneista oli maahanmuuttajataustaisia. Ero etnisesti ruotsalaisiin oli jopa 7-kertainen. Sosioekonomiset seikat ja syrjäytyminen eivät selitä rikoksia, selviää Lundin yliopiston tekemästä tutkimuksesta. Syyt on etsittävä muualta.
Antikainen: Scholzin päätös jättää Ukraina ilman apua on häpeällinen – Tuppurainen siunasi Suomen demarien tuen Berliinissä
Saksan liittokansleri Olaf Scholz (SPD) päätti estää noin kolmen miljardin euron arvoisen tukipaketin Ukrainalle. Tukipaketti olisi sisältänyt kriittisiä puolustusjärjestelmiä, kuten IRIS-T-ilmatorjuntajärjestelmiä ja Patriot-ilmatorjuntaohjuksia, joita Ukraina on pyytänyt suojellakseen kansalaisiaan Venäjän aggressioilta. Perussuomalaisten kansanedustaja Sanna Antikainen pitää päätöstä käsittämättömänä ja vastuuttomana.
Somaleista puolet työttöminä ja lopuilla usein toimeentulovaikeuksia Ruotsissa – maan työikäisistä enemmistö ulkomaalaistaustaisia jo vuonna 2033
Yli puolet Ruotsin työikäisestä väestöstä on ulkomaalaistaustaisia vuonna 2033. Heistä useimpien tausta on Euroopan ulkopuolella. Kohti mielenkiintoisia aikoja ollaan menossa ja äänestämisessä saattaa piillä demokratian muutoksen avain. Göteborgs-Posten on haastatellut somalivaikuttajaa.
Sadistinen ja täysin mielenvikainen väkivalta yleistyy Ruotsissa – asialla saatananpalvojilta vaikutteita saaneet lapset
Tammikuun alussa koiraansa ulkoiluttanut 55-vuotias nainen yritettiin murhata veitseniskuilla Boråsissa. Kyseessä oli lyhyessä ajassa jo toinen törkeä väkivallanteko, joka on yhdistetty verkon pimeimmässä nurkassa majaansa pitämään natsihenkiseen saatananpalvojayhteisöön. Jäljet johtavat myös sylttytehtaisiin Venäjällä.
Espoon Miilukorven vastaanottokeskus lopettaa toimintansa perussuomalaisten esityksestä
Espoon ympäristö- ja rakennuslautakunta päätti kokouksessaan perussuomalaisten esityksestä määrätä Espoon Miilukorvessa toimivan vastaanottokeskuksen toiminnan lopetettavaksi uhkasakon uhalla äänin 8-5.
Europarlamentaarikko Tynkkynen lupaa edistää digitaalista sananvapautta EU:ssa – vihreiden Niinistö sen sijaan rajoittaisi lailla somekeskusteluja
Miljardööri Mark Zuckerberg on äskettäin luvannut vähentää sensuuria ja edistää sananvapautta omistamissaan sosiaalisen median sovelluksissa. A-studiossa keskiviikkona vieraana olleet europarlamentaarikot Sebastian Tynkkyen ja Ville Niinistö olivat täysin eri linjoilla sananvapauden käytöstä sähköisillä alustoilla. Tynkkynen huomauttikin Niinistölle, että vihervasemmistolaiset ovat kiivaasti puolustaneet sosiaalisen median faktantarkistajia, koska toimet eivät ole kajonneet vihervasemmiston sisältöihin.
Brittihallinto leimaa termin “aasialaiset raiskausringit” rasistiseksi – tilaston mukaan pakistanilaiset syyllistyvät neljä kertaa todennäköisemmin lasten seksuaaliseen hyväksikäyttöön
Paikallishallintojen alueet, joilla brittiläis-pakistanilaiset miehet raiskasivat nuoria vaaleaihoisia tyttöjä, ovat hyväksyneet Iso-Britannian työväenpuolue Labour Partyn virallisesti hyväksymän islamofobian määritelmän, joka pitää ilmausta "aasialaiset raiskausringit” rasistisena.