Monday, November 7, 2011

Uskomatonta Poliisin pelleilyä

Viikonloppuna tapahtunut henkilötieto vuoto on saamassa farssin piirteitä.

Alkuperäinen täydellinen lista ei aluksi ollut tavalliselle netin käyttäjän kovin helppo löytää, ellei liikkunut sopivilla foorumeilla. Tilanne kuitenkin muuttui hyvin nopeasti kun Googlen hakutuloksien kärkeen nousi Mikko Hyppösen Twitter viesti jossa mainittiin maagiset sanat "--------.txt" "tietovuoto". Vielä sunnuntai iltana (6.11.2011) alkuperäinen lista löytyy käyttämällä ensimäistä hakusanaa ja painamalla Googlen tunnettua "I'm Feeling Lucky" nappia.

Voiko listan tietoja käyttää väärin?
Kansalaisia on vuosia varoitettu identiteettivarkauksista, ja kun kerran sattuu iso sellainen niin silloin se ei olekaan kovin vaarallista, "Ihmisten, joiden tiedot ovat nyt päätyneet internetiin ei tarvitse olla huolissaan" - KRP:n ylitarkastaja Sari Kajantie. Silti Cert-fi:n päällikkö Erka Koivunen muistuttaa, "ettei kenenkään yksityisen pidä yrittää löytää ja kopioida listaa omalle koneelleen. Listan levittäminen ja henkilötietojen väärinkäyttäminen voi täyttää rikoksen tunnusmerkistön", eli kappas vaan ilmeisesti listan sisältö on sittenkin aika merkittävä.
Totuus on että yhdistelmällä nimi - sähköpostiosoite - henkilötunnus - puhelinnumero voi aiheuttaa erittäin paljon pientä harmia, esim. monissa ajanvarauspalveluissa nämä tiedot riittävät varamaan sekä perumaan aikoja kuten lääkäri ja terveyspalveluja tuottavat Mehiläinen ja Terveystalo.

Mitä Poliisin tulisi tästä farssista oppia?
Miksi poliisin web sivut ovat täynnä grafiikkaa ja ylimpänä sivulla pyörii vielä Flash animaatio? Jos ollaan julkaisemassa jotain joka todella kiinnostaa kansaa niin siihen pitää myös varautua. Helpoin tapa on muuttaa etusivu mahdollisimman kevyeksi, laittaa linkki julkaistuun tietoon (katso seuraava kysymys) ja lopuksi laittaa linkki normaali etusivulle. Mielenkiintoista on että vielä tiistai aamupäivällä sivut ovat erittäin tahmeat eikä listan lataaminen näytä onnistuvan, tämä osittain koska lista ei löydy etusivulta vaan käyttäjän pitää etsiä listaa ja tällä tavalla aiheuttaa lisää kuormitusta. Lista nimittäin löytyy KRP:n sivulta, minne etusivulta ei johda linkkiä.

Miksi Poliisin julkaisema lista on PDF muodossa?
Jos kerran sivut on muutenkin tukossa niin olisi hyvä julkaista lista tilaa ja verkkokaistaa säästävässä muodossa (vaikka txt muodossa) jolloin listan koko pienentyisi 1,4 megatavusta 251,5 kilotavuun.

Poliisin ja median yhteistyö
Poliisin lista pääty maanantai illalla medialle ja saatiin lopulta julkaistua, vai saatiinko? Nyt uutissivuilla liikkuu erinimisiä ja muotoisia listoja jotka ilmeisesti ovat poliisin lista mutta tästä ei voi olla täysin varma. Yleisradion sivuilla on krp_luettelo_08112011.pdf niminen tiedosto. Turun Sanomien sivuilla on linkki hxxp://www.slideshare.net/Mondeo123/lista-10059048 , kuka on käyttäjä Mondeo123, onkohan kyseessä poliisin Ford mondeo auto, ja miksi lista on amerikkalaisella palvelimella? Poliisin alkuperäis listan nimi on kuitenkin Luettelo_1.pdf joka siis löytyy täältä. Juuri sunnuntaina Viestintävirasto ohjeistaa kansalaisia, "Älkää yrittäkö etsiä tietovuotolistaa itse" ja varoittaa verkossa olevista tarkistus palveluista. Jos poliisi olisi julkaissut tarkistussumman (checksum) listasta niin listan olisi voinut hakea ihan mistä vaan ja lukija olisi voinut tarkistaa oman kopionsa aitouden.

Minun laskemat tarkistussummat poliisin listasta, mutta periaatteessa ette pysty luottamaan näihin:
md5sum:
2aeb96829aa58c86525affccf495f2d1
sha256sum:
3159109a0fcb6359a674ae3d03b2e4b6b5291ad187f1ca5fa14c4eab6c9e05b2

Eli poliisin olisi heti pitänyt lähettää lista sähköpostilla (tai vaikka USB-muistitikulla) medialle ja julkaissut muuten lähes tyhjälle poliisi.fi etusivulle vain tarkistussumma arvon.

Kun tilanne laantuu niin toivon todella että viranomaiset selvittävät miksi kaikki epäonnistui ja huolehtivat että ensi kerralla asiat hoidetaan paremmin.
Mitä jos kyseessä olisi ollut hengenvaarallinen tilanne ja viranomaisten olisi pitänyt nopeasti julkaista vastaava määrä tietoa samalla varmistaen että tiedon mahdollinen peukalointi huomataan, miten tämä olisi hoidettu?