8 Lait ja säädökset

Oppimistavoitteet: Luomme yleiskatsauksen säädöksiin, jotka sääntelevät datan julkaisemista ja avaamista. Tärkein näistä on yksityisyydensuoja.


Yksi olennainen ero pelkän julkaisemisen ja avaamisen välillä liittyy tekijänoikeuksiin. Avaaminen eli avoimen lisenssin liittäminen aineistoon antaa muille käyttöoikeuksia aineistoon. Jos datan julkaisija ei omista kaikkia oikeuksia dataan, avaaminen voi vaatia lisälupia oikeuksienhaltijoilta.

Tärkein datan avaamista määrittävä ehto on, että se ei saa rikkoa kenenkään yksityishenkilön yksityisyyden suojaa. Jokaisella on oikeus päättää itseään koskevien henkilökohtaisten asioiden julkisuudesta. Käytännössä tämä tarkoittaa sitä, että sellaista tietoa tai dataa ei voida julkaista, jonka perusteella yksittäinen henkilö on tunnistettavissa. Periaatteessa henkilötietoja sisältäviä aineistoja voidaan julkaisua varten anonymisoida ja aggregoida niin, ettei yksityisyydensuojaa vaaranneta. Käytännössä tämä voi olla haastavaa, sillä kukaan ei saa olla tunnistettavissa eri tietoja yhdistelemälläkään.

Erilaisten de-anonymisointitekniikoiden kehitys ja lisääntyneet mahdollisuudet yhdistää dataa useista lähteistä ovat siirtämässä ja hämärtämässä rajoja yksilöivän henkilötiedon ja anonyymin tiedon välillä. Tämä on johtanut kiivaaseen keskusteluun, jossa toiset hyvin perustein väittävät, ettei aukoton anonymisointi ylipäätään ole mahdollista, ja että kaikkea alunperin yksilöihin liittyvää tietoa pitää käsitellä henkilötietona lain säätämällä tavalla. Toiset taas väittävät yhtä lailla hyvin perustein, että näin tiukka tulkinta rajoittaisi monia nimettömien tietojen käyttötapoja, joissa hyödyt ovat selvästi suurempia kuin yksityisyyden suojan menetyksestä aiheutuvat haitat.

Esimerkki: Netflix julkaisi vuonna 2007 tietoaineiston, joka käsitti 500 000 käyttäjän laatimat elokuva-arviot ilman käyttäjien identiteettitietoja. Teksasin yliopiston tutkijat demonstroivat, että he kuitenkin pystyivät IMDb elokuvatietokantaa taustatietona käyttäen identifioimaan joitain käyttäjiä kyseisestä anonymisoidusta aineistosta.

Esimerkki: Kun AOL-hakukone julkaisi laajan anonymisoidun tietokannan hakukyselyistä vuonna 2006, kävi ilmi, että tietojen perusteella pystyttiin tunnistamaan yksittäisiä ihmisiä ja heidän tekemiään hakukyselyitä. Henkilötietojen ja ip-osoitteiden poistaminen ei siis riittänyt aineiston anonymisoimiseksi, koska laajasta tietoaineistosta voi kehittyneillä analyysimenetelmillä löytää yhteyksiä, jotka johtavat yksityistietojen paljastumiseen ja henkilöiden identiteetin selviämiseen.

Joskus yksityisyydensuoja voi olla myös tulkinnanvaraista. Jos esimerkiksi avataan tietoja, joiden avulla voidaan laskea metsän arvo, loukkaako se metsänomistajan yksityisyyden suojaa, kun tiedämme, kuka minkäkin metsäalan omistaa? Suomen Metsäntutkimuslaitos Metla joutui pohtimaan tätä avatessaan puustodataa.

Suomessa julkishallinnon tuottama data on lähtökohtaisesti julkista, mikäli se ei sisällä yksityisyydensuojan piiriin kuuluvaa tietoa kuten henkilörekistereitä tai muuta aineistoa, joka tulkitaan arkaluontoiseksi tai salassapidettäväksi, kuten maan turvallisuuteen ja maanpuolustukseen liittyvät asiakirjat sekä esimerkiksi uhanalaisten kasvien esiintymisalueet. Jos dataa avatessa on pienintäkään epäilystä datan julkaisukelpoisuudesta, kannattaa pyytää apua lainsäädäntöä tuntevalta taholta, sillä julkaisua voivat rajoittaa yllättävätkin lait ja tilanteet, jotka eivät maallikolle välttämättä tule mieleen.

Esimerkki: Uhanalaisten lajien esiintymistiedot pidetään monissa maissa salaisina, koska riskinä on, että näitä eläimiä aletaan tietojen perusteella metsästää. Tämä salassapitovelvoite ei lue laissa suoraan, vaan asianomainen virasto on tehnyt päätöksen sille annetun luonnonsuojelutehtävän kannalta välttämättömänä harkinnanvaraisena julkisuuden rajauksena.

Datan avaamisella voi olla yllättäviä tai kyseenalaisia seurauksia, joihin datan julkaisijan on hyvä varautua. Jos data periaatteessa olisi avattavissa, mutta sen voidaan arvella johtavan ikäviin seurauksiin, pitää käyttää harkintaa.

Esimerkki: Britanniassa avattiin geotagattu tietokanta antisosiaalisista rikoksista (ASBO). Tämän päälle rakennettiin suosittu sovellus Asborometer, joka laski eri alueiden antisosiaalisen indeksin. Sovellus tuli niin suosituksi, että se alkoi vaikuttaa asuntojen jälleenmyyntihintoihin. Tästä seurasi, että asukkaat vähensivät rikosilmoitusten tekemistä välttääkseen oman asuntonsa arvon laskua.

Esimerkki: Mitä helpommin koulujen suoriutumisindikaattorit standardoiduissa testeissä ovat saatavilla, sitä enemmän ne vaikuttavat vanhempien päätöksiin lastensa koulupaikasta. Jos koulua ei saa valita, nämä tulokset vaikuttavat asuinpaikan valintaan. Tästä seuraa, että huonosti menestyneet koulut saavat yhä heikommassa asemassa olevia uusia oppilaita, hyvämaineiset koulut taas oppilaita, joiden opiskelua tuetaan kotoa erityisen paljon. Hyvien koulujen tulokset parantuvat entisestään, huonojen laskevat. Kyse ei usein ole opetuksen tasosta vaan oppilasaineksen epätasaisesta jakautumisesta. Kansallisten testien tulokset ovat itseään vahvistava kierre.

Tietosuojan lisäksi on panostettava myös tietojärjestelmien tietoturvaan, jotta henkilötiedot ja salassapidettävät aineistot eivät päätyisi vääriin käsiin esimerkiksi tietomurrossa. Avoimen datan tietoturvavaatimukset ovat usein tavallista kevyemmät, koska aineisto on joka tapauksessa kaikkien saatavilla, joten sitä ei tarvitse suojata luvattomilta katsojilta. Kuitenkin myös avoimeen dataan voi liittyä tietoturvariskejä kuten aineiston tahallista vääristelyä. Esimerkiksi joku voisi haluta huomaamattomasti vääristellä yllä mainittua ASBO-tietokantaa paremman asunnon myyntihinnan motivoimana. Tällaisista avoimen datan vääristelyistä ei kuitenkaan ole ennakkotapauksia eikä riski ole merkittävä.

Tähän on kerätty Suomen keskeiset lait, jotka on otettava datan julkaisussa huomioon. Muitakin alakohtaisia säännöksiä lienee.


Tiivistelmä

Julkiseksi säädetyn datan voi myös avata, mutta on hyvä ymmärtää, että avaaminen voi muuttaa toimintakulttuuria ja aiheuttaa yllättäviäkin seurauksia. Jotkin tietoaineistot ovat yksityisyydensuojan tai muun säädöksen vuoksi salassapidettäviä, joten niitä ei voida julkaista lainkaan. Salassapitovelvollisuus voi koskea jotain tietoaineistoa käytännössä, vaikka mikään säädös ei sitä suoraan kertoisi. Siksi uusien tietoaineistojen julkistamista harkitessa on hyödynnettävä alan ammattilaisten ja lakimiesten neuvoja.

Tehtävä 5. Datan avaussuunnitelman täydentäminen


Comments

comments powered by Disqus