Henkilötietobisnes – datasta MyDataan

Teksti: Oskari Lappalainen, kuva: Aune Sanz

Tutkaimen lukijakuntaan kuuluu varmasti ihmisiä, joiden mielestä henkilötiedot ovat suunnilleen maailman tylsin aihe. MyData 2016 -konferenssin 140 puhujaa ja lukuisat vieraat eivät kuitenkaan olleet tätä mieltä. Edustettuna oli niin startuppeja, suuryritysten edustajia, tutkijoita kuin aktivistejakin. MyData-konseptin alle mahtui esityksiä niin diabeetikoiden itse kehittämistä verensokerin seurantajärjestelmistä, esineiden internetin haasteista yksityisyydelle kuin myös pohdintoja siitä, muuttavatko esimerkiksi tarkemmat satelliittitiedot vakuutusyhtiöt enemmänkin ennustusyhtiöiksi. Eri taustoista tulevien, datasta innostuneiden ihmisten kokoontuminen nosti pintaan melkoisia energioita, ja lopputilaisuudessa joku kommentoikin anonyymisti internetin välityksellä: ”This feels like a cult… but cults get stuff done.”  

Ei kuitenkaan tarvitse mennä datasta innostuneiden pariin huomatakseen, että aihe on pinnalla. Aniharva valtsikalainen on niin ihmistieteellisessä kuplassa, ettei olisi huomannut asiaa. Big data on käsitteenä tullut varmasti jokaisen eteen. Ehkäpä olemme kuulleet vitsin siitä, että data scientist on tilastotieteilijä, jolla on Macin läppäri. Olemme ehkä jopa pohtineet datan merkitystä omalle tieteenalallemme, kenties jopa istuneet aihetta sivuavilla luennoilla tai lukeneet asiasta itse. Monet ovat huolissaan NSA:n verkkovakoilusta, samoin Facebookin ja Googlen harjoittamasta käyttäjätietojen keräämisestä.

Data? Mitä se oikeastaan on?

Data on tietoa, jolla ei välttämättä ole semanttista merkitystä tai informatiivista järjestystä. Data voi siis olla hyödyllistä tietoa tai sitten hyödytöntä kohinaa. Datan käsite liittyy oleellisesti tietotekniikkaan, ja esimerkiksi yksittäiset bitit tietokoneessa ovat dataa. Datalähteiden määrä on kasvanut tietokoneiden yleistymisen myötä. Nykyään autojen sensorit tuottavat dataa, pankkien tietokannat ovat täynnä dataa ja ihmiset levittävät itsestään auliisti dataa Internetiin. Datan määrä kasvaakin jatkuvasti: maailman datamäärän arvioidaan vuoteen 2020 mennessä kymmenkertaistuvan nykyisestä noin 4,4 biljoonasta gigatavusta 44 biljoonaan gigatavuun. Luvut ovat huimaavia.  

Datan määrän kasvu on johtanut sen taloudellisen merkityksen kasvuun. Dataa voidaan hyödyntää monin tavoin, ja esimerkiksi käyttäjädataa voidaan käyttää palvelujen kehittämiseen. Lisäksi erityisesti erilaiset verkkopohjaiset alustat kuten Facebook ja Google keräävät käyttäjätietoja ja myyvät niitä eteenpäin mainostajille, jotka taas käyttävät henkilötietoja kohdennettuun mainostamiseen. Tämä onkin tuottoisaa bisnestä, sillä esimerkiksi Yhdysvalloissa verkkomainonta tuotti vuonna 2014 49,5 miljardia dollaria liikevoittoa. Datasta saatava liikevoitto on 2010-luvulla vain kasvanut, ja arvioidaan, että vuoteen 2020 mennessä henkilödatalle perustuvat sovellukset tuottavat vuosittain 330 miljardin euroa liikevoittoa yrityksille.

Tervetuloa tietoyhteiskuntaan

Monelta suunnalta tuleva hype ja huoli datan ympärillä onkin siis näiden lukujen valossa varsin ymmärrettävää. Voitaisiin jopa sanoa, että olemme saapumassa tietoyhteiskuntaan. Toteamus on melkoinen tuulahdus menneisyydestä. Tietoyhteiskunta oli yksi 90-luvun lempitermeistä ja se on sittemmin kadonnut, kuten monet muutkin epämääräiseksi muuttuneet muotihokemat. Tietoyhteiskunnasta intoiltiin liian aikaisin, sillä digitalisaation historiassa on ehkä pikemminkin ollut kyse ensin tehtävien automaatiosta ja sen jälkeen kommunikaatiosta ja viihteestä kuin itse tiedosta.

Tietokoneistuminen alkaa toisen maailmansodan jälkeen rutiininomaisten laskutehtävien hiljakseen tapahtuvalla siirtämisellä tietokoneille. 1970-luvulla teollisuusrobotit astuvat kuvaan, ja mukaan tuli rutiininomaisten fyysisten tehtävien automaatio. 1980-luvulle tultaessa kooltaan pienenevät, suoritusteholtaan paranevat ja ylipäätään hyödyllisemmäksi muuttuvat tietokoneet alkavat levitä aina vain laajemmin koteihin ja toimistoihin. Tietotekniikan suorituskyvyn kasvamisen ja koon kutistumisen trendi on jatkunut nykypäivään asti – nykyään tietokone mahtuu kännykkään. Juuri tämä tietotekniikan pieneneminen on luonut valtavasti erilaisia datalähteitä. Internet on taas sekä luonut uniikin sosiaalisen ympäristön että mahdollistanut massiivisten datamäärien reaaliaikaisen luomisen, seuraamisen ja käsittelyn.

Datan määrästä on tullut haaste, joka vetää puoleensa ongelmanratkaisijoita. Tietotekniikka on tuottanut niin paljon tietoa, että sen käsitteleminen vaatii tietotekniikkaa, ja tämä sykli ajaa kehitystä eteenpäin. Lisäksi datan käsittelyssä kehitetyt esimerkiksi koneoppimiseen tai hahmontunnistukseen liittyvät innovaatiot saattavat löytää käyttöä muualla, vaikka robotiikan puolella. Houkuttelevuus ongelmanratkaisijoiden silmissä, hyvän syklit ja sovellusten leviäminen ovat tieteen ja teknologian tutkimuksen perusteella piirteitä, joita on löydettävissä useista menestyneistä teknologioista. Menestyneet teknologiat kasaavat eräänlaista teknologista liikevoimaa, ja alkavat muokkaamaan maailmaa. Esimerkiksi  sähköverkoista kirjoittaessa Thomas P. Hughes kiinnitti huomiota siihen, kuinka sähköteknologian läpilyönti näkyi lopulta opetuksessa asti. Olemmeko nyt data sciencen aikakaudella samassa pisteessä?

Datalla on siis merkitystä ja arvoa, jopa ihan rahaksi muutettavaa sellaista. Henkilötiedot näyttävät olevan yksi merkittävimmistä, tai ainakin keskustelluimmista, taloudelliseen käyttöön valjastetun datan osa-alueista. Henkilötietojen käyttäminen taloudelliseen tarkoitukseen ei kuitenkaan ole ongelmatonta, vaan siihen sisältyy eettisyyteen, läpinäkyvyyteen ja tuotonjakoon liittyviä ongelmia. Koska varsin monet tietolähteet ovat itse asiassa tulkittaviksi henkilötiedoksi, ongelma on paljon laajempi kuin äkkiseltään ajattelisi. Omat potilastiedot mieltää kyllä henkilötiedoksi, mutta entäpä sähkönkulutus, verkkohistoria tai sijainti? Nykyinen malli, jossa ihmisten omia tietoja käytetään heidän selkänsä takana, onkin monista ongelmallinen.

Henkilötiedoista MyDataan

MyData astuu kuvioon mukaan tässä vaiheessa. MyDatan voisi tiivistää olevan joukko ihmiskeskeisiä henkilötiedon hallinnan ja käytön periaatteita. MyData-mallissa ihmisille tarjotaan käytännöllinen mahdollisuus hallintaa, hyödyntää ja luvittaa eteenpäin heistä kerättyä henkilötietoa. MyData on eräänlainen henkilötietojen osajoukko. Kaikki henkilötiedot eivät ole MyDataa, mutta MyDataa on sellainen henkilötieto jota yksilö voi itse hallita. Erilaisia MyDatan potentiaalisia lähteitä alkaa olemaan suuri joukko. Esimerkiksi oppiminen, liikkuminen, energia, hallinto, itse kerätyt tiedot, terveys, pankki- ja vakuustiedot, ostostiedot, viestintä ja media, verkkopalvelut, ja esineiden internet ovat osa-alueita missä MyDataa esiintyy.

MyData on tällä hetkellä enemmänkin idea tai joukko periaatteita kuin käytännön sovellus. Open Knowledge Finlandin varapuheenjohtaja Mika Honkanen odottaa kuitenkin pilotteja viimeistään vuoteen 2017 mennessä. Honkasen mukaan MyData on tärkeää, sillä henkilötietojen määrä kasvaa huimaa vauhtia, samoin erilaisten ihmisiin kytkeytyvien sensorien tuottama data. Honkasen mukaan kansainvälisillä mainosverkoilla on jo nykyään varsin kattava pääsy ihmisten kännyköiden tuottamaan tietoon, usein myös paikkatietoon. Erilaiset sovellukset hyödyntävät kännykät tuottamaa tietoa ja myyvät sitä eteenpäin, ja vastineeksi tarjotaan palveluita.

Vaikka henkilötietojen luovuttaminen eteenpäin on mahdollistanut mitä erilaisimmat verkkopalvelut joista ei tarvitse suoraan maksaa, niin nykyinen järjestelmä ei ole kovinkaan läpinäkyvä. Nykyisiä käytäntöjä säätelevät sopimukset ovat raskaita. Harvat edes jaksavat lukea läpi eri ohjelmien käyttöoikeussopimuksia, vaikka kaikki eivät välttämättä haluaisikaan luovuttaa itsestään niin paljon tietoa kuin mitä he luovuttavat tällä hetkellä. Honkasen mukaan MyData palauttaa ihmisen takaisin keskiöön, ja antaa datan hallinnan takaisin yksilölle.

Pilotteja, kansalaisaktivismia ja sisämarkkinoita

Vaikka MyData ei vielä olekaan mitään kovin konkreettista, niin aihepiiri on herättänyt huomiota sekä Suomessa että muualla. Lisäksi käsite on varsin tuore: se syntyi Suomessa vuonna 2012 järjestettyjen Open Knowledge-festivaalien yhteydessä. MyDatan juuret ovat siis avoimen tiedon ihanteessa, ja Open Knowledge Finland onkin järjestö, joka on ajanut MyDataa huomattavasti eteenpäin. Järjestön alaisuudessa toimiva työryhmä teki liikenne- ja viestintäministeriöille vuonna 2014 MyDataa koskevan selvityksen. Aihe herätti innostusta, ja henkilötiedot nousivat hallituksen kärkihankkeeksi. Seuraavana vuonna tuli englanninkielinen tiivistelmä, joka herätti huomiota maailmalla. MyDatan kehityskulku on nyt tänä vuonna huipentunut Helsingissä ensimmäistä kertaa järjestettyyn MyData-konferenssiin.

Honkanen kertoo olevansa ylpeä siitä, että MyData on noussut suomalaisesta kansalaistoiminnasta. Kolmessa ja puolessa vuodessa on saatu paljon aikaiseksi. Tulevaisuudesta kysyttäessä Honkanen ei halua spekuloida liian pitkälle. MyDatan kehitystä Euroopassa kehitystä tulee hänen mukaansa kuitenkin vauhdittamaan lähitulevaisuudessa kaksi seikkaa. Ensimmäinen on Viron EU-puheenjohtajakausi. Virolaiset ovat osoittaneet suurta kiinnostusta datan siirrettävyyttä ja eteenpäin myyntiä kohtaan. Viron tietohallinnon johtaja Taavi Kotka on ehdottanut datan siirrettävyyttä Euroopan Unionin viidenneksi vapaudeksi. Toinen MyDataa, tai ainakin henikilötietobisnestä, kiihdyttävä tekijä on EU:n uusiutuva tietosuojalainsäädäntö, jonka tarkoitus on yhdenmukaistaa jäsenmaiden käytäntöjä. Tavoitteena siintää yli 500 miljoonan ihmisen digitaaliset sisämarkkinat.

Data – öljyä vai oikeuksia?

Onko datan nousussa siis lopulta kyse rahasta? Entäpä ne oikeudet, avoimuus, huoli yksityisyydestä?

Valérie Peugeot, Orange Labsin tutkija ja yksi MyData-konferenssin  päätöspuhujista, kritisoi talousvetoisia tapoja nähdä data. Data nähdään taloudellisena resurssina, ja sitä on jopa kutsuttu ”21. vuosisadan öljyksi”. Peugeot toivoi, että henkilötiedot nähtäisiin enemmän ihmisoikeuskysymyksenä, ja vähemmän pelkkänä taloudellisena kysymyksenä.

Öljymetafora on kuitenkin nerokas – öljyähän voi käyttää sekä polttoaineena että voiteluaineena. Yhtä lailla dataa käyttävät sekä siitä voimansa ammentavat uudet yritykset, että sillä luutuneita toimintatapojaan voitelevat teollisuusjätit. Data on öljyä: yhä kasvavissa määrin tärkeä resurssi, jonka hyötyjen jakautumisesta tulisi keskustella. Tällä hetkellä olemme tilanteessa, jossa kakkua jaetaan selkämme takana eikä meillä ole edes käsitystä sen koosta – tai koostumuksesta.

Dataan liittyvät taloudelliset ja oikeudelliset intressit eivät välttämättä ole keskenään ristiriidassa, eivät ainakaan yksilön kiinnostuksen tasolla. Todennäköisesti tietoisuus omien henkilötietojen taloudellisesta arvosta lisää kiinnostusta myös henkilötietoihin liittyviä oikeuksiaan kohtaan. Avoimuuden ja läpinäkyvyyden aatteet eivät kuitenkaan pysy elossa itsessään, vaan vaativat työtä ja sitoutumista. Olisikin siis toivottavaa, että henkilötiedot vetävät puoleensa oikeuksistaan kiinnostuneita ihmisiä myös tulevaisuudessa.