Tunnelmia Helsingin Data Science Meetupista – Koneälyä, ennakoivaa analytiikkaa ja tiedon yksityisyyttä

/ Mika Pitkänen

heösinki data science meetup

Kirjoitus perustuu kirjoittajalle syntyneisiin ajatuksiin eCraftin isännöimän Data Science Meetup-tilaisuudesta, joka järjestettiin 11.5.2017. Tilaisuudessa esiintyivät Tommi Vilkamo eCraftilta ja Henri Kujala HERE:ltä. 

Odotukset korkealla, yleisöryntäystä odotellen ja ovella vieraita vastaanottaen, siinä kiteytettynä tuntemuksiani juuri ennen tilaisuuden alkua.

Data Science – tilaisuuksiin sisältyy paljon hypeä. Tänään oli lupa odottaa konkreettisia esimerkkejä elävästä elämästä ja lainsäädännön muutosten rintamalta. Ensimmäisenä esiintymisvuorossa oli Tommi Vilkamo (Chief Data Scientist, eCraft) jonka aiheena oli The Machine Goes Mainstream: how Finnish companies have started to use machine learning and advanced analytics to solve practical business problems eli kuinka suomalaiset yritykset ovat alkaneet hyödyntää edistynyttä analytiikkaa liiketoiminnan haasteissa.

Toisena illan aiheena oli uusi tietosuojalainsäädäntö (GDPR eli general data protection regulation). Henri Kujala (Chief Privacy Officer, HERE) kertoi kuinka he ovat valmistautuneet lainsäädäntöön ja muutoinkin yleisesti tietosuojalainsäädännöstä.

Konkreettisia esimerkkejä ja innostusta

Tommin esimerkit eCraftin asiakascaseista herättivät yleisössä enimmäkseen teknisiä kysymyksiä. Itselleni ne olivat konkreettisia esimerkkejä asiakkaiden hyvin yksinkertaisista esimerkeistä jokapäiväisestä edistyneen analytiikan käytöstä. Tommin esityksestä huokui hänen innostuksensa aiheeseen ja asiakascaseihin. Hyvä niin, aihe on mielenkiintoinen ja siinä tarvitaankin tutkimusmatkailijan seikkailumieltä.

Tommi kävi läpi myös analytiikan toimeksiantojen haasteita. Suurin haaste ylipäätään on bisnescasen laadinta, seuraavaksi datan laatu ja oikeellisuus. Lopuksi vielä koneen ja ihmisen yhteistyön kannalta ohjelmiston antamat ”vastaukset” tulee tulkita oikein. Mitä tulos tarkoittaa? Ja ennen kaikkea, mistä tulos on johdettu? Miten kone ja ihminen voivat toimia parhaalla mahdollisella tavalla, jos kone ei osaa kertoa miksi tuli tiettyyn tulemaan. Eli ihmisen tulee opettaa konetta antamaan parempia – ymmärrettävämpiä - tuloksia.

food at dylan lepuski
tommi vilkamo

Tiedon lukuisat kerrokset

Henri Kujalan esitys Privacy in context of data-driven business models + GDPR käsitteli työnantajansa HERE:n liiketoimintaa uuden tietosuoja-asetuksen valossa ja avasi yleisestikin HERE:n liiketoimintamallia. Esitys oli erittäin mielenkiintoinen. Minua henkilökohtaisesti kiinnosti kuinka ”yksittäisen objektin” eli tietoa tuottavan kohteen tuottamaa tietoa yhdistellään ja käsitellään ja sen perusteella luodaan uusia tiedon kerroksia, joissa alkuperäinen tieto ei millään tavalla ole tunnistettavissa.

Myös tiedon aikaulottuvuus toi muistutuksen siitä, miten tärkeää ”tieto ja aika” – yhteys on. HERE-esimerkissä esiintyy reaaliaikaista tietoa, sesonkitietoa, infra-tietoa eli montaa erilaista aikaulottuvuutta. Tiedon aikaulottuvuus on tiedon hyödyntämisen näkökulma. Eri ajalliset näkökulmat tuotetaan aivan samasta tiedosta. Jalostamalla tiedosta saadaan eri näkökulmia vieläpä niin, ettei alkuperäinen tieto ole tunnistettavissa.

Mikä on sallittua ja mikä kiellettyä?

Tapahtuman yleisö oli erittäin kiinnostunut kuluttajatiedon hyödyntämisestä ja anonymisoinnista sekä erityisesti rajanvedosta sallitun ja kielletyn välillä. Henri kertoi heidän käyttämästään prosessista tiedon anonymisoinnissa ja kuinka anonymisoinnin testausta täytyy tehdä jokaisen tiedon yhdistelyn jälkeen. Joka kerta kun tietoa yhdistellään, on mahdollista, että yhdistelyssä on syntynyt sellaista tietoa, joka on yhdistettävissä henkilöihin eli syntyy kielletty tiedon yksilöivä tilanne.

Tilaisuudessa haettiin valaistusta rajanvetoon sallitun ja kielletyn välillä ja minulle tuli olo, että analyytikot hakivat oikeutusta yksilöivän kuluttajatiedon käyttöön. Sehän on niin paljon mielenkiintoisempaa.  Henri kuitenkin kiteytti asian hyvin todeten ”Tietotyön ammattilaiset kyllä tietävät milloin tieto on yhdistettävissä henkilöön ja milloin se on aidosti anonymisoitu”. Minä olen tässä täysin samaa mieltä. Mielenkiintoisempi asia itselleni on työntekijätiedon hyödyntämisen rajoitukset ja muut velvoitteet. Se aihealue jäi minulle vielä epäselväksi, mutta odottelen mielenkiinnolla siitä lisää tietoa, kunhan viranomaisetkin täsmentävät ohjeistustaan ja asian ympärillä järjestetään uusia asiaa valaisevia tilaisuuksia.

Mitä EU:n tietosuoja-asetus tuo tullessaan?

EU:n tietosuoja-asetus tuo lähtökohtaisesti mieleen ”paljon melua tyhjästä ” fraasin. Muistan hyvin, kun tarkastelimme kilpailukieltolainsäädännön näkökulmasta aikanaan silloisen työnantajayritykseni sekä yhteistyökumppaneiden suhteita. Tästä minulle jäi loppukädessä olo, että mitäköhän järkeä tässä nyt oli.

Tämä uusi tietosuoja-asetus tuottaa samanlaisia tuntemuksia. Ok, myönnän, että kyllä kilpailulakitarkastelun hyöty oli tietoisuuden parantuminen suhteessa lainsäädäntöön. Tässä tietosuoja-asiassa tilanne on luultavasti sama. Eli ei paniikkia. Järkevää toimintaa ei ole tarkoitus estää, kunhan olet tietoinen siitä, mitä teet, suunnittelet asioita etukäteen ja mikä tärkeintä, kunnioitat henkilöiden yksityisyyttä ja varjelet tietoa huolella.  Lainsäädännön vaikutuksista tuore esimerkki on Facebookin 110 miljoonan euron sakot virheellisen ja harhaanjohtavan tiedon antamisesta komission tutkimuksissa. 
 

Haluatko lukea lisää aiheesta? Lataa tästä opas Ennakoiva analytiikka liiketoiminnassa. Oppaassa avaamme tarkemmin aihetta sekä esittelemme 5 askelta ennakoivan analytiikan hyödyntämiseen ja käyttöönottoon.