Kuinka helppoa voi datan mallinnus olla? - Katsaus Qlik Sense Visual Data Preparation työkaluun

/ Ville Airo

qlik visual data

Palataanpa jälleen perusasioihin eli tekniikkaan. Qlik rintamalla on kesän jälkeen tapahtunut paljon ja erityisesti yksi ominaisuus alkaa viimeinkin täyttää toiveita ja lunastaa sille asetettuja lupauksia. Kyseessä on Qlik Sensen Visual Data Preparation Tool tai Data Manager -ominaisuus. 

Mistä siis on kyse? Qlik Sensessä on jo pitkään ollut Data Manager ominaisuus, jolla voi "pallojen" avulla tehdä visuaalisesti datan mallinnusta. Oleellinen ajatus tässä on se, että työkalu on helppokäyttöinen kaikille. Se onkin suunnattu erityisesti business-käyttäjille eikä periaatteessa ole tarkoitettu kehittäjien työkaluksi. 

yhdistä datat

Qlik Sensen viimeisimmät julkaisut (June ja September 2017) ovat viimeinkin lunastaneet puheet ja mainokset työkalusta. Uusina ominaisuuksina voi dataa nyt muokata lennossa, tietoja voi yhdistää yhteen faktatauluun (concatenate) ja datan analysointi (jota aina tarvitsee tehdä tietomallia tehdessä) on helppoa. 

Lisäksi alusta asti mukana olleita hyviä ideoita on entisestään parannettu: 

  • visuaalinen käyttöliittymä
  • tietojen yhdistäminen datasta mukaan tunnistettavilla avaimilla (ei pelkästään identtisillä kentän nimillä)
  • automaattinen tietomallin luonti, jossa apuna automaattiset avainkentät

Uudet ominaisuudet ja vanhojen parantaminen ovat tehneet työkalusta erittäin toimivan. 

Esimerkkinä pari erittäin toimivaa yksittäistä ominaisuutta

Ohjelmaan on ladattu asiakassegmenttejä ja huomataan, että muutama niistä on kirjoitettu kokonaisuudesta poikkeavalla tavalla. Työkalussa voidaan helposti muuttaa kirjoitusasu yhteneväksi (replace) ja näin datan laatu ja käytettävyys paranevat välittömästi.
 

datan muokkaus

 

Halutaan luokitella myyntejä asiakkaan kuitilla olevien ostosten mukaan (binning). Sovellus kysyy, kuinka moneen luokkaan tiedot jaetaan. Tämä voidaan valita vapaasti ja sen jälkeen voidaan vielä vapaasti säätää raja-arvot luokille. Tämä luo uuden kentän, jota voidaan vapaasti käyttää tietojen analysointiin. 
 

bucket

 

Erittäin tärkeitä uusia ominaisuuksia ovat lisäksi:

  • tunnistaa taulut, jotka on luotu skriptissä (synteettiset taulut), ei pelkästään taulut, jotka ladataan Exceleistä, tietokannoista tai muista lähteistä
  • uuden kentän tekeminen uudesta kentästä … (esim. tuotto = myynti - kulut ja edelleen uusi tuotto-kenttä voidaan jakaa koreihin pieni, keskikokoinen, suuri…)
  • tiettyjen tietojen tunnistaminen automaattisesti, kuten maat, jotta kartat toimivat sekä päivämäärät, jotta saadaan kalenteri luotua automaattisesti 

 

Datan muokkaamisen ominaisuudet:

  • datan korvaaminen (replace)
  • datan jakaminen koreihin (binning)
  • datan jakaminen merkkimäärällä tai erottimella (split)
  • null-arvojen asettaminen (set nulls)
  • arvojen järjestyksen asettaminen (set order)
  • tietojen yhdistäminen (concatenate)
  • tietojen filteröinti (esim. poistetaan vanhimpien vuosien data)
  • ja tietenkin kenttien ja taulujen vapaa nimeäminen

 

Hieman yllättäen data manageria vastaavaa ominaisuutta ei löydy lähellekään muista työkaluista. Työkalun vaihtoehdot tuoda dataa (huom. myös synteettiset taulut), vapaa datan muokattavuus ja kaikki vielä selkeässä visuaalisessa mallissa ovat nyt aivan ylivertaisia. Eikä siinä vielä kaikki: tärkeimmissä kilpailevissa tuotteissa ei tällä hetkellä ole edes mahdollista tuoda uutta dataa olemassa olevaan tietomalliin suoraan selaimesta! Data manager toimii vain selaimessa. 

Haastan nyt kaikki testaamaan tätä ominaisuutta. Haastakaa myös toimittajat esittelemään sitä teille.