• 14. lokakuuta, 2019

Hyödynnä rakenteetonta dataa liiketoiminnassa luonnollisen kielen analytiikan avulla

Yritysten keräämästä datasta jopa 80 prosenttia on rakenteetonta, kuten tekstiä tai ääntä. Rakenteettoman datan käsittely on perinteisillä analysointityökaluilla mahdotonta ja mahdottomuus vain korostuu, kun kysymykseen tulee isojen datamassojen manuaalinen läpikäynti. Tämän seinän tullessa vastaan organisaatioissa jää hyödyntämättä valtava määrä liiketoiminnan kehittämisen kannalta mielenkiintoista tietoa.

Rakenteeton datakin voidaan hyödyntää, kun tarjolla on luonnollisen kielen analytiikka, yksi keinoälyn muodoista.

Kun luonnollista kieltä ymmärtävä keinoäly käy läpi isot tekstiaineistot, pystytään näkemään aiemmin pimentoon jääneitä asioita. Keinoälyn avulla raportointiin saadaan talouslukujen ja muiden mittarien rinnalle kokonaan uusi datalähde. 

Miten laadullista dataa voidaan sitten hyödyntää? 

Suuret yritykset saavat vuosittain jopa satoja tuhansia asiakaspalautteita, jotka koostuvat tyypillisesti rakenteettomasta tekstistä. Keinoälyn avulla voidaan selvittää kuinka iso osa annetuista palautteista on positiivisia ja negatiivisia. Pystytään myös näkemään mitkä ovat yleisimmät syyt palautteeseen.

Luonnollisen kielen analytiikalla voidaan pureutua viestien sävyyn ja semanttisiin merkityksiin sekä luokitella niitä. Näin saadaan selville negatiivisen palautteen yleisimmät syyt: onko tietyn tuotteen tai palvelun kanssa enemmän ongelmia tai epäonnistutaanko jossain kanavassa useammin kuin toisissa.

Asiakaspalautteiden lisäksi esimerkiksi vikailmoitukset sisältävät paljon rakenteetonta dataa. Vikailmoituksia kategorisoimalla voidaan nähdä nopeasti, mikäli niiden tekstikentässä toistuvat tietyt syyt, kuten akun kestävyys tai hajonnut näyttö.

Apua lääkäreiden työhön luonnollisen kielen analytiikasta

Lääkäripula on jatkuvan uutisoinnin kohteena. Pula lääkäreistä on johtanut erityisesti terveyskeskuslääkärien työtaakan kasvuun. Lääkärillä saattaa olla ennen vastaanottoa läpikäytävänä potilaan tiedot vuosien ajalta. Kertyneen tietomäärän läpikäynti on aikaa vievää, etenkin jos vaiva on vaatinut jatkuvaa hoitoa ja potilastietojärjestelmään on kertynyt lukuisia merkintöjä vuosien varrella.

Luonnollisen kielen analytiikalla on potentiaalia auttaa hoitohenkilökuntaa selviytymään kiireisestä työarjesta. 

Keinoäly voidaan valjastaa läpikäymään potilastietoja ja etsimään niistä toistuvuutta. Kyseessä on nimenomaan lääkärin työtä tukeva teknologia, eikä lääkäriä ole tarkoitus korvata keinoälyllä.

Luonnollisen kielen analytiikka osoittaa lääkärille, mitkä riskitekijät potilastiedoissa toistuvat ja lääkäri pääsee nopeammin kiinnittämään huomionsa juuri niihin.

Tekoäly ei korvaa lääkärin tekemää työtä, eikä vähennä esimerkiksi laboratoriokokeiden arvoa. Sen avulla potilastietojen laadullinen data voidaan yhdistää numeeriseen dataan ja molemmista päästään hakemaan riskitekijät samanaikaisesti.

Tietosuojasta kiinni pitäminen helpompaa kaupallisen teknologian avulla

Potilastiedot sisältävät paljon sensitiivistä tietoa. Myös asiakaspalautukset voivat sisältää salassa pidettäviä tietoja, kuten henkilötunnuksia tai luottokorttitietoja. Tietosuojan toteutumiseen onkin tärkeä ottaa huomioon, kun analysoidaan rakenteetonta dataa. On yleistä, että vain tietyt henkilöt pääsevät näkemään koko analysoitavan aineiston. 

Aineistosta voidaan esimerkiksi piilottaa sensitiiviset tiedot ennen analysointia, jotta tietosuoja toteutuu. Valamiksella luonnollisen kielen analytiikkaa tehdään erityisesti IBM Watsonilla. 

IBM Watsonin etu open source -teknologioihin verrattuna on sisäänrakennetut governance-työkalut, joiden avulla on helppo määritellä se, kuka tiimissä näkee koko aineiston. Katseseluoikeuksia saadaan myös muutettua helposti. Open sourcella vastaava käyttäjänhallinta pitää rakentaa custom-ratkaisuna ja sen päivityksestä pitää huolehtia tarkkaan.

IBM:n lisäksi Valamiksella hyödynnetään myös R:n, Pythonin ja Elasticsearchin kaltaisia open source -teknologioita. Asiakkaille tuotetut kokonaisratkaisut yhdistävät usein avoimen lähdekoodin teknologioiden ja kaupallisen työkalun parhaat puolet.

Kannattaa aloittaa pilotoimalla

Keinoälyteknologia saattaa kuulostaa kalliilta investoinnilta. Luonnollisen kielen analytiikasta kiinnostuneen organisaation ei kuitenkaan tarvitse heti kättelyssä ostaa vuoden kehitysprojektia. Hyvin suunnitellun pilotin kautta pääsee alkuun. 

Aloittaa voidaan esimerkiksi ottamalla käsittelyyn vuoden asiakaspalautteet sisältävä aineisto. Mietitään liiketoiminnallinen relevantti kysymys tai pari, johon aineiston halutaan vastaavan. Tämän jälkeen data analysoidaan joko asiakkaan omassa ympäristössä tai meidän servereillä. Samalla voidaan tehdä muutama iteraatiokierros. Pilotin tavoitteena on selvittää tekstiaineiston selityskyky, eli vastaako se liiketoiminnalliseen kysymykseen.

Pilotointi on käytännönläheinen tapa ottaa ensiaskeleet uusien teknologioiden parissa. Esimerkin kaltaiseen pilotointiin kuluu kokonaisuudessa joitakin viikkoja. Näiden viikkojen aikana organisaatiossa muodostuu hyvä kuva keinoälykehityksestä.

Artikkeli julkaistu alunperin Itewikissä. Kirjoittaja: Suvi Lindström, Asiantuntijat: Markus Hellas, Sales Manager ja Jonas Olme, Analytics Consultant.

Lue lisää Valamis Intelligencestä täältä.

Contact us

Markus Hellas
Sales Manager
+358 40 412 5183