Tekoälyanalyysi pystyy heijastamaan isoista datamassoista esiin osaamisdatan eri näkymiä

Tekoälyanalyysi pystyy heijastamaan isoista datamassoista esiin osaamisdatan eri näkymiä

Älykäs tekoälyanalytiikka linkittää avoimet dataläheet osaamis- ja koulutussuunnittelun tueksi, kirjoittaa Headain viestintäpäällikkö Eero Hammais. Headai on datalähtöiseen ennakointiin ja johtamiseen ja erityisesti osaamisdataan keskittyvä yritys.

Älykäs ennakointi -hanke on loppusuoralla. Tuloksia, ajatuksia ja kertyneitä oivalluksia on käyty läpi hankkeen työpajoissa sekä monissa pienemmissä ryhmissä. Koulutukseen, työmarkkinaan ja ennakointiin liittyvän datan louhiminen ja analysointi Varsinais-Suomen oppilaitosten hyödyksi on ollut mielenkiintoinen matka projektikonsortion lisäksi myös Headaille, joka on toiminut hankkeessa tekoälyteknologian toimittajana vuosina 2021–2022.

Headain näkökulmasta on ollut arvokasta vahvistaa asiakasymmärrystä sekä toisen että kolmannen asteen koulutuksen tarpeisiin, jotka liittyvät osaamis- ja koulutussuunnitteluun sekä TKI- ja oppilaitos-yritysyhteistyön vahvistamiseen.

Headain mukaan tekoälyanalytiikan toimittaminen Älykäs ennakointi -hankkeelle on tarjonnut oivan ikkunan kurkistaa tämän hetken koulutuksen kehittämisen tarpeisiin. Kommunikaatio asiakkaan kanssa on ollut alusta asti mutkatonta ja luontevaa. Tietolähteiden ja lopullisten visualisointien riittävän tarkka määrittely jo aikaisessa vaiheessa toimi kulmakivenä tukemassa toteutuksen valmistumista ajallaan. Tämä toteutus on myös inspiroinut Headain tuotekehitystä.

Datan hyödyntäminen osaamisen ennakoinnissa on Headain Eero Hammaisin ja markkinointijohtaja Anu Passi-Rausteen aiheena myös Älykäs ennakointi -hankkeen päätösseminaarissa 18.11. 2022. Katso ohjelma.

Mitä on kognitiivinen tekoäly?

Headai on lukenut jo vuosia avoimia tekstimuotoisia lähteitä koskien mm. työmarkkinan, koulutuksen ja kestävän kehityksen teemoja. Näistä muodostetaan koneellisesti analyysejä, joissa eri tietolähteistä luetuista tekstikokonaisuuksista löydetään merkityksellisiä käsitteitä ja käsitteiden väliset suhteet saadaan laskettua.

Taustalla on Headain kehittämä dynaaminen ontologia, tietämysrakenne (Kuva 1), joka kuvaa sanojen välisiä suhteita toisiinsa. Jos datalouhinnan jälkeen toteutettua tekoälyanalyysiä halutaan kuvailla yksinkertaistetulla vertauskuvalla, voidaan puhua koneen luomista hyvin laajoista käsitekartoista, joiden avulla tekstien sisältämiä merkityksiä tunnistetaan ja niitä voidaan vertailla.

Kuva 1. Yksinkertaistettu visualisointi Headain ontologiasta, koneellisesti lasketuista sanojen välisistä suhteista.

Headain teknologiaa kutsutaan kognitiiviseksi tekoälyksi, joka oppii samalla tavalla kuin ihminen. Nimensä mukaisesti siinä on samoja elementtejä, joita löytyy kasvatustieteissä paljon puhutusta kongitiivisesta oppimiskäsityksestä.

Headain algoritmit asettuvat yleisesti määritellyissä tekoälyn alakategorioissa koneoppimisen ja luonnollisen kielen prosessoinnin alueelle (Kuva 2). Teknologia perustuu itseorganisoituviin karttoihin (Self-organizing maps), mikä on ohjaamattomaan oppimiseen perustuva neuroverkkomalli. Sen kehitti 80-luvulla akateemikko Teuvo Kohonen ja se on yksi Suomen tieteen kansainvälisesti siteeratuimmista yksittäisistä tuloksista.

Headai on jalostanut tätä teknologiaa eteenpäin ja kehittänyt algoritmeja, jotka sopivat erityisesti ratkaisemaan tekstimuotoisen datan analysoinnin haasteita silloin, kun data on sirpaleista, ei-määrämuotoista, puutteellista, ja kun sitä on todella suuria määriä. Tieteellisestä näkökulmasta ollaankin vahvasti laadullisen analyysin kentällä, eli selvitetään ilmiöiden merkityksiä ja luodaan niistä kokonaisvaltaisia käsityksiä.

Datalähteet heijastavat eri tulokulmia

Älykäs Ennakointi -hankkeessa analysoitiin

  • Ammattikorkeakoulujen Theseus-opinnäytetyötietokanta; noin 120 000 opinnäytetyön otsikot abstraktit ja kuvailutiedot.
  • Teknologia-alan koulutusten ammatilliset e-perusteet (56 kpl), jotka sisältävät perus-, ammatti- ja erikoisammattitutkintoja.
  • 300 valitun meriklusterin ja valmistavan teknologiateollisuuden yrityksen työpaikkailmoituksen sisältö Varsinais-Suomesta 2019–2022.
  • Turun yliopiston tulevaisuuden tutkimuskeskuksen futurologien tuottama trendi- ja ilmiökortiston sanasto

Eri datalähteet tarjoavat erilaisia näkymiä samoihin aiheisiin. AMK-opinnäytetyöt tuovat uusia, nousevia aihealueita, opiskelijoiden ja toimeksiantajayritysten näkokulmista. E-Perusteet kuvaavat tämän hetken toisen asteen koulutuksen opetuksen kehikkoa. Meriklusterin ja teknologia-alan työpaikkailmoitukset tarjoavat ajankohtaisen tiedon lisäksi nousevia ja laskevia teemoja vuosilta 2019–2022. Näitä tässä projektissa valittuja datalähteitä avataan tarkemmin artikkelissa: Osaamissuunnittelua tekoälyn kanssa.


Kuva 2. Kaavio esittää yhden tavan tekoälyn genrejen luokittelulle. Kuva: Eero Hammais / Headai

Onnistuneen tekoälytoteutuksen läpiviennin ABC

Ensimmäiseksi voi aina tarkastella, onko valmista toteutusta ostettavissa, vai täytyykö se rakentaa itse. Nykyään ns. älykästä dataa on myynnissä mm. erilaisina raportteina ja tällaiset ovat ostettavissa heti käyttöön. Headai on kulkemassa tähän suuntaan. Jos tarvittavaa datatuotetta ei vielä ole, sellainen suunnitellaan ja rakennetaan.

IT-alan lainalaisuudet pätevät myös tekoälytoteutusten kohdalla. Jotta sekä asiakas että toimittaja olisivat tyytyväisiä vielä toteutuksen jälkeenkin, alussa on tehtävä tarkat määrittelyt. Määritellään asiakasongelma, hyödynnettävät datajoukot, aikataulu sekä resurssit. Määritellään myös lopputuloksen käyttöliittymä ja käyttökokemus riittävällä tasolla, jotta asiakkaalla on näkymä toteutuksen putken loppuun asti.

Muistilista toteutuksen suunnittelulle

  • Asiakasongelman määrittely – kysymykset, joihin halutaan vastauksia
  • Datojen määrittely ja arviointi – mitkä datajoukot voivat sisältää vastauksen ja ovatko ne riittävän laadukkaita
  • Datojen lukeminen – onko valmiita rajapintoja vai parsitaanko tieto verkosta. Tämä vaikuttaa resurssien tarpeeseen.
  • Suunnitellaan ja toteutetaan datojen analyysi hyödyntäen tekoälyalgoritmeja
  • Rakenteistetaan analysoitu data jatkohyödyntämistä varten – JSON (JavaScript Object Notation) on yleisesti hyödynnetty, hierarkkinen muoto.
  • Tehdään tarvittavat operaatiot, kuten vertailut (risiinajot) datojen välillä
  • Viedään valmiit datat valittuun visualisointityökaluun ja rakennetaan havainnolliset visualisoinnit, jotka vastaavat alkuperäiseen asiakasongelmaan. Tällä hetkellä monet visualisoinnit toteutetaan PowerBI-raportteina.
  • Arvioidaan lopputulosta asiakkaan kanssa
Kuva 3. AMK-opinnäytetöissä esiintyvät merenkulun ja konetekniikan yhteiset käsitteet linkittyvät keskelle.

 

Kuva 4. Headain heksa-kartat näyttävät datasta löytyneet yleisimmät käsitteet keskellä ja vähemmän esiintyneet reunoilla. Hiirellä likkuttaessa voi erottaa eri osaamisnippuja.

Laajaan ymmärrykseen tarvitaan useita datalähteitä

Data ja tekoäly kulkevat aina käsi kädessä. Data voi olla laadultaan heikkoa ja puutteellista ja näin se määrittää myös algoritmin tuottaman tuloksen laatua. Jokaisessa datassa voi myös olla vääristymää, mikä heijastuu tuloksiin.

Julkiset työpaikkailmoitukset ovat esimerkki osittain puutteellisesta datasta. Data kuvaa osittain Suomen työmarkkinoiden kysyntää, mutta siitä puuttuvat mm. yksityisten rekrytointifirmojen data, headhunterien rekrytoinnit ja yritysten sisäiset rekrytoinnit sekä työntekijöiden kierto. Lisäksi työpaikkailmoitukset tehdään usein valmiisiin pohjiin, jossa mm. yrityksen yleiskuvaus on sama. Tällainen osio saattaa korostua datan tuloksissa.

Eri lähteissä on arvioitu, että julkiset työpaikkailmoitukset kuvaisivat n. 30–35 % osaamisen kysynnästä. Tämä luku on arvio, mutta suuntaa antava. Tilastollisesti otanta on kuitenkin varsin kattava. Analyysin tuloksia tarkastellessa on pohdittava, minkälaisia osaamisten alueita otoksesta puuttuu ja mistä muusta datasta niitä voisi löytää. Esimerkiksi headhunterien korkean profiilin rekrytointeihin liittyy usein johtamiseen, esimiestyöhön ja strategiatyöhön liittyviä osa-alueita.

Ottamalla huomioon avoimen datan ominaisuudet ja paikkaamalla sen puutoksia muista saatavilla olevista tietolähteistä löytyvällä tiedolla päästään lähemmäksi todenmukaista kokonaiskuvaa. Opetusmaailmassa käytetty termi tutkiva oppiminen sisältää monia samoja elementtejä. Ei tyydytä ensimmäiseen vastaukseen, vaan taustoitetaan asioita ja ilmiöitä laajemmin.

Luonnollisen kielen prosessointi on monimutkaista, ei-määrämuotoisen tekstin analysointia. Täydellistä lopputulosta ei ole olemassa, eikä mikään algoritmi suoriudu työstä täydellisesti. Datavetoisen päätöksenteon tueksi onkin hyvä hakea näkökulmia usean datan avulla. Tällainen eri tekstidatojen vertailun mahdollistaminen kaikkine teknisine vaiheineen oli kokonaisuus, jonka Headai toteutti Älykäs Ennakointi -hankkeen käyttöön visualisoituina PowerBI-raportteina.

Oppia molemmin puolin

Tekoälyavusteisen datalouhinnan hyödyntäminen on Älykäs ennakointi -hankkeen projektiryhmän mukaan tuonut paljon osaamista tiedolla johtamisesta ja datan arvioinnista. Samalla on päästy konkreettisesti näkemään kognitiivisen tekstianalytiikan mahdollisuudet ja myös se, mihin se ei sovellu.

Tekoäly sanana on sumea, mutta tällaisen toteutuksen aikana sekin määrittyy selkeämmäksi. Tekoälyn toimittajan on puolestaan jatkuvasti kuunneltava asiakaskenttää ja sieltä heijastuvia ajatuksia ja tarpeita tuotekehitykselle. Jokainen asiakkuus voi tuoda on yritykselle oppia, jos asenne on kunnossa.

 

Eero Hanmmais

Kirjoittaja: Eero Hammais Viestintäpäällikkö, Headai Oy
Eerolla on yli 15 vuoden kokemus monialustaisesta viestinnästä ja tekoälyä hyödyntävien asiakasprojektien johtamisesta. Hän on toiminut myös opetustehtävissä ja kehittänyt opetusmateriaaleja mm. AV-tuotantojen ja massiivikurssien muodossa.

Headai tulkitsee merkityksiä suurista tekstidatamassoista
Headai on datalähtöiseen ennakointiin ja johtamiseen keskittyvä teknologiayritys – osaamisdatan yhdistäjä. Headain 100% omiin algoritmeihin perustuvien analytiikkaratkaisujen avulla mahdollistetaan erilaisten tekstidatojen yhteentoimivuus ja tuotetaan asiakkaiden käyttöön laadullisen datan uudenlaista mittarointia. Headain kognitiivinen tekoäly perustuu yli 20 vuoden tieteelliseen tutkimukseen. Yritys voitti vuonna 2017 Suomen kaikkien aikojen suurimman innovaatiokilpailun, Ratkaisu100:n.