Ihmisen korva tunnistaa puheen hälinästä – konetta pitää vielä opettaa
Kuinka kone opetetaan tunnistamaan ihmisääniä? Ja kun se on kunnolla opetettu, millaisia sovelluksia äänen tunnistuksen ympärille voidaan kehitellä? Äänimaailman ratkaisemattomat kysymykset innostavat Kalle Palomäkeä tutkimaan. Tällä hetkellä hän viettää puolivuotista jaksoa Berkeleyn International Computer Science instituutissa Kaliforniassa.
Kalle Palomäki kävi koulua aikanaan Kalajoella ja sai tuekseen innostavat opettajat. Kiinnostus luonnontieteisiin – kemiaan, fysiikkaan ja matematiikkaan alkoi. ”Esimerkiksi tutustuminen atomeihin avarsi maailmaani ja innosti minua tavattomasti.”
Puoli vuotta Kaliforniassa
Käytännöllisenä maalaispoikana Kalle ajatteli, että insinööriksi opiskelemalla kiinnostuksen luonnontieteisiin voisi kääntää elannoksi. ”Olin myös kiinnostunut musiikista ja äänestä. Hakeuduin Teknillisen korkeakouluun kun huomasin, että siellähän voi syventyä akustiikkaan. Valitsin pääaineeksi akustiikan ja äänenkäsittelytekniikan. Opintojen edetessä aloin varsinaisesti miettiä tutkijan uraa. Innostavilla opettajilla ja ohjaajilla on ollut kovasti vaikutusta joka käänteessä,” Palomäki summaa tähänastista matkaansa.
Kalle Palomäki tutkii puheentunnistuksen lisäksi muun ääni-informaation käsittelyä. ”Olen jälkimmäiseen teemaan liittyen Kaliforniassa puolen vuoden vierailulla International Computer Science Institutessa Berkeleyssä, joka on itsenäinen tutkimusinstituutti.” Berkeleyssä näkyy lähellä sijaitsevien piilaakson ja kahden huippuyliopiston, Stanfordin ja UC-Berkeleyn vaikutus.
”Täällä käy aikamoinen pöhinä tieteen ja teknologian ympärillä. Olen vitsaillut, että kun Suomessa painetaan hampaat irvessä suon, kuokan ja Jussin viitoittamalla tiellä, niin täällä painetaan yhtä kovasti, mutta suupielet hymyn kareessa.”
Vapaa-aikanaan Palomäki retkeilee ja ihailee paikallista luontoa, punapuumetsiä ja Tyynen meren rantakallioita. ”Ruoka on täällä myös todella hyvää ja monissa etnisissä ravintoloissa voi herkutella lounasaikaan hyvin edullisesti. ”
Puheentunnistus voi helpottaa elämää
Automaattinen puheentunnistus häviää vielä ihmisaivojen hienouksille. Ihminen pystyy hämmästyttävän hyvin ymmärtämään puhetta melussa kuten kahviloissa, liikenteessä tai autossa. Koneelle meluisat ympäristöt ovat ongelma, sen melunsietokyky on heikompi kuin ihmisen. Palomäki koettaa ihmiskuulon antaman esimerkin avulla kehitellä menetelmiä, joilla kone oppii tunnistamaan puhetta paremmin.
Tarinoita rakastavan ajatus harhautuu avaruusseikkailuihin ja James Bondin maailmaan. Millaisia sovelluksia puheentunnistuksella voi olla aivan tavallisessa elämässä? Osa matkapuhelimen toiminnoista voidaan ohjelmoida tunnistamaan omistajan puhutut komennot. Puheella voidaan auttaa tekstinkäsittelyohjelmaa, tallentaa suoraan tietoa koneelle ja luoda muistioita ja raportteja nopeasti. Lääkäreiden ja sairaalojen käytöstä löytyy puheella toimivia sovelluskohteita, kuten sanelut ja laitteiden ohjaus puheella. Kauempana tulevaisuudessa siintävät puhetta ymmärtävät koneet, kuten esimerkiksi ihmisen kaltaiset robotit.
Kuvassa esitetty puheen spektrogrammi. Sisäkorva esittää puhetta tähän tapaan. Jos simupukan oikaisee, niin äänen spektri peilautuu simpukkaan kuvan mukaan. Näin ajatellen Y-akseli kuvaa auki rullattua simpukkaa ja lämpimät värisävyt voimakkaita simpukan basilaarikalvon värähtelyjä. Esim. s-kirjaimet näkyvät ylhäällä (suuri taajuus) lyhyinä purskeina ja vokaalit alhaalla pitempinä punaisina alueina.
Millaisia eroja ja yhtäläisyyksiä tiedeyhteisöissä on?
Epämuodollisuus, suorapuheisuus kova työ ja yritteliäisyys yhdistävät yhteisöjä. Palomäen vierailukohde on vielä erityistapaus, sillä ei ole suoria sidoksia yliopistoihin, ei opetusta eikä yliopistojen byrokratiaa. Erojakin löytyy. ”Kalifornian alati aurinkoinen sää ja perisuomalaista aurinkoisempi mieli,” Palomäki kuittaa ja vakavoituu. ”Jos kilpailu on Suomessa kovaa, täällä se on vielä kovempaa läpi koko yhteiskunnan pienistä lapsista alkaen. Huiput menestyvät loistokkaasti. Toisaalta systeemistä putoaa helpommin ulos.” Palomäki ei ole itse varsinaisesti opiskellut Kalifornian huippuyliopistoissa, mutta tietää että niissä opetus on laadukasta, opiskelu vaativaa ja tiukasti aikataulutettua.
Haasteita älylle
Palomäki haluaa tehdä työtä tutkijana. Työn parhaana puolena hän pitää vapautta. Vapautta kehitellä ja kokeilla, oppia uutta, ratkoa ongelmia ja haastaa älyä. ”Tutkimusaihettani pidän myös todella kiinnostavana. Jos esimerkiksi voimme opettaa koneet tunnistamaan ihmispuhetta paremmin, toiset voivat kehitellä tälle taidolle monia käyttökelpoisia ja ihmisen elämää helpottavia sovelluksia.”
Palomäki iloitsee mahdollisuudesta työskennellä ulkomailla, tutustua tutkimukseen ja elämään yleensä Suomen ulkopuolella. Berkeleyn lisäksi hän on vieraillut useasti Englannissa Sheffieldin yliopistossa.
Mitä harmin aiheita tutkijan maailmassa on? ”Ikävimmät puolet liittyvät kovaan, välillä suorastaan veriseen kilpailuun. Oma paikka tiedeyhteisössä on toistuvasti muutaman vuoden välein ansaittava uudelleen. Pääsystä esittämään ja julkaisemaan tuloksiaan tiedeyhteisölle on myös kilpailtava aina uudelleen. En ole koskaan ollut mitenkään kilpailuhenkinen.”
Teksti: Marja Nousiainen
Kuvat: Kalle Palomäki