perjantai 17. kesäkuuta 2011

Kellä malli on sen kätkeköön.

Kätketty Markovin malli (HMM) on melko yksinkertainen stokastinen prosessi. Formaalisti HMM in 6-tuppeli (S,P,L, &Theta, &mu, &alpha), missä (S,P,L) muodostaa diksreetin markovin mallin eli DTMC. Siinä S on tilojen joukko, P on tilasiirtymäjakauma, so. P(s,s') on todennäköisyys, että tilasta s siirrytään tilaan s'. L puolestaan on funktio, joka liittää jokaiseen tilaan joukon propositioita.

&Theta on ns. havaintokäsitteiden joukko, &mu on funktio, joka liittää kuhunkin tilaan todennäköisyysjakauman havaintokäsitteiden yli. Siis, &mu(s,o) on todennäköisyys sille, että o havaitaan, jos olemme tilassa s. &alpha on taas todennäköisyysjakauma tilojen yli, so. se kertoo millä todennäköisyydellä olemme missäkin tilassa ennen kuin olemme tehneet yhtään havaintoa.

HMM:n semantiikka tulkitaan havaintosekvenssien yli; jokainen havaintosekvenssi määrittää todennäköisyysjakauman sille, missä tilassa HMM kullakin hetkellä on, ja näinollen myös todennäköisyysjakauman propositioille. Koska alla oleva DTMC on "piilossa" emme voi havaita tilaa suoraan, emmekä siis näinollen myöskään tiedä, mitkä propositiot ovat voimassa, voimme tehdä suoria havaintoja vain havaintokäsitteistä.

HMM:iä käytetään esimerkiksi puheentunnistuksessa tms. epävarmuutta sisältävissä tehtävissä. Karkea ja hiukan virheellinen kuvaus niiden käytöstä on, että foneemit esiintyvät tietyllä todennäköisyydellä tietyssä järjestyksessä, jos ollaan lausumassa tiettyjä sanoja, ja HMM:llä voidaan mallintaa tämä prosessi ja sitten päätellä, mikä on todennäköisin sana, joka juuri lausuttiin. Propositioilla voitaisiin esimerkiksi merkitä kirjaimia, joiksi foneemit tulkitaan.

Mallintarkastusmenetelmiä voidaan käyttää myös HMM:ien ominaisuuksien tutkimiseen. Voimme ilmaista esimerkiksi sopivien probabilististen aikalogiikoiden kaavoja, esimerkiksi PCTL:n kaavoja ja tutkia niiden totuusarvoja HMM:n yli. Myös lineaarisen ajan logiikoita voidaan määritellä, en mene yksityiskohtiin. Semantiikka määritellään alla olevalle DTMC:lle. HMM:lle määritellän ns. uskomustila, joka on itseasiassa todennäköisyysjakauma S:n yli, ja aikalogiikan kaava tulkitaan tämän jakauman "läpi" kullekin sekvenssille.

Siirryn metatasolle hieman. Olen nuorissa opiskelijoissa huomannut sellaisen vaarallisen piirteen - itseänikin vaivasi joskus tämä tauti - että geneeriset ja monikäyttöiset mallit kuten HMM aletaan herkästi omaksua eräänlaisiksi todellisuuden ja maailmankaikkeuden malleiksi. Ne ovat kyllä hyödyllisiä filosofisia työkaluja - itseasiassa kummaksun sitä, että filosofit operoivat niin harvoin partikulaarisilla ja eksplisiittisillä malleilla - mutta ne eivät ole "totta". Ne ova työkaluja ajatteluun ja ihmettelyyn. Tämän kiisteen jälkeen minun on kuitenkin todettava, että mitään ymmärrystä ei ole olemassa sen ulkopuolella, että todellisuudesta tehdään jokin tällainen malli.

Relativismi on ymmärrettävä näin: ymmärrys ja tiedonintressi (jos tällainen pompöösi sana sallitaan) on aina sidoksissa siihen malliin, jota todellisuuden hahmottamiseen käytämme. Jos mallimme on liian köyhä, käsityksemme on kapea ja karkea. Toisaalta, jos mallimme on liian ilmaisuvoimainen, se on melkein varmasti ristiriitainen ja täysin virheellinen. Voimme esittää malleistamme vertailuja ainoastaan niiden tarkoituksenmukaisuuden suhteen. Tässä on kuitenkin syytä olla tarkkana, koska ihmisillä on tapana sotkea eri tason tarkoituksenmukaisuudet toisiinsa. Malli voi olla esimerkiksi psykologisesti tai poliittisesti tarkoituksenmukainen, koska siihen vetoamalla saa äänestäjiä tms. Relativismin huono maine johtuu pitkälti siitä, että tämä tarkoituksenmukaisuustarkastelu ymmärretään ilmeisen tahallaan väärin.

2 kommenttia:

antti kirjoitti...

Merkinnän viimeinen kappale vaikutti kiinnostavalta, mutta en oikein ymmärtänyt, mitä yritit sanoa. Pystyisitkö kirjoittamaan sen jotenkin toisin?

Tiedemies kirjoitti...

Kyseessä on viitekehys, jossa "ymmärrys" on sitä, että otetaan jokin malli; sen ei tarvitse olla HMM, se voi olla mikä tahansa malli, mallinnetaan ilmiö eli etsitään sopivat parametrit joilla malli kuvaa riittävällä tarkkuudella ilmiötä, ja sitten tutkitaan mallin ominaisuuksia; ymmärtämisellä tarkoitetaan sitä, että osataan tutkia mallia ja osataan operationalisoida se jne.

Relativismi on triviaalia tässä viitekehyksessä, koska se on vain sen toteamista, että jokainen malli ja mallinnos on omalla tavallaan puutteellinen, eikä kuvaa ilmiötä täydellisesti. Mallinnoksia voi tietenkin verrata toisiinsa tarkoituksenmukaisuuden akselilla. Jos tavoitteenamme on selvittää mahdollisimman oikein, mihin pallo putoaa, mallimme on syytä ottaa huomioon esimerkiksi newtonilainen mekaniikka, ilmanvastus, jne, ja jokin toinen malli saattaa olla huonompi tähän tarkoitukseen.

Toisaalta tämä suhteellisuus on huono argumentti jos sillä yritetään kiertää epärehellisesti eri tason tarkoituksenmukaisuuksia. Esimerkiksi poliittinen totuus jonka mukaan veroja pitää kiristää jotta "palvelut voidaan turvata" voi olla tarkoituksenmukainen siinä, että se vetoaa tiettyyn äänestäjäsegmenttiin, mutta tämä ei vielä tee siitä hyödyllistä siihen tarkoitukseen, johon sen väitetään soveltuvan.