sunnuntai 24. lokakuuta 2010

Mistä on kyse?


Olen todennäköisesti kirjoittanut ennenkin todennäköisyyksistä. On yleinen harhaluulo kuvitella, että todennäköisyyden ja satunnaismuuttujan käsite on jonkinlainen taikatemppu, jolla selitetään oikeasti selittämättä mitään. Operationaalisella tasolla satunnaismuuttuja voidaan ajatella operationaaliseksi suureeksi - sellaiseksi, jonka arvon voimme mitata jotenkin - jonka arvo ei ole määräydy teoriasta yksikäsitteisesti. Esimerkiksi nopanheiton tulos on satunnaismuuttuja; kun meillä ei ole käytössä ranneliikkeen, nopan ilmanvastuksen, hitausmomentin jne. teoriaa, jokainen tulos näyttää esiintyvän yhtä usein. Teoriassa, jos meillä olisi riittävästi antureita ja mittareita, joiden perusteella tietäisimme, millä nopeudella, minkälaisella rotaatiolla jne. noppa irtoaa kourasta, voisimme saada tarkemman arvion. Koska näin ei ole, teoria, joka meillä on, on avoin, so. kaikkia relevantteja ilmiöitä ei ole operationalisoitu.

Satunnaismuuttujan käsitteeseen liittyy jakauman käsite. Jakauma kertoo meille, miltä mittaustulokset näyttävät, kun niitä kerätään paljon. Nopanheiton tapauksessa, jos heitämme noppaa tuhansia kertoja, eri silmälukujen esiintymiskerrat ovat suunnilleen 1/6 kaikista heitoista, ja mitä enemmän heittoja kertyy, sitä tarkemmin tämä luku on 1/6. Frekventistinen tulkinta todennäköisyyksistä perustuu tähän: kun teemme havaintoja, kunkin yksittäisen havainnon todennäköisyys on sen osuuden raja-arvo, kun havaintojen määrä kasvaa rajatta. Tässä käytän kuitenkin tulkintaa, jonka mukaan meillä on ennalta jokin teoria jakaumasta, jota me sitten säädämme sitä mukaa kun havaintoja tulee. En mene tässä kiistaan bayesilaisen ja frekventistisen näkemyksen välillä; kiista on minusta tarpeeton, koska kumpikin tuottaa omalla tavallaan vuotavan abstraktion; suosin mieluummin tulkintaa, joka tässä tekstissä tulee implisiittisesti esiin. Toivon sen olevan tyydyttävä lukijoilleni.

Omassa työssäni joudun tekemisiin erilaisten automaattien ja niiden satunnaistettujen versioiden kanssa. Yksinkertaisessa maailmassa voimme ajatella, että jokainen ei-satunnainen, deterministinen automaatti edustaa "suljettua" teoriaa ja epädeterministinen avointa teoriaa, joka ottaa kantaa vain siihen, mikä on mahdollista. Epädeterministinen teoria kuulostaa hölmöltä, mutta se on yllättävän tehokas. Äärettömien havaintojen kanssa laajennettuna, se kykenee usein ilmaisemaan hyvin vahvasti sen, toimiiko jokin ilmiö "halutulla" tavalla. Esimerkiksi mallintarkastuksessa voimme ilmaista epädeterministisillä automaateilla hyvin monimutkaisia ominaisuuksia, ja toteamaaan niiden oikeellisuuden. Erityisesti, kun spesifikaatiota rikotaan, voimme esittää vastaesimerkin, eräänlaisen todisteen, joka kertoo mikä meni pieleen.

Probabilistisen automaatin esittämä teoria taas ottaa kantaa epädeterministisen ilmiön todennäköisyysjakaumaan. Siinä voidaan esittää puhtaasti laadullisten kysymysten lisäksi määrällisiä kysymyksiä ja kysymyksiä raja-arvoista, siitä, kuinka usein jokin ilmiö tapahtuu suhteessa muihin jne. Koska suosin lähes puhtaaksiviljeltyä instrumentaalista näkökulmaa (tosin wikipedian artikkeli on erittäin puolueellinen; en ota nyt siihen kantaa). Yksinkertainen malli heitettävästä kolikosta sisältää kolme tilaa "kädessä", "pöydällä: kruuna" ja "pöydällä: klaava". Siinä on kaksi tapahtumaa "nosta" ja "heitä". "nosta" vie kolikon aina käteen täysin varmasti, mutta "heitä" siirtää sen jompaan kumpaan pöydällä olevaan tilaan, todennäköisyydellä 0.5. Tämä on siis yksinkertainen esitys teoriasta.

Tutkimani reduktio, joka pyrkii poistamaan redundantteja tilasiirtymiä, voidaan ajatella menetelmäksi, joka yksinkertaistaa teoriaa. Rinnakkain toimivien, sinänsä determinististen automaattien kanssa ongelma on kokolailla ratkaistu, joskin olemme onnistuneet työntämään teoriaa jonkin verran pidemmälla. Satunnaistavien automaattien suhteen se on huomattavasti haasteellisempi toteuttaa, sillä sen pitäisi säilyttää teorian oleellisten ennusteiden olemassaolon lisäksi niiden todennäköisyys, ja tämä on epätriviaali toteuttaa. Kysymys on myös siitä, että vuorovaikutus - joka esimerkin kolikoissa on tapahtumien "heitä" ja "nosta" muodossa - täytyy mallintaa erikseen, ja todennäköisyydet ovat aina suhteessa annettuun vuorovaikutusmalliin. Tyypillinen (joskaan ei ainoa) tapa ilmaista jonkin ominaisuuden todennäköisyyksiä on antaa sille pienin yläraja ja suurin alaraja kaikkien vuorovaikutusmallien yli. Vuorovaikutus voidaan mallintaa myös pelisemantiikan avulla niin, että vuorovaikutusta ohjaa kaksi pelaajaa, jotka tiettyjen sääntöjen puitteissa valitsevat tapahtumia.

8 kommenttia:

Anonyymi kirjoitti...

Satunnaismuuttuja on matematiikan huonoimmin valittu käsite. Kyseessä ei oikeastaan ole mitään muuta kuin mitallinen funktio (tietyillä rajoitteilla).

Tiedemies kirjoitti...

En ole samaa mieltä kuin osittain.

Satunnaismuuttujalla on matematiikassa tietenkin rooli, mutta missä tahansa teoreettisessa rakennelmassa, jossa muuttujalla on jokin operationaalinen tulkinta, se on kyllä jotain muuta kuin mitallinen funktio.

Se mitallinen funktio - viitannet tiheysfunktioon - on jatkuva-arvoisen satunnaismuuttujan malli, mutta ei se ole sama asia kuin se muuttuja.

Anonyymi kirjoitti...

Todennäköisyysteoriaa voi kai ajatella monesta näkökulmasta. Mutta formalistina sinun luulisi olevan kiinnostunut miten aksiomaattinen todennäköisyysteoria matemaattisesti muotoillaan. Se on käytännössä osa (yleistä) mittateoriaa. Sen aksiomat ovat Kolmogorovin muotoilemat. http://en.wikipedia.org/wiki/Probability_axioms
Satunnaismuuttuja nimenomaan on määritelmällisesti sekin mitallinen funktio.
http://en.wikipedia.org/wiki/Random_variable

Tiedemies kirjoitti...

Tottakai tunnen Kolmogorovin aksioomat, olen opettanut niitä aikanaan.

Kolmogorovin aksiomissa ei sinänsä vielä puhuta satunnaismuuttujasta; Aksiomat määrittelevät vain ei-negatiivisuuden, yksikkömitallisuuden, ja additiivisuuden.

Satunnaismuuttuja on ns. johdannaiskäsite, ja olet sen suhteen tietenkin oikeassa, se on pelkkä mitallinen funktio. Minä käytin tässä sitä kuitenkin hieman intuitiivisemmassa merkityksessä, ja sekaannuksen vaaraa ei ole, koska operoin diskreeteillä tapauksilla, en missään hiton monistoissa tai muissa sellaisissa patologisissa domaineissa. :)

Tiedemies kirjoitti...

[Ja kyllä, mittateoriakin on jossain määrin yleisellä tasolla tuttua, mutta funktionaalianalyysin jatkokurssin ja mittateorian jälkeen olen viimeiset 10 vuotta pitäytynyt täysin diskreeteissä jutuissa.]

Anonyymi kirjoitti...

Okei, diskreetissä tapauksessa mitallisuudella tuskin koskaan on merkitystä (melkein aina (pun intended) kaikki on siellä mitallista). Pointtini oli vain että tuo sana "satunnaismuuttuja", jota on kuitenkin pakko käyttää, ärsyttää minua.

Tiedemies kirjoitti...

Minustakin olisi mukavaa, jos satunnaismuuttuja olisi jotenkin muuten ilmaistavissa. Se operationaalinen vastine, jota tässä käytän, on minusta intuitiivisempi kuin se, jota matematiikan puolella käytetään. Siitä olisi mielekästä käyttää jotain muuta nimitystä.

Petteri kirjoitti...

Satunnaismuuttuja on mitallinen funktio aivan samalla tavalla kuin runo on sanoja peräkkäin. Toisin sanoen mittateoria on vain todennäköisyyden (varsin onnistunut) matematisointi.