maanantai 4. kesäkuuta 2018

Miksi?

Aloin lukea Judea Pearlin Book Of Why:ta. Olen ensimmäisen parin luvun jälkeen hivenen pettynyt. Kirja kertoo kausaalisesta päättelystä kansantajuisesti. En ole lukenut kirjaa vielä kokonaan, joten en arvostele sitä, vaan puhun tässä vain muutamista asiasta tähän mennessä nousseesta ajatuksesta.

 Todennäköisyyslaskennan ja tilastotieteen yksi keskeisin maksiimi -- ja Pearlin mukaan traagisesti ylikorostettu sellainen -- on, että korrelaatio ei kerro kausaalisuhteesta. Tämä on totta, tietenkin. Kausaalisuhde voi jopa olla käänteinen siihen verrattuna mitä korrelaatio sanoo. Esimerkiksi, mikäli luotamme siihen, että palokunta todella tekee työnsä kunnolla, oletamma että paloauton tullessa paikalle kun talo palaa, henkilö- ja omaisuusvahingot jäävät vähäisemmiksi. Kuitenkin pelkästään dataa tutkimalla voimme päätellä, että mitä enemmän palopaikalla on paloautoja, sitä suuremmiksi vahingot tuppaavat tulemaan.

Usein näkee spekuloitavan myös sillä, että kausaalisuhde voitaisiin kyllä päätellä jos meillä olisi riittävästi aikasarjadataa, sillä syy tapahtuu tietenkin aina ennen seurausta, eikä koskaan toisin päin, tai ainakin niinä kertoina kun X tapahtuu Y:n jälkeen, on Y:n syynä ollut jokin muu kuin X. Kuitenkin esimerkiksi ilmapuntarin laskiessa ja kosteusmittarin lukeman noustessa tiedämme että kohta sataa, ja kuitenkin tiedämme varmaksi, että vääntämällä ilmapuntarin mittaria käsin alaspäin ja suihkuttamalla höyryä kosteusmittariin, emme vaikuta käytännössä lainkaan säähän.

Pearl lähtee myös kirjassaan siitä, ettei kausaalisuutta voi suoraan päätellä datasta. Olen osin samaa mieltä itsekin, mutten täysin. Jos ajattelemme perinteistä todennäköisyyslaskentaa, voimme toki datan perustella laskea ehdollisia todennäköisyyksiä, esimerkiksi P(Y | X) tarkoittaa todennäköisyyttä että Y tapahtuu jos tiedämme X:n tapahtuneen. Jos P(Y | X ) > P(Y), niin päättelemme että X on evidenssiä  Y:n puolesta; Havaittuamme X:n, voimme olettaa että on ainakin suurempi todennäköisyys että Y tapahtuu. Tämän lisäksi tarvitaan kuitenkin jokin operaatio, esimerkiksi ns kontrolloitu koe, jonka avulla voimme tutkia mahdollista kausaatiota. Tähän käytetään ns. do- operaattoria. P(Y | do(X)) viittaa todennäköisyyteen että Y tapahtuu, jos me pakotamme X:n ensin tapahtumaan.

Ilmapuntariesimerkissämme Y viittaa siis sateeseen ja X ilmanpaineen pudotukseen.  P(Y | X) > P(Y) pätee kyllä keräämässämme havaintoaineistossa, mutta jos laitamme barometrin kaappiin jonne voimme imeä alipaineen (do(X)), niin P(Y | do(X)) = P(Y), eli mittarin manipuloiminen ei muuta sateen todennäköisyyttä.

Tähän perustuu esimerkiksi niin sanottu kaksoissokkokoe. Potilaat jaetaan kahteen eri joukkoon ja arvotaan, kumpi saa lääkettä (X) ja kumpi placeboa, ja katsotaan kuka paranee (Y).  Tällöin lääkkeen saajien joukosta saamme P(Y | do(X)) ja placebon saajien joukosta P(Y | do(ei-X) ). Jos ensimmäinen on suurempi, niin päättelemme että X on aiheuttanut osan paranemisesta. Tämä tietenkin sisältää aina tietyn määrän epävarmuutta, ja todennäköisyyksien merkitsevyys yms täytyy tarkastella, samoin erilaiset oletukset yms, mutta keskeistä on se, että se, tapahtuuko X on täysin kontrolloitu.

Talous- ja sosiaalitieteissä ei kuitenkaan voida turvautua kontrolloituihin kokeisiin, joten näissä kausaalinen selittäminen nojaa aina jonkinlaiseen paradigmaattiseen oletukseen. Olen jo vuosia sitten kirjoittanut ekonometrian ja esimerkiksi regressioanalyysin ongelmista tässä suhteessa, enkä mene niiden yksityiskohtiin sen kummemmin. Kuitenkin vaikka emme etsisi kausaalisuutta mallista vaan pyrkisimme kuvailevaan malliin jossa etsitään tilastollisia yhteyksiä, on meillä silti eräänlainen kausaalisuuden peikko väijymässä taustalla.

Esimerkiksi paljon puhuttu "naisten euro on 80 senttiä"- väite, joka saadaan datasta (jossakin muodossa) manattua esille jos valitaan naiset ja miehet ja lasketaan näiden palkkatulojen keskiarvot ja todetaan että toisessa joukossa tämä on keskimäärin alhaisempi kuin toisessa. Jos kuitenkin tehdään monen muuttujan malli, jossa normalisoidaan koulutuksen, yrityksen, tehtävänimikkeen, tehtyjen työtuntien, jne mukaan, niin varsinaisen sukupuolen osalle jää selitysvoimaa sangen vähän, muuttujat sopivasti valitsemalla sen etumerkkikin kääntyy. Tämä ilmiö on variantti Simpsonin paradoksista, eli siitä että kun osa muuttujista sivuutetaan, kahden muuttujan suhde saattaa näyttää päinvastaiselta.

Kausaalista selitystä voidaan kyllä tutkia välillisesti silloinkin kun ei voida varsinaista kontrolloitua koetta tehdä. Kontrolloitu koekin voidaan tehdä useammin kuin äkkiseltään näyttäisi; esimerkiksi, voidaan lähettää yrityksiin identtisiä työhakemuksia palkkatoiveineen mutta sukupuoli vaihdettuna, ja tarkastella todennäköisyyttä että "mies" kutsutaan haastatteluun. Tai voidaan laittaa nainen tai mies neuvottelutilanteeseen niin, että toinen osapuoli ei etukäteen tiedä ketä odottaa jne. Näillä voidaan yksittäisiä kausatiivisia suhteita tutkia silloinkin kun ei ole laajamittaista kontrolloitua koejärjestelyä.

Jos dataa on hyvin paljon, siitä voidaan myös suodattaa "edustavia" ja "kontrolloituja" osajoukkoja ja tutkia näiden tilastollisia ominaisuuksia. Tämä on itse asiassa pitkälti se, mitä tapahtuu kun tehdään lineaarinen regressiomalli tai faktorianalyysi. Mutta niissäkin päästään vain hivenen lähemmäs kausaalisuuden kumoamista; itse kausaalista mallia ei voida pelkästä datasta suoraan päätellä.

Pearl esittää että kausaalisuudessa on kyse kognitiosta, eikä niinkään metafysiikasta. Tämä argumentti ei ole muotoa "todellisuudessa ei ole kausaalisuutta" tai että "kausaalisuus on harhaa", vaan että kausaalisuus on selitysmallin ominaisuus, joka on juureutunut ihmisen kognitioon, ja että pelkkä data ilman tietoa siitä, miten se on hankittu ja mitä muuttujia on manipuloitu (suhteessa täysin neutraaliin havaintoon) ovat keskiössä kausaalisen selitysmallin luomisessa. Hän esittää diagrammin jossa kausaalisuus on itse asiassa eräänlaista "vuoropuhelua" tosiasioiden kanssa.

Olennaisena ja keskeisenä kausaalisuuden piirteenä hän pitää nimenomaan kontrafaktuaaleja, siis "Jos olisimme tehneet X, niin Y olisi tapahtunut". Tämä argumentaation osa jäi minulle vielä hämäräksi, toivon mukaan kirjan lukeminen lopppuun tuo selvyyden mikä juuri kontrafaktuaalissa on olennaista ja miten se eroaa siitä, että havaitsemme tilanteita jossa X tapahtuu ja tilanteita joissa X ei tapahdu, ja päättelemme tästä. Kontrafaktuaalit kuitenkin rajataan tekstissä nimenomaan kognitiivisiksi seikoiksi; hän esittää Löwenmensch-veistoksen esimerkkinä varhaisesta kontrafaktuaalisesta ajattelusta; Tarvitaan "mitä jos ihmisellä olisi leijonan pää?"- tyyppistä ajattelua että kyseinen veistos on saatu aikaan.

Pearl myös varsin mielenkiintoisella tavalla käsittelee kausaalisen ajattelun keskeistä "mytologiaa". Ehkä jopa hiukan pitkälle viedyn tulkinnan kautta hän esittää syntiinlankeemuksen tarinan mahdollisesti olevan allegoria nimenomaan kausaalisen ja kontrafaktuaalisen ajattelun kehittymisestä. Siinä Jumala on pikemminkin metafora niille luonnonvoimille ja vieteille joiden varassa ihminen elää ennen kausaalisen päättelyn avautumista; tietoisuus omasta alastomuudesta ja selitykset jotka Aatami ja Eeva esittävät luojan heitä kuulustellessa paljastavat näiden alkaneen käyttää kontrafaktuaaleja ja kausaalisia selitysmalleja.

Tämä luenta tietenkään ei ole mitenkään erityisen originaali. Ja muutoinkin, Pearl tuntuu käyttävän suuria sanoja joiden takana on kuitenkin varsin vähän todellista substanssia. En tarkoita etteikö tämä olisi tutkijana aivan ensiluokkainen, ja etteivätkö hänen kontribuutionsa olisi ansainneet kaikkea sitä kiitosta joka hänelle on tiedeyhteisöltä satanut; tarkoitan lähinnä sitä, että hänen käyttämänsä ilmaisut, kuten puhe vallankumouksellisesta ja tranformatiivisesta "uudesta tieteestä", tuntuvat tarpeettoman liioittelevilta.

Palaan asiaan myöhemmin. Luulen että haluan tutustua Pearlin aiempaan tuotantoon. Kirjaa suositteli suuresti arvostamani Moshe Vardi, jonka suositukset usein ovat osuneet nappiin.




2 kommenttia:

Antti kirjoitti...

Aiheeseen liittyen on keskusteltu hiljattain myös American journal of public healthissä:
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5888052/

Mitenköhän Book of why suhtautuu tähän puheenvuoroon?

Myös yo. puheenvuoron kommentaarit:
https://ajph.aphapublications.org/doi/10.2105/AJPH.2018.304379
https://ajph.aphapublications.org/doi/10.2105/AJPH.2018.304358
https://ajph.aphapublications.org/doi/10.2105/AJPH.2018.304366

Tiedemies kirjoitti...

Aihetta kyllä sivutaan kirjassa. Palaan siihen, kun olen lukenut sen kokonaan.

En ole itse täysin vakuuttunut edes siitä, etteikö laskennallisin keinoin voisi havaintodatasta löytää todisteita kausaalisuudesta; Tietenkään se ei onnistu täysin puhtaalta pöydältä, mutta "modulo oletukset", eli jo uskottavasti todennettujen kausaalisten oletusten nojalla voidaan poissulkea tietyt vaikutuksen suunnat.

Pearlin kirjassa lähdetään siitä, että kausaatiota ei "selitetä", vaan kysymyksiin kausaatiosta vastataan, viimekädessä pyrkimällä approksimoimmaan P(Y | do(X)) käyttäen jo vahvistettuja kausatiivisia malleja yhdessä datan kanssa.