Eiliseen asti, viimeiset kuusi viikkoa noudatin salikaverin kanssa yksinkertaisehkoa progressiivista ohjelmaa penkkipunnerruksessa. Ohjelmaan kuului penkkipunnerrus kolme kertaa viikossa, vuorotellen treeni A ja treeni B, joista A oli aina sama, eräänlainen palauttava treeni, ja B oli progressiivinen.
A-harjoitus oli aina samanlainen: 6x2, eli kuusi sarjaa, kaksi toistoa per sarja, painona 80% maksimista. Itse käytin tässä 87.5kg:ta joskin loppuvaiheessa muutin tämän yksinkertaisuuden vuoksi 90 kiloon. Käytin laskennallisena maksmimina 110 kiloa.
B-harjoitus eteni siten, että ensimmäiset kolme viikkoa intensiteetti oli sama 80%, ja toistomäärä nousi: 6x3, 6x4, 6x5 ja lopulta 6x6. Tässä vaiheessa siis oli kahdeksas harjoitus, ja yhdeksäs (A) oli siis kolmannen viikon viimeinen.
Jälkimmäisellä kolmella viikolla intensiteettiä alettiin nostaa, ja samalla pudottaa toistomäärää. 5x5@85%, 4x4@90%, 3x3@95%, 2x2@100% ja viimeisenä treeninä yksi toisto 105% intensiteetillä. En käyttänyt tarkkoja prosentteja, vaan yksinkertaisuuden vuoksi pyöristin nämä ja käytin painoina 95, 100, 105, 110 ja lopulta 115kg.
Ohjelma toimi minulla, ja ennätykseni kasvoi 5 kilolla, eli kun ennen ohjelmaa sain nostettua 110kg, sain sen viimeisenä päivänä nostettua 115kg. Tämä oli varsin hyvä progressio itselleni. Toki useimmat minun kokoiseni nuoremmat ja vakavammat harrastajat nostavat helposti yli 50 kiloa enemmän, mutta koin onnistuneeni tässä siinä mielessä, että en kokenut missään vaiheessa olkapäävaivoja, joita minulla pari vuotta sitten vielä oli säännöllisesti.
torstai 30. elokuuta 2018
tiistai 21. elokuuta 2018
Syyt ja seuraukset.
Mielenkiintoinen kirja, jota olen hiljakseen lukenut kesän aikana on "The Book of Why". Kirja ei rehellisesti sanoen ole kovin hyvä, koska se hypettää ja selittää vaikeasti asiaa, joka on lopulta aika yksinkertainen. Alla kirjoitan aiheesta mutten ota sitä suoraan kirjasta, vaan se on kirjan inspiroimaa, ja lopussa kommentoin kirjaa suoremmin.
Me kaikki "tiedämme", että korrelaatiosta ei voi päätellä kausaalisuutta. Jäätelön syönti kasvaa kesällä samaa tahtia hukkumiskuolemien kanssa, mutta ymmärrämme kaikki, ettei jäätelön syömisen kieltäminen vähennä hukkumiskuolemia. Kukko laulaa aina hieman ennen auringonnousua, mutta aurinko nousee varsin hyvin vaikka kukko ei laulaisikaan.
Muistetaan vanha kunnon bayesilainen päättely. En nyt ala tässä sitä kampaamaan sen enempää, siinä keskiössä on ehdollisen todennäköisyyden käsite. Jos meillä on tapahtuma A, jonka todennäköisyydestä olemme kiinnostuneita, ja olemme tehneet havainnon B, niin merkitään P(A | B):llä ehdollista todennäköisyytta, eli todennäköisyyttä että A tapahtuu kun tiedämme että B on tapahtunut. Esimerkiksi, jos tiedämme (tämä on esimerkki, en tiedä onko oikeasti näin, huom), että 75% autokolareista jompi kumpi osapuoli on ajanut ylinopeutta, niin nähdessämme kolarin (B), arvelemme että todennäköisyys on noin 75% että toinen tai molemmat ovat ajaneet ylinopeutta (A).
Tämä ei kerro tietenkään sitä, kuinka todennäköistä on että ylinopeutta ajava joutuu kolariin. Tätä todennäköisyyttä merkittäisiin P(B | A). Näillä on kuitenkin yhteys, ja se tunnetaan Bayesin kaavan nimellä, eli P(B | A) = P(A | B)*P(B)/P(A). Tämän tietääksemme meidän pitää siis tietää myös kuinka yleistä ylinopeus on, ja kuinka yleisiä kolarit ovat. Ja jos ylinopeus on hyvin yleistä, mutta kolarit hyvin harvinaisia, niin tämä todennäköisyys voi olla paljonkin pienempi kuin P(A|B).
Bayesilainen päättely ei kuitenkaan itsessään vangitse varsinaisesti mitään tietoa kausaalisuudesta. Voimme aivan hyvin arvioida ym. todennäköisyyksiä ilman minkäänlaista käsitystä mikä seuraa mistäkin, eikä toisaalta tällaista todennäköisyyksien tunteminen itsessään auta meitä mitenkään päättelemään mikä on syy ja mikä seuraus.
Esimerkiksi Tampereella vuosittain arvuutellaan päivämäärää, jolloin Näsijärvi jäätyy, ja toisaaltaa päivämäärää, jolloin Näsijärvestä lähtee jäät. Kevään mittaan voimme olla kokolailla varmoja, että jos meillä on lämpömittari sopivassa paikassa Näsijärven rannalla, niin sopivina päivinä mitatut lämpötilat paljastavat meille paljonkin siitä, milloin jäät ovat lähdössä. Emme kuitenkaan voi nopeuttaa jäiden lähtöä esimerkiksi pitämällä tulitikkua tällaisen lämpömittarin alla. Ymmärrämme intuitiivisesti, että lämpömittarin lukema ei vaikuta jäiden sulamiseen, vaan lämpömittarin lukemaan ja jäiden sulamiseen vaikuttaa yhteinen tekijä, ilman lämpötila.
Merkitään tätä lämpömittariin (tai johonkin muuhun tapahtumaan B) vaikuttamista uudella operaattorilla, do(B). Tämä tarkoittaa, että jonkin (eksplisiittisen tai implisiittisen) mallimme ulkopuolelta tulevan tekijän avulla pakotamme B:n tapahtumaan. P(A | B) on eri asia kuin P(A | do(B)), koska edellisessä me havaitsemme B:n tapahtuvan, ja jälkimmäisessä me aiheutamme B:n tapahtumisen.
Miten me voimme karakterisoida kausaalisuutta? Jos P(A | do(B) ) > P(A | do(!B)), niin tämä tarkoittaa että kun pistämme B:n tapahtumaan "väkisin", niin A:n todennäköisyys kasvaa. Tällöin B:n tapahtumisella on jokin kausaalinen suhde A:han. Se ei kuitenkaan tietenkään tarkoita että B jotenkin suoraan aiheuttaa A:n. Välissä voi olla montakin mekanismia.
En nyt tässä lähde kampaamaan kaikki erilaisia kausaalisia suhteita joita erilaisilla muuttujilla voi olla; Pearlin keskeinen argumentti on, että vaikka emme sinänsä voi päätellä pelkän datan perusteella kausaalisuutta, voimme päätellä, onko kausaalisuutta suhteessa tiettyihin oletuksiin. Lisäksi oletukset joita täytyy tehdä, eivät ole kovin vahvoja, eivätkä ne ole kovin "epätieteellisiä", eikä niitä tarvitse vetää hatusta.
Tämä tapahtuu ns. kausaalisten verkkojen avulla. Siinä relevantit muuttujat otetaan mukaan ja niistä muodostetaan graafi. Kaikkien teoriassa mahdollisten suorien kausaalisten suhteiden kohdalla piiretään nuoli. Otetaan tässä nyt kaksi esimerkkiä, tupakointi-syöpä ja hiilidioksidipäästöt-maapallon keskilämpötila, joiden kausaalista suhdetta haluamme selvittää.
Jos esitämme että jokin tupakoinnista riippumaton syy on sekä tupakoinnin että keuhkosyövän syy, niin voimme piirtää verkon jossa tämä (tuntematon) syy aiheuttaa molempia, ja tupakointi vain potentiaalisesti aiheuttaa syöpää. Me emme kuitenkaan voi tästä vielä päätellä vielä paljokaan, vaan tarvitsemme joko jonkin muuttujan joka taatusti liittyy tupakointiin mutta ei (suoraan) tähän ulkopuoliseen tekijään, tai sitten muuttujan joka liittyy tähän ulkopuoliseen tekijään, muttei (suoraan) tupakointiin.
Tällaisia muuttujia on muutama. Ensinnäkin, tupakoivilla ihmisillä keuhkoihin kertyy pieniä määriä tervaa. Tietenkään kaikille tupakoiville ei näitä tervajäämiä tule, mutta tällä ei ole merkitystä, kunhan korrelaatio on riittävän suuri. Toisekseen, tiedetään että tupakointi ja turvavyön käyttö ovat tilastollisessa yhteydessä siten, että tupakoivat ihmiset käyttävät turvavöitä vähemmän kuin tupakoimattomat. Tässä korrelaatio ei ole kovin suuri, mutta se on riittävän suuri, että tilastoissa se, että henkilö ei käytä turvavyötä, on riskitekijä keuhkosyövälle jos mitään muuta ei huomioida.
Jos meillä on kuvitteellinen mekanismi joka aiheuttaa sekä tupakointia että keuhkosyöpää, niin kysymys kuuluu a) onko mielekästä olettaa, että tämä mekanismi aiheuttaa tervan kertymistä keuhkoihin ja b) onko mielekästä että tämä mekanismi aiheuttaa sitä, että henkilö ei käytä turvavyötä. Oli mekanismi mikä hyvänsä, niin a)-kohdassa voimme postuloida esimerkiksi että syöpää aiheuttaa geeni, joka vähentää vierasaineiden poistumista keuhkoista ja siten saa tervaa kertymään keuhkoihin, ja että tämä toisaalta saa nikotiinin yms imeytymään keuhkoista herkemmin ja näin lisää todennäköisyyttä että henkilö alkaa tupakoida. b)-kohdassa on paljon vaikeampaa keksiä yhteyttä.
Ja katso: Tilastollisesti keuhkosyövän ja turvavyön käytön korrelaatio katoaa täysin, jos tehdään regressioanalyysi jossa keuhkosyöpää selitetään tupakoinnilla ja turvavyön käytöllä. Tervajäämien kohdalla tilanne on hieman toisenlainen. Siinä voimme tehdä muutamia erilaisia "temppuja", joilla voimme tutkia riippumatonta suhdetta näiden välillä; En mene tässä kaavasulkeisiin, mutta Pearl:in do-kalkyylin avulla pystymme näyttämään, että jos oletus on ettei ulkopuolinen tekijä suoraan vaikuta tervan määrään keuhkoissa (vaan ainoastaan tupakoinnin välityksellä), niin tupakointi aivan yksiselitteisesti aiheuttaa keuhkosyöpää.
Tästä saamme siis myös falsifikaatiokriteerin. Jos todella löydämme esimerkiksi yllä postuloidun syöpää ja nikotiininhimoa aiheuttavan geenin, niin voimme todellakin vielä löytää keinon kumota johtopäätös. Niin kauan kun tällaista geeniä tms mekanismia ei löydy, paras arvauksemme on että tupakointi todella aiheuttaa syöpää.
Maapallon keskilämpötilaa tutkiessa taas otamme relevantiksi muuttujaksi hiilidioksidipäästöt -- tämä on ainoa asia johon voimme edes teoriassa soveltaa do- operaattoria. Tämän lisäksi otamme esimerkiksi vulkaanisen toiminnan ja erilaiset biologiset prosessit jotka myös tuottavat hiilidioksidia. Näistä kaikista tulee vetää nuoli ilmakehän hiilidioksidipitoisuuteen, joka on yksi relevantti muuttuja. Tämän lisäksi otetaan muuttujiksi auringon aktiivisuus, muunlaiset hiukkaset ilmakehässä, maan pinnan albedo, jne. Näiden välille piirretään kaari jos on mitään syytä olettaa, että muuttuja vaikuttaa toiseen. Esimerkiksi ei ole mielekästä vetää viivaa hiilidioksidipäästöistä auringon aktiivisuuteen.
Nyt voimme tutkia aikasarjoista näiden muuttujien välisiä suhteita. Pearlin do-kalkyylin avulla voimme laskea esimerkiksi hiilidioksidin kausaalisen suhteen lämpötilaan, kun tunnemme potentiaaliset muut syyt. En ala tässä nyt kampaamaan sitä, miten näin voimme todistaa hiilidioksidipäästöjen todella lämmittävän maapalloa, sillä do-kalkyyli on varsin työläs viedä läpi. Lopputulos on kuitenkin hyvin samanlainen kuin syövän ja tupakoinnin kohdalla: Olettaen että tunnemme relevantit juurisyyt, meidän ei tarvitse tuntea todellakaan kaikkia välittäviä mekanismeja voidaksemme päätellä kausaalisen yhteyden. Se, että esimerkiksi meret sitovat enemmän tai vähemmän lämpöä tai merivirrat jakavat lämmön eri tavoin maapallolla kuin mallit ennustavat, on epäolennaista; olennaista on se, onko meillä kaikki mahdolliset kausaaliset tekijät tiedossa. Näistä me yksinkertaisesti tiedämme että jos mahdollisia tekijöitä ovat hiilidioksidipitoisuus, erilaiset hiukkasjäämät, vesihöyry ja pilvisyys, ja auringon aktiivisuus, niin on täysin varmaa, että hiilidioksidipäästöt lämmittävät maapalloa.
Tietenkin, on mahdollista, kuten yllä, että on jokin tuntematon luonnonvoima joka lämmittää maapalloa. Esimerkiksi maapallon ytimestä vapautuu jostain syystä lämpöä joka pääsee jostain maankuoressa olevasta reiästä ilmakehään. Tai ehkä maapallo on ontto ja etelänavalla olevasta luukusta päästetään aika-ajoin lämmintä ilmaa maapallon sisuksista ilmakehään. Tai ehkä kuu lämmittää enemmän kuin aiemmin osasimme arvioida. Jne.
Monelle -- myös minulle -- Pearlin argumentaatio ja esitystapa tuntuvat ylenpalttiselta hypetykseltä. Tämä ei tarkoita etteivätkö kausaalisten verkkojen käyttö ja do-kalkyyli olisi hyödyllisiä innovaatioita. Aikanaan kun opiskelin ekonometriaa, osa näistä menetelmistä opetettiin, osaa taas ei. Esimerkiksi Pearlin "Back-door"-kriteeri oli minulle uusi. Esimerkiksi ns instrumentti-muuttujien käytölle löytyy perustelu aika hyvin Pearlin do-kalkyylistä, joskin Pearl antaa hieman eri kriteerit instrumenttimuuttujien käytölle.
Perinteisesti instrumenttimuuttujia käytetään kun meillä on kausaalinen suhde A:sta B:hen, mutta selittävässä muuttujassa A:ssa on mittausvirhettä, joka voi korreloida tuntemattomalla tavalla B:n kanssa, ja jolle ei mallissa ole selittäjiä. Tällöin "instrumentoidaan" etsimällä muuttuja(t) X siten, että A:n sijaan käytämme X:n avulla estimoitua Â:ta. Tässä oletus on, että siinä määrin kuin  ja A eroavat toisistaan, tämä heijastelee mittausvirhettä, ja Â:n ja B:n välinen suhde paljastaa "todellisen" vaikutuksen. Tämän perusteluna on, että jos todella kontrolloisimme A:n, niin havaintodatassa läsnä oleva kohina joka voi vaikutta B:hen ei tulisi enää kontrolloinnin jälkeen näkymään do(A):ssa; Â:n katsotaan vastaavan lähemmin do(A):ta. Pearl esittää asian hieman toisin, mutta ero on minusta pitkälti filosofinen. En ole katsonut varsinaista matematiikkaa läpi, sillä Book of Why ei sisällä matemaattista esitystä tässä kohtaa sillä tasolla että voisin verrata.
Kaikenkaikkiaan tilastollinen kausaalinen päättely on kiehtova laji. Pearlin keskeinen "argumentti" on, että vanha nyrkkisääntö "correlation does not imply causality" on otettu liiaksi aksiomaksi ja se on tulkittu puritaanisesti niin, ettei havaintoaineistosta voisi päätellä mitään kausaalisuudesta, korkeintaan kumota yksittäisiä hypoteeseja muttei koskaan validoida mitään. Olen tästä samaa mieltä. Havaintoaineistosta voidaan tehdä johtopääksiä suhteessa kausaalisiin oletuksiin. Kausaalisia oletuksia puolestaan voidaan tehdä varsin paljon aivan arkisen tietämyksen ja ymmärryksen varassa, ja joka tapauksessa, kun ei voida olla varmoja, on (epistemologisesti) turvallista olettaa kausaalisuus joka sitten voidaan (joskus) osoittaa vääräksi havaintoaineiston perusteella. Toisalta Pearl minusta sotkee pakkaa liiaksi esittämällä monimutkaisen "kausaalisuuden portaat"- argumentin.
Pearl esittelee kolme "kausaalisuuden porrasta", joista ensimmäinen on puhtaat havainnot. Tämä on taso jolle perinteinen tilastollinen analyysi jää, sillä korrelaatiot, ehdolliset todennäköisyydet, yms ovat kaikki matemaattisesti symmetrisiä siinä mielessä, ettei ole mitään keinoa pelkän tilastomatematiikan keinoin sanoa että mikä on kausaalinen suhde ja mikä ei. Toisella tasolla Pearl esittää interventiot eli kontrolloidut koejärjestelyt. Siinä havainnon lisäksi voidaan tehdä koe, jossa muuttujia manipuloidaan. Tämä on taso jossa do-operaattoreita sovelletaan yksittäisiin suhteisiin, kuten esimerkiksi kun tehdään kaksoissokkokoe jonkin lääkkeen tehon tutkimiseksi. Toinen taso kykenee jo vastaamaan kysymyksiin kuten "mitä (todennäköisesti) tapahtuu jos teemme asian X". Kausaalisuuden kolmas porras on ns kontrafaktuaalien taso. Siinä vastataan kysymyksiin kuten "X tapahtui, mutta mitä jos se ei olisi tapahtunut?". Tämä taso on se, joka minusta jäi vähän hämäräksi, sillä ensiksikään, en näe miksi eteenpäin suuntautuva hypoteesi ja menneisyyteen suuntautuva kontrafaktuaali olisivat mitenkään eri asemassa analyysin suhteen; Kausaalisessa verkossa kyse on vain suunnasta johon laskenta etenee, eikä siten mitenkään syvällisestä filosofisesta erosta.
Ymmärrän näiden kahden jälkimmäisen tason eron lähinnä psykologisena; Taso 2 viittaa yksittäisiin suhteisiin, se on eräänlainen feed-forward tarkastelu yhden kontrolloidun muuttujan kausaalisuuden suhteen (mitä tapahtuu jos painan tästä), kun taas taso 3 mahdollistaa laajan suunnittelun, jossa tutkitaan useita haluttuja ulostuloja, ja ratkaistaan kysymyksiä kuten "mitä kaikkia pitää painaa tai vetää jotta saamme tämän ylös ja tuon alas".
Kaikenkaikkiaan ihan viihdyttävää lukemista. En suosittele vakavaksi kirjaksi ihmisille jotka haluavat soveltaa asioita teknisesti omiin analyyseihin, mutta suosittelen kaikille niille, jotka kuvittelevat ettei havaintoaineistosta voi tehdä mitään johtopäätöksiä.
Me kaikki "tiedämme", että korrelaatiosta ei voi päätellä kausaalisuutta. Jäätelön syönti kasvaa kesällä samaa tahtia hukkumiskuolemien kanssa, mutta ymmärrämme kaikki, ettei jäätelön syömisen kieltäminen vähennä hukkumiskuolemia. Kukko laulaa aina hieman ennen auringonnousua, mutta aurinko nousee varsin hyvin vaikka kukko ei laulaisikaan.
Muistetaan vanha kunnon bayesilainen päättely. En nyt ala tässä sitä kampaamaan sen enempää, siinä keskiössä on ehdollisen todennäköisyyden käsite. Jos meillä on tapahtuma A, jonka todennäköisyydestä olemme kiinnostuneita, ja olemme tehneet havainnon B, niin merkitään P(A | B):llä ehdollista todennäköisyytta, eli todennäköisyyttä että A tapahtuu kun tiedämme että B on tapahtunut. Esimerkiksi, jos tiedämme (tämä on esimerkki, en tiedä onko oikeasti näin, huom), että 75% autokolareista jompi kumpi osapuoli on ajanut ylinopeutta, niin nähdessämme kolarin (B), arvelemme että todennäköisyys on noin 75% että toinen tai molemmat ovat ajaneet ylinopeutta (A).
Tämä ei kerro tietenkään sitä, kuinka todennäköistä on että ylinopeutta ajava joutuu kolariin. Tätä todennäköisyyttä merkittäisiin P(B | A). Näillä on kuitenkin yhteys, ja se tunnetaan Bayesin kaavan nimellä, eli P(B | A) = P(A | B)*P(B)/P(A). Tämän tietääksemme meidän pitää siis tietää myös kuinka yleistä ylinopeus on, ja kuinka yleisiä kolarit ovat. Ja jos ylinopeus on hyvin yleistä, mutta kolarit hyvin harvinaisia, niin tämä todennäköisyys voi olla paljonkin pienempi kuin P(A|B).
Bayesilainen päättely ei kuitenkaan itsessään vangitse varsinaisesti mitään tietoa kausaalisuudesta. Voimme aivan hyvin arvioida ym. todennäköisyyksiä ilman minkäänlaista käsitystä mikä seuraa mistäkin, eikä toisaalta tällaista todennäköisyyksien tunteminen itsessään auta meitä mitenkään päättelemään mikä on syy ja mikä seuraus.
Esimerkiksi Tampereella vuosittain arvuutellaan päivämäärää, jolloin Näsijärvi jäätyy, ja toisaaltaa päivämäärää, jolloin Näsijärvestä lähtee jäät. Kevään mittaan voimme olla kokolailla varmoja, että jos meillä on lämpömittari sopivassa paikassa Näsijärven rannalla, niin sopivina päivinä mitatut lämpötilat paljastavat meille paljonkin siitä, milloin jäät ovat lähdössä. Emme kuitenkaan voi nopeuttaa jäiden lähtöä esimerkiksi pitämällä tulitikkua tällaisen lämpömittarin alla. Ymmärrämme intuitiivisesti, että lämpömittarin lukema ei vaikuta jäiden sulamiseen, vaan lämpömittarin lukemaan ja jäiden sulamiseen vaikuttaa yhteinen tekijä, ilman lämpötila.
Merkitään tätä lämpömittariin (tai johonkin muuhun tapahtumaan B) vaikuttamista uudella operaattorilla, do(B). Tämä tarkoittaa, että jonkin (eksplisiittisen tai implisiittisen) mallimme ulkopuolelta tulevan tekijän avulla pakotamme B:n tapahtumaan. P(A | B) on eri asia kuin P(A | do(B)), koska edellisessä me havaitsemme B:n tapahtuvan, ja jälkimmäisessä me aiheutamme B:n tapahtumisen.
Miten me voimme karakterisoida kausaalisuutta? Jos P(A | do(B) ) > P(A | do(!B)), niin tämä tarkoittaa että kun pistämme B:n tapahtumaan "väkisin", niin A:n todennäköisyys kasvaa. Tällöin B:n tapahtumisella on jokin kausaalinen suhde A:han. Se ei kuitenkaan tietenkään tarkoita että B jotenkin suoraan aiheuttaa A:n. Välissä voi olla montakin mekanismia.
En nyt tässä lähde kampaamaan kaikki erilaisia kausaalisia suhteita joita erilaisilla muuttujilla voi olla; Pearlin keskeinen argumentti on, että vaikka emme sinänsä voi päätellä pelkän datan perusteella kausaalisuutta, voimme päätellä, onko kausaalisuutta suhteessa tiettyihin oletuksiin. Lisäksi oletukset joita täytyy tehdä, eivät ole kovin vahvoja, eivätkä ne ole kovin "epätieteellisiä", eikä niitä tarvitse vetää hatusta.
Tämä tapahtuu ns. kausaalisten verkkojen avulla. Siinä relevantit muuttujat otetaan mukaan ja niistä muodostetaan graafi. Kaikkien teoriassa mahdollisten suorien kausaalisten suhteiden kohdalla piiretään nuoli. Otetaan tässä nyt kaksi esimerkkiä, tupakointi-syöpä ja hiilidioksidipäästöt-maapallon keskilämpötila, joiden kausaalista suhdetta haluamme selvittää.
Jos esitämme että jokin tupakoinnista riippumaton syy on sekä tupakoinnin että keuhkosyövän syy, niin voimme piirtää verkon jossa tämä (tuntematon) syy aiheuttaa molempia, ja tupakointi vain potentiaalisesti aiheuttaa syöpää. Me emme kuitenkaan voi tästä vielä päätellä vielä paljokaan, vaan tarvitsemme joko jonkin muuttujan joka taatusti liittyy tupakointiin mutta ei (suoraan) tähän ulkopuoliseen tekijään, tai sitten muuttujan joka liittyy tähän ulkopuoliseen tekijään, muttei (suoraan) tupakointiin.
Tällaisia muuttujia on muutama. Ensinnäkin, tupakoivilla ihmisillä keuhkoihin kertyy pieniä määriä tervaa. Tietenkään kaikille tupakoiville ei näitä tervajäämiä tule, mutta tällä ei ole merkitystä, kunhan korrelaatio on riittävän suuri. Toisekseen, tiedetään että tupakointi ja turvavyön käyttö ovat tilastollisessa yhteydessä siten, että tupakoivat ihmiset käyttävät turvavöitä vähemmän kuin tupakoimattomat. Tässä korrelaatio ei ole kovin suuri, mutta se on riittävän suuri, että tilastoissa se, että henkilö ei käytä turvavyötä, on riskitekijä keuhkosyövälle jos mitään muuta ei huomioida.
Jos meillä on kuvitteellinen mekanismi joka aiheuttaa sekä tupakointia että keuhkosyöpää, niin kysymys kuuluu a) onko mielekästä olettaa, että tämä mekanismi aiheuttaa tervan kertymistä keuhkoihin ja b) onko mielekästä että tämä mekanismi aiheuttaa sitä, että henkilö ei käytä turvavyötä. Oli mekanismi mikä hyvänsä, niin a)-kohdassa voimme postuloida esimerkiksi että syöpää aiheuttaa geeni, joka vähentää vierasaineiden poistumista keuhkoista ja siten saa tervaa kertymään keuhkoihin, ja että tämä toisaalta saa nikotiinin yms imeytymään keuhkoista herkemmin ja näin lisää todennäköisyyttä että henkilö alkaa tupakoida. b)-kohdassa on paljon vaikeampaa keksiä yhteyttä.
Ja katso: Tilastollisesti keuhkosyövän ja turvavyön käytön korrelaatio katoaa täysin, jos tehdään regressioanalyysi jossa keuhkosyöpää selitetään tupakoinnilla ja turvavyön käytöllä. Tervajäämien kohdalla tilanne on hieman toisenlainen. Siinä voimme tehdä muutamia erilaisia "temppuja", joilla voimme tutkia riippumatonta suhdetta näiden välillä; En mene tässä kaavasulkeisiin, mutta Pearl:in do-kalkyylin avulla pystymme näyttämään, että jos oletus on ettei ulkopuolinen tekijä suoraan vaikuta tervan määrään keuhkoissa (vaan ainoastaan tupakoinnin välityksellä), niin tupakointi aivan yksiselitteisesti aiheuttaa keuhkosyöpää.
Tästä saamme siis myös falsifikaatiokriteerin. Jos todella löydämme esimerkiksi yllä postuloidun syöpää ja nikotiininhimoa aiheuttavan geenin, niin voimme todellakin vielä löytää keinon kumota johtopäätös. Niin kauan kun tällaista geeniä tms mekanismia ei löydy, paras arvauksemme on että tupakointi todella aiheuttaa syöpää.
Maapallon keskilämpötilaa tutkiessa taas otamme relevantiksi muuttujaksi hiilidioksidipäästöt -- tämä on ainoa asia johon voimme edes teoriassa soveltaa do- operaattoria. Tämän lisäksi otamme esimerkiksi vulkaanisen toiminnan ja erilaiset biologiset prosessit jotka myös tuottavat hiilidioksidia. Näistä kaikista tulee vetää nuoli ilmakehän hiilidioksidipitoisuuteen, joka on yksi relevantti muuttuja. Tämän lisäksi otetaan muuttujiksi auringon aktiivisuus, muunlaiset hiukkaset ilmakehässä, maan pinnan albedo, jne. Näiden välille piirretään kaari jos on mitään syytä olettaa, että muuttuja vaikuttaa toiseen. Esimerkiksi ei ole mielekästä vetää viivaa hiilidioksidipäästöistä auringon aktiivisuuteen.
Nyt voimme tutkia aikasarjoista näiden muuttujien välisiä suhteita. Pearlin do-kalkyylin avulla voimme laskea esimerkiksi hiilidioksidin kausaalisen suhteen lämpötilaan, kun tunnemme potentiaaliset muut syyt. En ala tässä nyt kampaamaan sitä, miten näin voimme todistaa hiilidioksidipäästöjen todella lämmittävän maapalloa, sillä do-kalkyyli on varsin työläs viedä läpi. Lopputulos on kuitenkin hyvin samanlainen kuin syövän ja tupakoinnin kohdalla: Olettaen että tunnemme relevantit juurisyyt, meidän ei tarvitse tuntea todellakaan kaikkia välittäviä mekanismeja voidaksemme päätellä kausaalisen yhteyden. Se, että esimerkiksi meret sitovat enemmän tai vähemmän lämpöä tai merivirrat jakavat lämmön eri tavoin maapallolla kuin mallit ennustavat, on epäolennaista; olennaista on se, onko meillä kaikki mahdolliset kausaaliset tekijät tiedossa. Näistä me yksinkertaisesti tiedämme että jos mahdollisia tekijöitä ovat hiilidioksidipitoisuus, erilaiset hiukkasjäämät, vesihöyry ja pilvisyys, ja auringon aktiivisuus, niin on täysin varmaa, että hiilidioksidipäästöt lämmittävät maapalloa.
Tietenkin, on mahdollista, kuten yllä, että on jokin tuntematon luonnonvoima joka lämmittää maapalloa. Esimerkiksi maapallon ytimestä vapautuu jostain syystä lämpöä joka pääsee jostain maankuoressa olevasta reiästä ilmakehään. Tai ehkä maapallo on ontto ja etelänavalla olevasta luukusta päästetään aika-ajoin lämmintä ilmaa maapallon sisuksista ilmakehään. Tai ehkä kuu lämmittää enemmän kuin aiemmin osasimme arvioida. Jne.
Monelle -- myös minulle -- Pearlin argumentaatio ja esitystapa tuntuvat ylenpalttiselta hypetykseltä. Tämä ei tarkoita etteivätkö kausaalisten verkkojen käyttö ja do-kalkyyli olisi hyödyllisiä innovaatioita. Aikanaan kun opiskelin ekonometriaa, osa näistä menetelmistä opetettiin, osaa taas ei. Esimerkiksi Pearlin "Back-door"-kriteeri oli minulle uusi. Esimerkiksi ns instrumentti-muuttujien käytölle löytyy perustelu aika hyvin Pearlin do-kalkyylistä, joskin Pearl antaa hieman eri kriteerit instrumenttimuuttujien käytölle.
Perinteisesti instrumenttimuuttujia käytetään kun meillä on kausaalinen suhde A:sta B:hen, mutta selittävässä muuttujassa A:ssa on mittausvirhettä, joka voi korreloida tuntemattomalla tavalla B:n kanssa, ja jolle ei mallissa ole selittäjiä. Tällöin "instrumentoidaan" etsimällä muuttuja(t) X siten, että A:n sijaan käytämme X:n avulla estimoitua Â:ta. Tässä oletus on, että siinä määrin kuin  ja A eroavat toisistaan, tämä heijastelee mittausvirhettä, ja Â:n ja B:n välinen suhde paljastaa "todellisen" vaikutuksen. Tämän perusteluna on, että jos todella kontrolloisimme A:n, niin havaintodatassa läsnä oleva kohina joka voi vaikutta B:hen ei tulisi enää kontrolloinnin jälkeen näkymään do(A):ssa; Â:n katsotaan vastaavan lähemmin do(A):ta. Pearl esittää asian hieman toisin, mutta ero on minusta pitkälti filosofinen. En ole katsonut varsinaista matematiikkaa läpi, sillä Book of Why ei sisällä matemaattista esitystä tässä kohtaa sillä tasolla että voisin verrata.
Kaikenkaikkiaan tilastollinen kausaalinen päättely on kiehtova laji. Pearlin keskeinen "argumentti" on, että vanha nyrkkisääntö "correlation does not imply causality" on otettu liiaksi aksiomaksi ja se on tulkittu puritaanisesti niin, ettei havaintoaineistosta voisi päätellä mitään kausaalisuudesta, korkeintaan kumota yksittäisiä hypoteeseja muttei koskaan validoida mitään. Olen tästä samaa mieltä. Havaintoaineistosta voidaan tehdä johtopääksiä suhteessa kausaalisiin oletuksiin. Kausaalisia oletuksia puolestaan voidaan tehdä varsin paljon aivan arkisen tietämyksen ja ymmärryksen varassa, ja joka tapauksessa, kun ei voida olla varmoja, on (epistemologisesti) turvallista olettaa kausaalisuus joka sitten voidaan (joskus) osoittaa vääräksi havaintoaineiston perusteella. Toisalta Pearl minusta sotkee pakkaa liiaksi esittämällä monimutkaisen "kausaalisuuden portaat"- argumentin.
Pearl esittelee kolme "kausaalisuuden porrasta", joista ensimmäinen on puhtaat havainnot. Tämä on taso jolle perinteinen tilastollinen analyysi jää, sillä korrelaatiot, ehdolliset todennäköisyydet, yms ovat kaikki matemaattisesti symmetrisiä siinä mielessä, ettei ole mitään keinoa pelkän tilastomatematiikan keinoin sanoa että mikä on kausaalinen suhde ja mikä ei. Toisella tasolla Pearl esittää interventiot eli kontrolloidut koejärjestelyt. Siinä havainnon lisäksi voidaan tehdä koe, jossa muuttujia manipuloidaan. Tämä on taso jossa do-operaattoreita sovelletaan yksittäisiin suhteisiin, kuten esimerkiksi kun tehdään kaksoissokkokoe jonkin lääkkeen tehon tutkimiseksi. Toinen taso kykenee jo vastaamaan kysymyksiin kuten "mitä (todennäköisesti) tapahtuu jos teemme asian X". Kausaalisuuden kolmas porras on ns kontrafaktuaalien taso. Siinä vastataan kysymyksiin kuten "X tapahtui, mutta mitä jos se ei olisi tapahtunut?". Tämä taso on se, joka minusta jäi vähän hämäräksi, sillä ensiksikään, en näe miksi eteenpäin suuntautuva hypoteesi ja menneisyyteen suuntautuva kontrafaktuaali olisivat mitenkään eri asemassa analyysin suhteen; Kausaalisessa verkossa kyse on vain suunnasta johon laskenta etenee, eikä siten mitenkään syvällisestä filosofisesta erosta.
Ymmärrän näiden kahden jälkimmäisen tason eron lähinnä psykologisena; Taso 2 viittaa yksittäisiin suhteisiin, se on eräänlainen feed-forward tarkastelu yhden kontrolloidun muuttujan kausaalisuuden suhteen (mitä tapahtuu jos painan tästä), kun taas taso 3 mahdollistaa laajan suunnittelun, jossa tutkitaan useita haluttuja ulostuloja, ja ratkaistaan kysymyksiä kuten "mitä kaikkia pitää painaa tai vetää jotta saamme tämän ylös ja tuon alas".
Kaikenkaikkiaan ihan viihdyttävää lukemista. En suosittele vakavaksi kirjaksi ihmisille jotka haluavat soveltaa asioita teknisesti omiin analyyseihin, mutta suosittelen kaikille niille, jotka kuvittelevat ettei havaintoaineistosta voi tehdä mitään johtopäätöksiä.
tiistai 7. elokuuta 2018
Taloudesta ja työstä
Eräs argumentti, jonka olen nähnyt nyt useampaan kertaan esitettävän perustuloa ja vastaavia järjestelyjä vastaan on seuraavanlainen: Jos ihmiset saavat samanaikaisesti tulonsiirtoja ja tekevät työtä, niin tämä tulonsiirto on todellisuudessa tulonsiirto työnantajalle, koska työntekijä voi tehdä saman työn halvemmalla.
Ennen kuin menen muihin aspekteihin siitä, miksi tämä argumentti on väärä -- ja näitä on monta -- keskityn yhteen, ja se on eräänlainen moraalifilosofinen aksiooma, jonka mukaan työn pitää elättää yksilö kokonaan. Siis, jotenkin niin, että jos henkilö ylipäätään tekee työtä, niin tästä työstä saatavan palkan kuuluu riittää kaikkiin tämän henkilön menoihin. Kun olen erinäisissä yhteyksissä tutkiskellut tätä "tulonsiirto työnantajalle"- argumenttia, niin melkein aina sieltä alta löytyy tämä oletus.
Tämä oletus ei ole myöskään uniikki tässä asiassa. Se nousee pintaan usein silloin, kun puhutaan vaikkapa erilaisista ns luovista töistä, joskus myös tutkimuksesta. Tällä argumentilla perustellaan esimerkiksi nykyisiä järjettömän kattavia tekijänoikeuksia, eli että musiikkikappaleiden säveltäjien, sanoittajien jne, tulee ansaita elantonsa tekemällä musiikkia, tai että kirjailijoiden tulee ansaita elantonsa myymällä kirjoja.
Tämä argumentti on mielenkiintoinen virheellisyydessään. Virhellisyys on nähtävissä helposti esimerkiksi siitä, että jos minä ostan lapion ja menen (pyytämättä) kaivamaan kuoppaa jonnekin, on selvää ettei kukaan minulle siitä mitään maksa, vaikka tekisin kuinka kovasti työtä. Työ sinänsä siis ei oikeuta minua mihinkään. Kukaan ei kiistäkään tätä, vaan sanoo että kyse on ihan eri asiasta, yleensä siis kyse on siitä että täytyyhän ihmisten ensin sopia -- siis tehdä työsopimus.
Tämä työsopimuksen tekeminen tietysti tuhoaa argumentin kokonaan silloin, kun puhumme merkkijonojen, äänten, tms helposti digitoitavien tuotosten eteen tehdystä työstä ja tekijänoikeuksista, joten en mene siihen nyt. Mutta sen alle jää se, että jos työnantaja palkkaa työntekijän tekemään työtä, niin tämän tulisi maksaa palkkaa niin paljon, että työntekijän elinkustannukset tulevat katetuiksi.
Oletetaan että meillä on ravintola, jossa tarvitaan portsaria vain perjantai- ja lauantai-iltaisin. Ravintola on varsin pieni -- se on esimerkiksi pienellä paikkakunnalla -- ja se elättää omistajansa kuten miten arki-iltojen myynnillä. Omistajan lisäksi ravintolassa ei ole muita työntekijöitä. Paikkakunnalla on sen verran rähinöintiin taipuvaisia ihmisiä, että portsarin pitää pitää nämä ulkona. Jos portsaria ei ole, niin ravintola tuottaa viikonloppuisin tappiota kun rähinöijät rikkovat laseja ja karkottavat maksavat asiakkaat. Jos portsari on paikalla, ravintola tuottaa 200 euroa viikonlopulta voittoa.
Ravintoloitsija voisi pitää ravintolan kiinni viikonloppuisin ja sinnitellä, mutta palkkaamalla portsarin, ravintoloitsija voi tienata vähän enemmän. Hän laskee että maksamalla portsarille 100 euroa viikossa, saadaan reilu diili; Ravintoloitsija pitää puolet voitoista ja antaa puolet portsarille. Portsari ei kuitenkaan elä 100 eurolla viikossa, sillä hän joutuu maksamaan vuokraa, syömään, jne. Onneksemme meillä on yhdistelmä erilaisia tukia, jotka mahdollistavat sen, että portsariksi palkattu työtön kehonrakentaja saa maksettua vuokransa ja vieläpä kilokaupalla ylimääräistä rahkaa viikossa menemällä ovelle töihin.
Ravintoloitsija ei voisi palkata portsaria juurikaan suuremmalla summalla. Jo nyt hän saa viikonlopun aukiolosta saman kuin portsarikin, eikä tätä voi oikein millään muotoa pitää epäoikeudenmukaisena diilinä. Siinä määrin kuin ylipäätään pidämme positiivisena sitä, että ihmiset voivat viikonloppuna käydä ravintolassa (jos esimerkki on liian epäterve, niin vaihdetaan ravintolan tilalle kuntosali ja portsarin tilalle vaikkapa jumppaohjaaja) tai muutoin hyödyntää jotain palveluita, on selvää että ceteris paribus, on parempi että firma pyörii viikonloppuna kuin että se ei pyöri. Jos siis esimerkiksi esitämme vaatimuksen että portsaria ei saa palkata vaikkapa alle 1200 euron kuukausipalkalla (eli 300 euroa viikko), niin ravintola pysyy suljettuna viikonlopun.
Ennen kuin menen muihin aspekteihin siitä, miksi tämä argumentti on väärä -- ja näitä on monta -- keskityn yhteen, ja se on eräänlainen moraalifilosofinen aksiooma, jonka mukaan työn pitää elättää yksilö kokonaan. Siis, jotenkin niin, että jos henkilö ylipäätään tekee työtä, niin tästä työstä saatavan palkan kuuluu riittää kaikkiin tämän henkilön menoihin. Kun olen erinäisissä yhteyksissä tutkiskellut tätä "tulonsiirto työnantajalle"- argumenttia, niin melkein aina sieltä alta löytyy tämä oletus.
Tämä oletus ei ole myöskään uniikki tässä asiassa. Se nousee pintaan usein silloin, kun puhutaan vaikkapa erilaisista ns luovista töistä, joskus myös tutkimuksesta. Tällä argumentilla perustellaan esimerkiksi nykyisiä järjettömän kattavia tekijänoikeuksia, eli että musiikkikappaleiden säveltäjien, sanoittajien jne, tulee ansaita elantonsa tekemällä musiikkia, tai että kirjailijoiden tulee ansaita elantonsa myymällä kirjoja.
Tämä argumentti on mielenkiintoinen virheellisyydessään. Virhellisyys on nähtävissä helposti esimerkiksi siitä, että jos minä ostan lapion ja menen (pyytämättä) kaivamaan kuoppaa jonnekin, on selvää ettei kukaan minulle siitä mitään maksa, vaikka tekisin kuinka kovasti työtä. Työ sinänsä siis ei oikeuta minua mihinkään. Kukaan ei kiistäkään tätä, vaan sanoo että kyse on ihan eri asiasta, yleensä siis kyse on siitä että täytyyhän ihmisten ensin sopia -- siis tehdä työsopimus.
Tämä työsopimuksen tekeminen tietysti tuhoaa argumentin kokonaan silloin, kun puhumme merkkijonojen, äänten, tms helposti digitoitavien tuotosten eteen tehdystä työstä ja tekijänoikeuksista, joten en mene siihen nyt. Mutta sen alle jää se, että jos työnantaja palkkaa työntekijän tekemään työtä, niin tämän tulisi maksaa palkkaa niin paljon, että työntekijän elinkustannukset tulevat katetuiksi.
Oletetaan että meillä on ravintola, jossa tarvitaan portsaria vain perjantai- ja lauantai-iltaisin. Ravintola on varsin pieni -- se on esimerkiksi pienellä paikkakunnalla -- ja se elättää omistajansa kuten miten arki-iltojen myynnillä. Omistajan lisäksi ravintolassa ei ole muita työntekijöitä. Paikkakunnalla on sen verran rähinöintiin taipuvaisia ihmisiä, että portsarin pitää pitää nämä ulkona. Jos portsaria ei ole, niin ravintola tuottaa viikonloppuisin tappiota kun rähinöijät rikkovat laseja ja karkottavat maksavat asiakkaat. Jos portsari on paikalla, ravintola tuottaa 200 euroa viikonlopulta voittoa.
Ravintoloitsija voisi pitää ravintolan kiinni viikonloppuisin ja sinnitellä, mutta palkkaamalla portsarin, ravintoloitsija voi tienata vähän enemmän. Hän laskee että maksamalla portsarille 100 euroa viikossa, saadaan reilu diili; Ravintoloitsija pitää puolet voitoista ja antaa puolet portsarille. Portsari ei kuitenkaan elä 100 eurolla viikossa, sillä hän joutuu maksamaan vuokraa, syömään, jne. Onneksemme meillä on yhdistelmä erilaisia tukia, jotka mahdollistavat sen, että portsariksi palkattu työtön kehonrakentaja saa maksettua vuokransa ja vieläpä kilokaupalla ylimääräistä rahkaa viikossa menemällä ovelle töihin.
Ravintoloitsija ei voisi palkata portsaria juurikaan suuremmalla summalla. Jo nyt hän saa viikonlopun aukiolosta saman kuin portsarikin, eikä tätä voi oikein millään muotoa pitää epäoikeudenmukaisena diilinä. Siinä määrin kuin ylipäätään pidämme positiivisena sitä, että ihmiset voivat viikonloppuna käydä ravintolassa (jos esimerkki on liian epäterve, niin vaihdetaan ravintolan tilalle kuntosali ja portsarin tilalle vaikkapa jumppaohjaaja) tai muutoin hyödyntää jotain palveluita, on selvää että ceteris paribus, on parempi että firma pyörii viikonloppuna kuin että se ei pyöri. Jos siis esimerkiksi esitämme vaatimuksen että portsaria ei saa palkata vaikkapa alle 1200 euron kuukausipalkalla (eli 300 euroa viikko), niin ravintola pysyy suljettuna viikonlopun.
Tilaa:
Blogitekstit (Atom)