tiistai 10. huhtikuuta 2012

Predikaattiabstraktio.

Olen kirjoittanut paljon abstraktiosta pyrkien esittämään sen jotenkin yleismaailmallisena tiedon käsittelytapana. Ajatusten taustalla on kuitenkin teoria, joka on tarkoitettu oikeastaan johonkin ihan muuhun. Olen rehellisesti sanoen liian tyhmä, jotta kykenisin pitämään mielessäni jotenkin monia erilaisia ja erillisiä tapoja hahmottaa maailmaa, ja niinpä, kun joudun hahmottamaan tutkimuksessani jotakin ilmiöitä jollakin tavalla, tästä tavasta tulee väistämättä osa ajatteluani.

Abstraktio on erilaisten mallien tms rakenteiden välillä operoiva kuvauspari. Toinen kuvauksista voidaan tässä nimetä "abstrahoinniksi" ja toinen "konkretisoinniksi". Ideana on, että toinen malleista on konkreettisempi ja toinen abstraktimpi, ja tämä kuvauspari antaa mahdollisuuden liikkua näiden välillä. Abstrahoitu versio on yksinkertaisempi ja laskennallisesti tms vähemmän hankala käsitellä. Abstraktion tarkoitus on mahdollistaa päättely tilanteessa, jossa se on konkreettisen mallin kokoluokan vuoksi tosiasiassa mahdotonta.

Konkretisoinnin tehtävä taas on samankaltainen kuin operationalisoinnin, eli se palauttaa abstraktissa mallissa tapahtuvan päättelyn konkreettisiksi ilmiöiksi. Näillä kuvauksilla pitää olla tietty suhde, jotta niiden tuottama päättely on validia. Yleensä tällainen vaatimus on Galois'n kytkentä tai jokin sen muunnelma.

Predikaattiabstraktio toimii niin, että mallin osien sijaan käsitellään näitä osia koskevia loogisia väittämiä. Jos vaikkapa mallin osat ovat muuttujia, joita on paljon, ja joiden arvoalueet ovat rajattomat, predikaattiabstraktio käsitteleekin väittämiä, esimerkiksi "muuttuja on positiivinen", "muuttuja on nolla" ja "muuttuja on negatiivinen". Tai "tämän muuttujan arvo on suurempi kuin tuon". Jokainen tällainen predikaatti jakaa (konkreettiset) mahdolliset mallin tilat niihin, joissa predikaatti pätee ja niihin, joissa se ei päde. Jos konkreettisen mallin muuttujien arvoalue on ääretön, eli ne ovat vaikkapa reaalilukuja, konkreettinen malli voi hyvinkin olla ääretön. Sensijaan predikaattiabstraktiolla saatava malli voi olla hyvinkin pieni; jos predikaatteja on yksi, niin sillä on vain kaksi eri tilaa!

Kun "matemaattista mallia" ja "sanallista mallia" yritetään asettaa vastakkain, ikäänkuin verbaalisesti esitetty malli olisi jotenkin laadullisesti erilainen, koen aina jonkinlaista ahdistusta. Tarkoitan, että kun näen jonkun esittävän, että matemaattinen lähestymistapa ei kykene vangitsemaan sitä "rikkautta", joka verbaalisella selityksellä on, koen että kyse on vakavasta ymmärryksen puutteesta. Jokainen verbaalisella esityksellä annettu malli on aina ymmärrettävissä abstraktina mallina, jossa käytetään predikaattiabstraktiota: Joko sanotut tosiasiat pitävät paikkaansa (tai ne pitävät paikkaansa jossakin määrin; predikaatit voidaan vallan hyvin ajatella sumeiksi) tai sitten eivät pidä, ja näiden ääneenlausuttujen mahdollisesti kontingenttien ja toisistaan riippuvien väittämien joukko on jokaisessa verbaalisessa esityksessä rajallinen.

Kukaan ei tietenkään penää tällaisessa tilanteessa konkretisointia, ainakaan täydellistä, eikä varsinkaan mitään Galois'n kytkentää operationaalisille suureille. Mutta sisäistä logiikkaa ja ymmärrystä siitä, että mikäli tällaisella mallilla pyritään todellisuudessa jotakin relevanttia ilmaisemaan, jonkinlainen keino konkretisoida mallia pitää olla, ainakin siihen pisteeseen, että voimme todeta jotenkin, ovatko esitetyt väittämät (ts. niiden konkreettiset vastineet) paikkansapitäviä vaiko eivät.
[huomautan tässä vaiheessa, että tämä prosessi on väistämättä sopimuksenvarainen; tässä ei ole tarpeen postuloida "objektiivisia tosisasioita". Niin voi tehdä mielessään, jos kokee sen tarpeelliseksi, tämän tarkastelun tarkoitus ei ole argumentoida tästä näkökulmasta yhtään mitään]

Tämän abstrahoinnin lisäksi, jos haluamme esittää relevantteja väittämiä "todellisuudesta" (kirjoitan edelleen lainausmerkkeihin, koska tässä voi käyttää mitä hyvänsä sopimuksenvaraista tarkastelutasoa), meillä on oltava jokin allaoleva malli siitä, mitä on lupa päätellä mistäkin. Omalla alallani alleoleva malli esimerkiksi on jonkin järjestelmän kuvaus (se voi olla tietokoneohjelma, jokin konkreettinen laite, protokolla, biologinen tai kemiallinen prosessi, yms) ja tämän järjestelmän toiminnan kannalta "olennaista" saattaa olla vaikkapa se, miten siinä esiintyvät suureet kehittyvät ajan kuluessa kun järjestelmä elää elämäänsä. Konkreettisella tasolla esimerkiksi kemiallisen prosessin mallissa voi olla reaktioyhtälöitä, tietokoneohjelman mallissa voi olla ohjelmakoodia, jota suoritetaan, jne, ja nämä määräävät jotenkin tällä "konkreettisella" tasolla sen, mitä milloinkin tapahtuu. Jokaiselle siirtymälle tilasta toiseen on jokin sääntö, esimerkiksi.

Myös nämä säännöt pitää siis abstrahoida, jotta voidaan päätellä abstraktista mallista jotakin. Ja se, miten ne abstrahoidaan, ratkaisee sen, mitä ominaisuuksia säilyy ja mitä ei. Tyypillisimmin valitaan abstraktio niin, että voidaan taata vaikkapa että jokainen ei-toivottava käyttäytyminen (esimerkiksi kemiallisen reaktion räjähdysmäinen eteneminen tms) säilyy abstrahoinnissa, mutta abstrahointi voi lisätä tällaisia ei-toivottavia ilmiöitä malliin. Tällöin, jos voimme osoittaa abstraktilla mallilla, että ei-toivottavia ilmiöitä ei ole, ei niitä ole tällöin myöskään konkreettisella mallilla.

Ehkä kaikkein tavanomaisin predikaattiabstraktion ilmenemismuoto on luonnollinen kieli.

6 kommenttia:

Ari kirjoitti...

Niin predikaattilogiikka on ihan käytännöllinen asia.

Se mikä minusta on merkillepantavaa on, että yksinkertaisetkin abstraktiot kuten vaikkapa E=F/q vaativat todennäköisesti monia miljardeja bittejä operationalisoituakseen. Tarkoitan sitä, että aivoissamme ovat, periaattessa täysin redusoituvia, neuroverkkoja jotka laskevat mikä osa todellisuudesta kuulu mukaan ja mikä ei. Koska tämä tapahtuu "automaattisesti", emme tiedosta näin mallien todellista monimutkaisuutta. Huom. siis fysiikka ei ole yhtään sen monimutkaisempaa kuin mallit välttämättä väittävät, vaan käyttääksemme mallia meillä pitää olla paljon eksogeenistä informaatiota. Tietenkin esim. Newtonin laista on aivoissamme jokin melko kehno käytännön empiriaan perustuva heuristinen versio. Tällä ei ole millään fysiikan tapaisella, jo hyvin tarkalla ja globaalilla informaatioalueella paljoakaan arvoa, mutta muualla kylläkin.

Mutte minulle epistemelogia on instrumentaalinen. Sanalliset mallit ovat vähän niin kuin sumeita. Minulle on ihan sama esitetäänkö todellisuus esim. predikaattilogiikalla vai onko se vähän epäloogisempaa runoilua. Epälooginen runoilukin voi olla hyödyllinen kone, jos aivomme neuroverkot antavat oikeita arvoja. Minulla ei ole niinkään tärkeää siis mallin muoto, vaan sen toimivuus. Markkinat toimivat pitkälle näin. Jotkut tekevät voittoa hyvin formaaleilla menetelmillä, toisilla mallit ovat *gasp* enemmän intuitioon perustuvia. Markkinoiden feedback-mekanismi pitää kakkien jalat maassa, tai ainakin silloin kun arbitraasin mahdollisuus ei ole kovin suuri.

Suosittelen ehdottomasti kuuntelemaan tämän, minkä olen aikaisemminkin linkannut, jos et ole aikaisemmin kuunnellut. Cowen pitää Hansonia Wittgensteinin tapaisena loogisena atomistina, jotka suosivat erittäin formaaleja malleja, joiden väärinymmärtämisen mahdollisuus on pieni. Minusta juurikin juju on siinä, että vaikka Hanson ja vastaavat fyysikot on hyvin skeptisiä ei-akateemisen ja ei-formaalin ajattelun ulkopuoliselle informaatiolle, omnitietoisina arvelisin, että yllättyisimme eksogeenisen informaation määrästä. Voin olla väärässäkin.

Mutta formaaliin esitykseen on aina pyrittävä.

Tiedemies kirjoitti...

Jokainen (toimiva) abstraktio pakkaa informaatiota aivan älyttömän paljon.

Minä olen itseasiassa mallien osalta enemmän samalla linjalla kuin Cowen, tai siis, enemmän sillä linjalla, miten Cowen itse näkee itsensä suhteessa Hansonin (ja osin ehkä itsenikin) tapaisiin formaalien mallien suosijoihin.

Itse lähden siitä, että formaalit mallit ovat parasta mitä meillä on, mutta että mikään partikulaarinen malli ei yleensä ole "oikea", vaan se on aina rajallinen ja siksi meidän on oltava valmiita (tai no, Cowenin eetosta jäljitelläkseni, marginaalilla ainakin valmiimpia kuin nykyisin keskimäärin ihmiset ovat) hylkäämään malli tai vähintään kyseenalaistamaan se ja muokkaamaan sitä.

Se, missä tämän lähestymistavan pahin sudenkuoppa on, että sitä käytetään ennakkoluulon validointiin: Kun tämä partikulaarinen malli nyt joudutaan hylkäämään, tämän hylkäyksen katsotaan validoivan jokin partikulaarinen intuitiivinen tai jopa täysin epäkoherentti käsitys, kuten vaikkapa jokin uskonnollinen selitys asioihin.

Tämän kirjoituksen pointti on kuitenkin vähän toinen: Jokainen hyvin muotoiltu teksti - ja aivan erityisesti tämä tulee mieleen melkein aina kun Cowen puhuu - yleensä muistuttaa muotoilultaan jonkinlaista probabilistista predikaattilogiikkaa, jossa siis pyritään komparatiivisiin väittämiin (A is more likely than B) ja marginaalisiin argumentteihin (a small increase in A results in a decrease of B), jotka olisivat viimekädessä palautettavissa jonkinlaiseen formaaliin esitykseen.

Ari kirjoitti...

Juu olen samoilla linjoilla. Tarkennan kuitenkin, että Cowen sanoo introspektiosta olevansa valmis käyttämään "common sense [although not so common anymore] to override those models". Vaikka itse malli olisi ihan predikaatilogiikan mukaan redusoituvissa, tämän mallin takana on myös valintafunktio, joka voi olla hyvin partikulaarinen ja monimutkainen. Maalaisjärki nyt on vain yksi evolutiivinen heuristiikka, mutta se on ajattelutapa, joka on Hansonille vieras.

Tietenkin tälläistä käytetään konfirmaatiobiaksena kun todellisuus ei kelpaa. Minulle todellisuus on pluralistinen, pidän monia mahdollisuuksia mahdollisina, enkä rakastu mihinkään uskomukseen liikaa; ainakin tähän pyrin. Karsastan siis ajatusta, että vain formaaleissa malleissa on informaatiota, ja muut ovat jotain maalaisjunttien höpinöitä. Tämä tuli mieleen kun puhuit Singaporen yhteydessä suomalaisuudesta.

Ehkä olen enemmän vain sympaattinen myös epäformaaleille ja vastaaville esityksille, jos uskon että se johtaa meidät lähemmäksi "totuutta". En näe tätä hirveän relevanttina ns. kovissa tieteissä kuten fysiikassa, mutta esim. yhteiskuntatieteitä pidän aikamoisena "sekasotkuna". Tämä ei tarkoita, etteikö formaaleilla malleilla olisi arvoa tai etteikö nämä asiat olisi teorian tasolla redusoituvia (ei ne mitään magiaa ole); päinvastoin formaalit mallit ovat arvokkaita, ja on the margin, pidän niitä arvokaampina kuin keskiverokansalainen mutta vähemmän kuin Hanson. Kalibroin itseäni suhteessa Cowenin monessa suhteessa, koska hän tietää paljon monilta tieteenaloilta.

Toivottavasti tämä paljastaa sen mitä tarkoitin.

Tiedemies kirjoitti...

En ihan ymmärrä mitä tarkoittaa se, että common sensellä kumotaan malli.

Mutta siis, itse näen sen jotenkin niin, että kun Cowen sanoo että "things are messy", olen täysin samaa mieltä. Ainakin jos tulkitsen tämän niin, että malli, joka on sullottu muutamaan dimensioon (riippumattomaan muuttujaan), on melko helposti osoitettavissa vuotavaksi, eli siis että ceteris paribus on melkein aina jollakin ilmeisellä tapaa väärä oletus.

Ei ole tietenkään niin, että vain formaaleissa malleissa olisi informaatiota. Se on väärä kuvitelma. Sensijaan formaaleissa malleissa on esitystapaan nähden enemmän informaatiota ja ennen kaikkea informaatio, ja mallien rikkinäisyys ilmenee helpommin. Formaalissa esityksessä ei voi käyttää ns. weasel-wordejä, eli ei voi pehmennellä ja siloitella ikäänkuin etukäteen panssaroidakseen mallinsa vastaväitteiltä.

Ari kirjoitti...

Uskoisin, että maalaisjärjellä tarkoitetaan, että on jotain (heuristista) informaatiota jostakin, joka antaa syytä epäillä mallin toimivuutta. Jos joku oppilaasi toisi eteesi mallin, jonka väittäisi ennustavan paikallisen sään 12kk etuajalla, olisit melko varmasti intuitiosta olisit hyvin skeptinen näkemättä mallin ensimmäistä muuttujaakaan. Tämä informaatio ei ole merkityksetöntä. Tätä voidaan tavallaan myös ajatella vaikka regressioanalyysiin perustuvaksi makro-tason abstraktioksi.

Maalaisjärki on tietekin vain yksi evoluution testaama (?) intuitiivnen työkalu. Esimerkiksi taitavan muusikon tai vaikka taidemaalarin vuosien kehittynyt intuitio on arvokas funktio, vaikka he eivät sitä osaisi "selittää". Tämähän oli Kahnemanin Thinking Fast and Slow tärkeimpiä teesejä.

Yksi keino ajatella asiaa on vaikkapa jos tekisit kvanttimallin, joka väittäisi, että koirasi pitäisi leijua pois maan painovoimakentästä, epäilisit varmasti jotakin virhettä mallissa. Tämä on siitä "helppo", koska toisaalta makrofysiikka on aina redusoitavissa kvanttifysiikaksi, mutta todennäköisesti teet jo päätöksen ilman tätä reduktiota. Tosielämässä monestikaan reduktio ei ole mitenkään laskennallisesti mahdollista, ja käytetään karkeita abstraktioita. Taloustieteessähän on tainnut olla tekninen kiista pitäisikö makromallit olla redusoitavissa mikromalleiksi, ja jotkut itävaltalaisetkin ovat tähän tainneet sotkeentua. Ainakin Robert Lucas, jolle itävaltalaiset ovat sympaattisia.

Tai voin antaa omasta elämästäni esimerkin, ajattelimme pienempänä kerran rakentaa digitaalilogiikalla ohjattavan saunareleen, mutta emme sitten uskoneet hänen isänsä olevan kovin sympaattinen ajatukselle jos esim. polttaisimme talon. Hän voisi tehdä "rationaalisen" päätöksen asian suhteen ymmärtämättä yhtään digitaalilogiikkaa. Magic!

Niin, formaali esitys on sinäänsä sisältä lahjomaton. Tämä estää kaikenmaailman vetkutttelun, ja tosiasioiden kiistämisen, mikä on suorastaan ihmisten ominaispiirre. Siksihän ne ovatkin erittäin arvokkaita, mutta sehän ei ns. hörhöjä pysäytä.

Muistan sinunkin sanoneesi esim. akateemisen filosofian (ainakin jonkin alueen) turhuudesta pystymättä sitä formaalisti todistmaan ("se näyttää vain ilmeiseltä"). :)

Ari kirjoitti...

Mutta silloin kun "things are messy" ja kaikki abstraktiot vuotaa on tietenkin vaikea sanoa kuka oikeasti on oikeassa, mutta on olemssa monia heuristisia keinoja kuten Bayesin interferenssi, marginalismi jne, jotta ei voida vain nostaa käsiä ilmaan ja sanoa että kaikki käy.

Kiittää tästä sopasta saamme... entropiaa!