keskiviikko 28. marraskuuta 2018

Sisätulo

Matematiikkaa voi nimitää tai olla nimittämättä "tieteeksi". En ole lopulta kovin kiinnostunut siitä, nimitämmekö sitä vai emme. Ennenkaikkea näen itse matematiikan ajattelun teknologiana.

Laitoksemme -- joskin yliopistomme ei niitä enää kutsu laitoksiksi, mutta käytän tätä termiä silti koska se kuvastaa yksikköä parhaiten -- sai hiljattain muutaman uuden työntekijän, jotka ovat kanssani vastaavassa asemassa, siis yliopistonlehtoreita. Kumpikin on hyvin osaava ja välittömästi huomasin kahvihuoneen keskustelujen ottavan positiivisen suunnan, ennen kaikkea ajatuksia ja ideoita herättävään suuntaan. Tämä ei tietenkään ole tarkoitus olla huomautus pitkäaikaisempien kollegoiden tylsyydestä, mutta uudet näkökulmat ovat aina virkistäviä. Matematiikassa voi nimittäin painottaa niin kovin erilaisia näkökohtia, ja nämä uudet henkilöt olivat tutkineet asioita jotka olivat itselleni joko uusia tai tuttuja eri näkökulmista.

Erään filosofis-painotteisemman keskustelun lomassa oivalsin jälleen jotain siitä, miten yleisluontoisia työkaluja matematiikassa on onnistuttukaan luomaan. Esimerkkinä tästä otan tässä sisätulon.

Sisätuloavaruus on jokin vektoriavaruus jossa on vektoreiden lisäksi määritelty operaatio nimeltä sisätulo. Jos ette muista mikä vektoriavaruus on, niin kerrataan se ensin: Vektoriavaruus on joukko V, jossa on määritelty joukko erilaisia operaatioita, ja jolle on niinkutsuttu kerroinkunta. Kerroinkunnan alkioita kutsutaan skalaareiksi. Yleensä skalaarit ovat esimerkiksi reaali- tai kompleksilukuja, mutta teorian hienous piilee siinä, ettei ole yhtään mitään väliä, mitä skalaarit ovat, kunhan ne muodostavat kunnan, eli niissä on yhteen-, kerto-, jako-, ja vähennyslasku ja näille neutraalialkiot -- tutummin niitä merkitään 0:lla ja 1:llä, mutta näiden ei tarvitse välttämättä olla reaalilukujen nolla ja yksi.

Vektoriavaruuden alkioita -- vektoreita -- voi laskea yhteen, jolloin tuloksena on uusia vektoreita, ja niitä voi vähentää. Avaruudesta löytyy myös nollavektori, joka on tämän yhteenlaskun neutraalialkio. Vektoreita voi myös kertoa skalaareilla, ja nämä kertolaskut käyttäytyvät kuten odottaa saattaa, nolla-skalaarilla kertominen tuottaa nollavektorin, ja skalaarilla kertominen on distributiivinen vektorien summan yli, eli jos  a ja b ovat skalaareja ja x ja y vektoreita, niin a(x + y) = ax + ay ja (a + b)x = ax + bx.

Sisätulo on vektoriavaruuden operaatio, joka "kertoo" kaksi vektoria yhteen ja sitä merkitään esim  (x,y), ja tulos on jokin skalaari. Sisätulo on lineaarinen operaattori ensimmäisen tulon tekijän suhteen, eli (x + y, z) = (x,z) + (y,z), ja (ax,y) = a(x,y). Lisäksi (x,x) = 0 jos ja vain jos x on nollavektori. Jos kerroinkunta sisältää alikuntanaan reaaliluvut tai vastaavan järjestetyn kunnan (esimerkiksi rationaaliluvut), niin (x,x) on aina ei-negatiinen.  Lisäksi jos kerroinkunnassa on määritelty ns konjugaatti-operaatio, niin sisätulon pitää olla konjugaattisymmetrinen, eli (x,y) = Conj((y,x)). Käytännössä tämä tapahtuu kun kerroinkunta on kompleksinen. Jos kerroinkunta on esimerkiksi reaaliluvut, niin voidaan yleistyksenä ajatella, että reaaliluvun konjugaatti on luku itse.

Näillä määritelmillä sisätulo indusoi aina normin. Tämä voidaan todistaa osoittamalla että (x,x):n neliöjuuri toteuttaa normin aksioomat. Normi on kansanomaisesti ymmärrettävissä "pituudeksi" tai "suuruudeksi". Sisätulo myös indusoi ortogonaalisuuden käsitteen vektoriavaruuteen, eli voimme sanoa että x ja y ovat ortogonaalisia jos kumpikaan ei ole nolla, ja (x,y) = 0.

Olennaista sisätulossa on se, että mikä hyvänsä operaatio joka toteuttaa sen aksioomat on sisätulo, ja kaikki teoria joka sisätulosta on, pätee. Esimerkiksi jos meillä on mielivaltainen mitta-avaruus X, niin sellaiset funktiot X:ltä reaaliluvuille jotka ovat neliöllisesti integroituvia X:n yli, muodostavat sisätuloavaruuden. Sisätulo (f,g) on tällöin integraali funktioiden tulosta avaruuden X yli. Tämä sisätulo on ns. L2-sisätulo (L tulee nimestä "Lebesgue" ja 2 viittaa neliön integroituvuuteen).  Esimerkiksi jos X on jokin äärellinen reaalilukuväli, vaikkapa [-1,1] tms, niin rajoitetut, paloittain jatkuvat funktiot tällä välillä muodostavat L2-avaruuden.

Sisätuloavaruuksien teoria on varsin yksinkertaista, ja voimme sanoa monia asioita sisätuloavaruudesta ja sen kantavektoreista. Kun tietyt topologiset ehdot toteutuvat, voimme käyttää sisätuloa siihen, että löydämme ortogonaalisen joukon vektoreita niin, että jokainen avaruuden vektori voidaan ilmaista tämän joukon vektorien lineaarikombinaationa. Tuttu karteesinen koordinaatisto esimerkiksi perustuu siihen, että voimme jokaisen tasoon piirretyn "nuolen" ilmaista vaaka- ja pystysuunnan avulla. Voimme myös vaihtaa näitä suuntia (esim, kääntämällä paperia) ja löytää miten sama "nuoli" esitetään eri suuntien avulla, esimerkiksi "luode"/"lounas"- suunnassa.

Ja, mainitsemani rajoitettujen, paloittain jatkuvien funktioiden joukko voidaan esittää kompleksisten eksponenttifunktioiden avulla; en mene tässä yksityiskohtiin, sillä niihin menisi liiaksi aikaa ja tilaa. Olennaista on, että voimme osoittaa että tietynlainen sisätulon soveltaminen aivan samalla teoreettisella sapluunalla kuin tason kantavektoreiden vaihtamisessa, on mahdollista myös L2-avaruudessa, ja että kun "kantavektorit" -- siis tietty funktioperhe -- on sopivasti valittu, niin funktio esitetään sen eri pisteissä saamien arvojen sijaan esimerkiksi siinä esiintyvien "taajuuksien" avulla. Tämä tapahtuu ns. Fourier-muunnoksessa.

Se mikä tässä on olennaista, ei ole se miten tällainen muunnos lasketaan tietyssä partikulaarisessa tapauksessa. Olennaista on se, että tässä "teknologiassa" on tavattoman yksinkertaiset rakennusosaset, eli käytännössä sisätulon aksioomat. Kun löydämme keinon esittää sisätulo-operaattori, meidän täytyy vain osoittaa että se toteuttaa nämä aksioomat ja kaikki se, mitä voimme sanoa tutkimastamme ilmiöstä sisätulon avulla pätee.

Tämä abstrahoinnin idea on sama kuin missä hyvänsä teknologiassa. Ei ole mitään merkitystä sillä, onko auton moottorissa pikkiriikkisiä ukkeleita jotka vääntävät kiertokankea jos saavat juoda bensiiniä, vai onko kyseessä bensiinikäyttöinen polttomoottori. Jos auto kulkee kaasua painamalla ja rattia kääntämällä, sillä pääsee perille.

Näin taannoin taas kerran keskustelun siitä, miten alakoulussa opettajat opettavat että 7*3 on eri asia kuin 3*7 ja rankaisevat lapsia kun nämä laskevat "väärin". Kertolaskun abstraktio on juuri siinä, että se on vaihdannainen. On hyvin vahingollista ajattelulle opettaa että epäolennainen asia on "tärkeä oppia". Abstrahointi on muutenkin vaikeaa suurimmalle osalle ihmisistä. Se, että ihmisen luontainen vaisto abstraktioon pyritään tukahduttamaan, on minusta jonkinlainen rikos ihmisyyttä vastaan. Näen toistuvasti ilmiön jo opiskelijoissa: Hyvin lahjakkaita ja fiksuja ihmisiä, joille on ohjelmoitu päähän aivan turhia esteitä ymmärrykselle, pakkomielteenomainen tarve "ymmärtää" eli purkaa abstraktio pienimpiin yksityiskohtiin, sellaisiinkin joilla ei ole mitään väliä.

Toki tämä tarve purkaa on ymmärrettävä. Lapsi haluaa tietää mistä eri asiat rakentuvat. Kuka meistä ei olisi lapsena purkanut heti tilaisuuden saatuaan kaikki elektroniset ja mekaaniset laitteet nähdäkseen miten ne toimivat sisältä? Mutta lapsi tekee tämän itse, vaistomaisesti. Ei häntä siihen suuntaan tarvitse työntää. Ja aivan erityisesti, ketään ei pitäisi rangaista oikein tehdystä ja käytetystä abstraktiosta.

Tiedän että jotkut ovat tästä "eri mieltä". Mutta tämä ei ole mielipideasia. Ihminen joko oppii tai ei opi ajattelemaan abstraktisti.

8 kommenttia:

Ari kirjoitti...

Menee aiheen vierestä; mitä muuten olet mieltä onko matematiikka olemassa ilman ihmisiä vai onko kyseessä ihmismielen tuote (sosiaalinen konstruktio) ?

Sabine Hossenfelder arvosteli Max Tegmarkin kirjan "Our Mathematical Universe" jota hän piti tautologiana:
http://backreaction.blogspot.com/2017/11/book-review-max-tegmark-our.html

Kannattaa lukea kommentit, siellä on Max Tegmark myöskin keskustelemassa.

Tiedemies kirjoitti...

En jaksanut lukea. "World is made of mathematics" on diibadaabaa ja merkityksentöntä merkkijonomössöä.

En usko että "matematiikka on olemassa" on mitenkään merkityksellinen väittämä. Matematiikka on matematiikan tekemistä; Matemaattiset teoriat ovat ajattelun teknologiaa, ne ovat ikään kuin softaa. Onko softaa "oikeasti olemassa", vai onko se vain "bittejä"? Kysymys on minusta mieletön. Onko "kävelyä" oikeasti olemassa? Ihminenhän vain siirtää yhtä jalkaa kerrallaan, kaatuu sen päälle, ja sitten alkaa siirtää toista jalkaa. "Kävely" on nimitys sille, että tätä tehdään enemmän kuin yksi tai kaksi kertaa.

Samalla tavalla "matematiikka" on "olemassa" vain sinä mitä matematiikan käyttäjät ja matemaatikot tekevät. Ei se ole mikään ihmismielen "tuote" sen enempää kuin softa on tietokoneen tuote. Se on emergentti, abstrakti ilmiö.

Ei ole olemassa mitään "oikeaa todellisuutta" tms, tai jos sellainen on (ihmismielestä riippumatta), emme voi sitä koskaan ymmärtää. Asioita tapahtuu, ja me operoimme vain malleilla jotka ovat meidän aivoissamme. Siinä mielessä matematiikka on vain ihmismielen tuote; mutta niin on kaikki muukin, millä me hahmotamme maailmaa.

En pidä tätä tavallaan kovin mielenkiintoisena filosofisena ongelmana, koska olennaista on se, että matematiikka toimii. Sitä kysymystä on paljon pähkäilty, että miksi se toimii. Minä en pidä sitäkään ihan kauhean mystisenä, se toimii koska se on eräänlainen luonnonlaki, eli se on tapa pakata informaatiota niin, että siitä voidaan päätellä myöhemmin jotain vaikka havainnot jne tehtiin jo aiemmin. Tässä mielessä voidaan tietenkin ajatella, että totuudenkaltaisuuden (verisimilitude) mielessä ns todellinen maailma (ihmisestä riippumaton maailma) ainakin muistuttaa matematiikkaa. Mutta tämäkin on vähän että kom sii kom saa, koska jos se nyt vain sattuu olemaan ihmisaivojen kannalta paras tapa jäsentää maailmaa, niin ei se vielä tarkoita että se on universaalisti paras tapa. Me vain emme tiedä paremmasta, ehkä?

Anonyymi kirjoitti...

Arin kysymyksessähän ei ollut kyse siitä, että voimmeko tietää matematiikan olemuksesta, vaan siitä että vaikka emme voi tietää, voimme silti käydä siitä älykästä, mielenkiintoista keskustelua, ja oppia ehkä uusia asioita siitä miten itse ajattelemme ja miten muut ajattelevat.

Ymmärrän kyllä miksi Tiedemies ei halua lukea artikkelia ja reagoi näin ärtyneesti. Hän ei nimittäin siedä ajatusta, että matematiikassa olisi jotain syvällisempää joka olisi tekemisissä todellisuuden perimmäisen olemuksen kanssa, koska hänelle mitään tällaista todellisuutta ei ole olemassa. Hän on pesunkestävä sosiaalis-konstruktivisti, kuten on jo moneen kertaan havaittu.

En ole lukenut kirjaa enkä artikkelia, mutta tulee mieleen Jungin oppilaan Marie-Louise von Franzilta lukemani ajatus, että matemaattinen intuitio ilmiönä vahvistaa sitä käsitystä että matematiikka paljastaa asioita todellisuuden perimmäisestä olemuksesta. Hänhän esitti että numerot (eivät kuitenkaan siinä abstraktissa mielessä kuten miten me koulussa me ne opimme) vastaavat Jungin arkkityyppejä, eli ne ovat niitä rakennuspalikoita joista ajattelumme muodostuu.

Tiedemies kirjoitti...

Ei kyse ole siitä; Vaan siitä, että olen lukenut ja tavannut lukemattomia tällaisia juttuja osana opintojani, suorittanut tieteenfilosofian opintoja jne, lukenut artikkelin toisensa jälkeen, ja niissä kaikissa tuntuu olevan vain kyse sanojen pyörittelystä ilman suurempia merkityksiä.

Uskon että on olemassa "todellisuus" mutta että kaikki yrityksemme esittää siitä jotain, on konstruktiivista.

Catilina 🇷🇺 kirjoitti...

Minä opettajana varmaan juuttuisin tunneiksi ja päiviksi pohdiskelemaan oppilaan kanssa vaihdannaisuutta opetuksen jäädessä täysin hunningolle.

Minä pidin aikoinani funktioita täysin rahvaanomaisina ja halveksuttavina, herrasmiehelle kertakaikkiaan sopimattomina räpellyksinä, vähän niinkuin jotkut vieläkin sarjakuvia Dostojevskin (minä Lukianenkon) rinnalla. Dementia on ilmeisesti uhkaamassa, koska tunnen viehtymystä ryhtyä silmäilemään syvästi aikoinani halveksumaani asiaa.

Tietenkin vasta vallankumouksen jälkeen.

Tiedemies kirjoitti...

Funktio on lopulta abstraktio, joka ilmaisee joukko-opin avulla yhdensuuntaisen riippuvuussuhteen.

Funktio on varsin järeä juuriabstraktio. Tarkoitan tässä, että funktio on varsin inhimillinen ja varsin konkreettisesti hahmotettavissa. Yksinkertainen jaottelu injektiivisiin ja ei-injektiivisiin kuvauksiin toimii esimerkiksi "lukujen" juuriabstraktiona siten, että "laskeminen" voidaan ymmärtää bijektion (eli kaksisuuntaisen injektion) löytämisenä.

Onkin usein tarkoituksenmukaista ajatella, että esimerkiksi luku "2" on abstraktio, joka on yhteistä kaikille niille joukoille joissa on kaksi alkiota; viime kädessä se on nimitys sille, että tunnistamme joukot siten että voimme osoittaa etusormella ja keskisormella kaikkia joukon alkioita. Tämä "osoittaminen" on siis funktio, se on kuvaus f: S -> X, missä S on {etusormi, keskisormi} ja X on jokin joukko. Tämä kuvaus on injektiivinen (eli etu- ja keskisormi osoittavat *eri* asioita) ja surjektiivinen (Kaikkia X:n alkioita osoitetaan jollakin sormella). Luku "2" on siis vain eräänlainen paikannnäyttäjä kaikille mahdollisille tällaisille kuvauksille, ja se kertoo että jos jossain on "2" alkiota, niin voimme aina viitata niihin etu- ja keskisormella.

Tämä on ennenkaikkea konstruktio. Missään ns "todellisessa maailmassa" ei ole kahden alkion joukkoja. Sieltä voidaan toki operationalisoida sellaisia, esimerkiksi poimimalla maasta kaksi kiveä ja asettamalla ne pöydälle. Tällä konstruktiolla "2" on siis operationalisointi joka on varsin säännönmukainen. Lukuunottamatta joitan objekteja kuten vaikkapa saippuakuplia, useimmat objektit pysyvät melko tiiviisti siinä konstruktiossa; Maailma ei ole siis täysin mielivaltainen, vaikka me konstruoimmekin sen näin. On siis jokin "komponentti" josta todellisuus rakentuu, joka rajaa sitä, millaisia konstruktioita on tarkoituksenmukaista käyttää.

Sellainen selitys että "mutta pöydällä on oikeasti kaksi kiveä", on toki mielekäs. Se on *todellisuus*, ja kun kerran olemme hyväksyneet tämän abstraktion, voimme nähdä hyvin hyvin pitkälle mihin se johtaa; Tämä siis synnyttää meille käsityksen siitä, että mallimme vastaa "aitoa todellisuutta", ts. se on totuudenkaltainen.

Tässä ajattelussa ei ole mitään vikaa sinänsä. Mutta ei se muuta sitä tosiasiaa, että luku 2 on konstruktio. Se voi olla hyvin hyvin hyödyllinen konstruktio, ja 1+1 = 2 olla hyvin hyvin hyödyllinen ja melkein aina käytännössä totta, koska voimme melkein aina tunnistaa milloin tätä abstraktiota on tarkoituksenmukaista käyttää ja milloin ei. Jokainen ymmärtää, miksi 1+1 voi olla 1 tai jopa 0, jos yritämme laskea yhteen saippuakuplia. Jokainen ymmärtää, miksi tämä on abstraktiorikko.

Catilina 🇷🇺 kirjoitti...

Minä en erityisemmin pidä liian yleistävistä abstraktioista. En pidä niitä hyödyttöminä tai käyttökelvottomina, usein juurikin päinvastoin, mutta ne ovat usein haitallisia pimittäessään juuri väärällä hetkellä olennaisen. Savua ja peilejä.

Emme saisi unohtaa, että J-mala loi vain kokonaisluvut, ja kaikki muu on ihmisen keksintöä.
Voimme abstrahoida esim. erilaisia ryhmiä, mutta että niillä olisi mielekä merkitys, ne tarvitsevat lukuja, jos niitä halutaan ymmärtää, eikä vaan leikkiä ja taivutella kuin Rubikin kuutioita. Ollakseen ymmärrettävä jossain mielekkäässä mielessä ryhmä tarvitseen jonkinlaisen numeraalisen tuen. Joukon lukuja ja ryhmän voi selittää hyvin ilman symmetriaa, mutta symmetriaa ei voi esittää ilman lukujen tuomista esiin. Symmetria on vaillinaisempi, mutta myös eräässämielessä tarkenpi, kuten suuritehoisempi mikroskooppi.

Juhox kirjoitti...

Sisätulo on hyvä esimerkki abstraktista rakenteesta, joka nousee esiin vähän joka paikassa. Metrinen avaruus on toinen esimerkki, joka auttaa näkemään metsän puilta. Abstraktio kondensoi ja auttaa sisäistämään uutta tietoa nopeasti, esim. opiskelija oppii nopeasti teorian, joka oli alkujaan hajanainen sekä pitkällisen kehittelyn aikaansaannos. Abstraktion yhtenä hyötynä on myös ekvivalenttien teorioiden havaitseminen, esim. kaikki determinantin aksioomat toteuttavat rakenteet johtavat samoihin tuloksiin. Tosin abstrakteja sääntöjä kehitellessä tulee aina pitää jalat tukevasti maassa: saattaa olla, että teorian toteuttavia malleja edustaa tyhjä joukko, eli olemassaolokysymys nousee kummittelemaan aina kun irtaudumme tutuista rakenteista (esim. onko koko determinanttifunktiota edes olemassa?).

"On hyvin vahingollista ajattelulle opettaa että epäolennainen asia on 'tärkeä oppia'."

No mikä nyt sitten on epäolennaista? Onko epäolennaista käsitellä euklidista avaruutta ennen metrisiä avaruuksia tai peräti autistisen abstraktia topologista avaruutta? Taannoinen Uusi matematiikka -kokeilu osoitti kouriintuntuvasti, miten "epäolennaisuuksista" luopuminen voi saada asiat menemään kunnolla päin petäjää. Saattaa siis hyvinkin olla, että useat yliopisto-opiskelijat ajattelevat kuin fysiikan nobelisti Steven Weinberg, joka on todennut olevansa kyvytön oppimaan matematiikkaa, ellei heti ymmärrä sen käytännön hyötyä.

Matematiikan platonistisen olemassaolon pohdiskelu on melko turhaa, sillä kyseessä on "vapaasti" valituista aksioomista ja logiikasta rakentuva tautologioiden pilvilinna, eikä uuden tuloksen löytäminen ole mikään osoitus olemassaolosta. L.E.J Brouwer tosin otti tämän asian vakavasti ja pyrki kiinnittämään matematiikan ihmismieleen: kokemus/intuitio ajan hetkittäisestä kulumisesta vastaa luonnollisten lukujen muodostumista. Tietenkään Brouwer ei hyväksynyt äärettömien lukujoukkojen käyttöä tai epäsuoria todistuksia, jolloin suuri osa modernista matematiikasta lensi roskakoriin. Maailman matematisointi lienee vieläkin hyödyttömämpi ajatusleikki, sillä se vaatisi koko systeemin ulkopuolista tarkastelua.