tiistai 7. syyskuuta 2010

Epäkorrekti tutkimus II.

OK, ensimmäisen vaiheen regressiot on nyt laskettu. Kerron ensin vähän datasta.

Mukana on 100 maata kaikilta mantereilta. Jokaisesta maasta on kerätty seuraavat tiedot: muslimien osuus populaatiosta, maahanmuuttajien osuus populaatiosta, eurooppalaisten osuus populaatiosta, mustaihoisten (laskin vain afrikkalaiset) osuus, kielellinen diversiteetti, ja leveysaste, jolla maan pääkaupunki sijaitsee. Laskin näistä multiregression, jossa näillä muuttujilla selitetään maan saamaa pistemäärää Newsweekin maavertailussa. Kertoimet, ja p-arvot olivat seuraavat:

const muslim imm. euro afro lang lat.
61.1534 -0.1240 0.28444 0.03742 -0.1063 -0.0087 0.2785
0.0000 0.0001 0.00000 0.23103 0.0003 0.0067 0.0001


EDIT2: Laskin kertoimet uudelleen ja sain kyllä samat arvot, mutta korjasin p-arvot nyt, ja ne ovat nyt oikein. Valitettavasti ohjelmassani oli pahahko virhe. Näyttäisi nyt siis siltä, että kaikki muut kertoimet ovat merkitseviä, paitsi eurooppalaisten määrä. Eurooppalaisten määrä ei ennusta siis tässä regressiossa tilastollisesti merkitsevästi mitään, mutta muut kylläkin. Eniten näyttäisi vaikuttavan leveysaste, sitten maahanmuuttajien määrä (positiivisesti), ja kolmanneksi muslimien osuus populaatiosta.

Koko mallin selitysaste on 0.73, tämä on merkitsevä pyöristysvirheen tarkkuudella.

Teen lisätutkimuksia, esimerkiksi lisään uskonnollisia ryhmittymiä jne. tähän.

13 kommenttia:

Juha Kettunen kirjoitti...

Sinulla on varmaan liikaa aikaa, tai liikaa kofeiinia veressä, tai sekä että.

Minusta tämän kirjoituksen toinen tekstikappale kuulostaa harvinaisen relevantilta epäkorrektin tutkimuksesi ytheydessä.

Otso kirjoitti...

Minusta tuo maahanmuuttajapopulaation kerroin on intuitiivesti juuri se, joka sen pitäisikin olla. Epäieln, että vastakkainen tuntuma voi johtua liiallisesta altistuksesta suomalaiselle diskurssille.

Ihmisethän haluavat tietenkin muuttaa maihin, joissa on hyvä elää, joten näissä maissa loogisesti on suuremmat maahanmuuttajapopulaatiot (tai ainakin niihin muutolle on suurempi kysyntä). Maat, joissa on pieni maahanmuuttajapopulaatio, ovat luultavasti useammmin maita, joista halutaan muuttaa vain pois.

Maahanmuuttajat ovat itsevalikoitunut joukko, toisin kuin muut suureesi (no joo, voihan uskontoakin vaihtaa), joten maahanmuutto voi olla myös elämänlaadun seuraus, eikä vain syy.

Siitä tuo korrelaatio ei sitten tietenkään kerro yhtään mitään, tekevätkö maahanmuuttajat maasta paremman tai huonomman, eikä kertoisi vaikka olisikin tilastollisesti merkittävä.

Tiedemies kirjoitti...

Korostan, että vaikka nämä kertoimet ovat etumerkiltään jotain, niin mikään niistä ei ole tilastollisesti merkittävää nähnytkään. Europidien ja afrikkalaisten osuuksien kertoimet ovat suunnilleen niin tarkalleen nollia kuin vain voi olla.

Ajattelin lisätä tähän uskonnoista vielä katoliset ja ateistit/uskonnottomat. Näiden lisääminen tuskin tuottaa merkitseviä tuloksia, koska edes leveyspiirin kerroin ei ollut tuon merkitsevämpi.

Kumitonttu kirjoitti...

Tässä on läsnä ikuinen tiivistämisen ongelma, jossa moniulotteinen ja jatkuvasti muotoaan muuttava ilmiö yritetään sovittaa yhdellä tunnusluvulla järjestettäväksi suuruusjärjestykseen. Laskelma on tuomittu epäonnistumaan samalla tavalla kuin Tekniikan Maailman Suuri Talviautokisa, jonka voittajan kaiken järjen mukaan pitäisi syödä kaikki muut testissä olleet markkinoilta pois. Vaan eipä syö.

Ihmisillä kun on niin erilaisia tunteita ja järkiperusteita arvostustensa tueksi. Lasten määrä viittaa selvästi "maan hyvyyteen", koska se liittyy uskontoon, naisten koulutustasoon ja yleiseen elintasoon. Voisi kuvitella, että maan itsenäistymisvuosi heijastelisi maan asioiden hoidon perinteitä ja siten hyvyyttä. Kieli poskessa väitän lisäksi, että hyvyys ei riipu etäisyydestä päiväntasaajalta, kuten totesit, vaan etäisyydestä Greenwhichistä.

Koska suurin osa ihmisistä ei pääse vertailemaan omaa tilannettaan muihin maihin saati kulttuureihin, maan hyvyys on älytön mittari. Se on vähän kuin kysyisi, että kuinka paljon sohva muistuttaa on kilometriä. Mutta sehän on toinen juttu se.

Utumies kirjoitti...

Eikö noita musulmaaneja voisi rajat tämän tutkimuksen ulkopuolelle? Entä onko kukaan laskenut, kuinka paljon islaminuskoisten sisällyttäminen tähän tutkimukseen maksaa?

Lisäksi tässä pitäisi nyt taas jaanata niitä raiskaustilastoja jollakin tapaa. Monihan on esimerkiksi sulkenut korvansa siltä tosiseikalta, että maahanmuuttaja on paljon todennäköisempi raiskaaja kohdemaassa verrattuna henkilöön, joka on poistunut kyseisestä maasta. Otitko tämän huomioon?

Loppukaneettina todettakoon,e ttä tilastointi on täysin subjektiivista tiedettä. On kuunnelta kansan kollektiivista ääntä, sitä kumeaa närkästynyttä mouruamista, jonka netti on suuhumme sovittanut.


"There is no such thing as public opinion. There is only published opinion."

- Winston Churchill

Utumies kirjoitti...

Pahoittelen kirjoitusviheriöitä. Syytän niistä kansasta etääntynyttä eliittiä, joka lennähtelee Brysseliin, joka hyysää työkseen kaiken maailman kulien oikeuksia ja jota ei tavallisen veronmaksajan hätä ja ahdinko kiinnosta.

Jos Soini valittaisiin Brysseliin, kaikkihan olisi jo toisin.

Jaska Brown kirjoitti...

Tarkistaisitko lukuarvot kertoimille? Nuo tuossa esiintyvät eivät oikein täsmää sanallisesti luettelemasi listan kanssa, mikäli oikein ymmärsin.

Samaten haluaisin tietää, mitä käytännössä tarkoittaa "leveysasteen imuroiva vaikutus"? Olenko ymmärtänyt oikein, jos sen imuroidessa korrelaation esim. afro-niloottisen väestön osuuden ja hyvinvoinnin välillä olemattomiin johtopäätös on seuraava: Pohjoismaiden leveysasteella sijaitseva afro-nilootikkojen asuttama valtio olisi tyypillinen pohjoismainen hyvinvointivaltio ja keskellä syvintä Afrikkaa sijaitseva skandinaavien asuttama valtio olisi täydellisesti korruptoitunut mädäntynyt persläpi?
Olisi muuten helkutin lohdullista, mikäli näin olisi; sehän osoittaisi että esim. muslimien maahanmuutosta ollaan huolestuttu ihan turhaan.

Toivoisin, että ilmoittaisit kertoimet erikseen a) kaikille sadalle maalle ja b) Suomen viiteryhmälle eli 13 länsieurooppalaiselle maalle. Tämä siksi että tutkittujen muuttujien vaikutuksen erot nimenomaan länsimaissa kiinnostavat.

Sivumennen kysyen, mihin katosi kielellinen diversiteetti muuttujien joukosta?

Kiitos innostuksesta ja arvokkaasta työstä!

Reijo17 kirjoitti...

Hehe, tässä ollaan epäkorrektiuden ytimessä.

Turhaan tosin vaivaudut, sillä suurin osa tutkimuksesi kommentoijista tulee olemaan niillä linjoilla, että tilastollisella päättelyllä ei voida hankkia tietoa, ja että ainoa tapa lisätä ymmärrystä on sanailu, koska vain sanailu (mitä löysempi, sen parempi) pystyy kyseenalaistamaan tutkimuksen lähtöasetelman. Valhe, emävale, tilasto!

Mitkä muuten olivat ne ennakkoluulot, jotka saamasi luvut kumosivat?

Muista myös julkaista data ja ohjelma.

Tiedemies kirjoitti...

Data ei ole kokonaan minun keräämääni, mutta voin sen julkaista, jos Jaskalle sopii. Kuka tahansa voi kerätä samanlaisen datan Newsweekistä, CIA-world factbookista ja wikipediasta. Datan luotettavuus on tietty sitten näiden lähteiden varassa. Kirjoitan tästä vielä uuden merkinnän.

Laskin kertoimet uudelleen R:llä, ja se on ihan yleisesti saatavilla oleva. Se antaa p-arvot samalla, joten taidan käyttää sitä suoraan.

Jaska Brown kirjoitti...

Data on vapaata, anna mennä.

Markku kirjoitti...

Samaten haluaisin tietää, mitä käytännössä tarkoittaa "leveysasteen imuroiva vaikutus"? Olenko ymmärtänyt oikein, jos sen imuroidessa korrelaation esim. afro-niloottisen väestön osuuden ja hyvinvoinnin välillä olemattomiin johtopäätös on seuraava: Pohjoismaiden leveysasteella sijaitseva afro-nilootikkojen asuttama valtio olisi tyypillinen pohjoismainen hyvinvointivaltio ja keskellä syvintä Afrikkaa sijaitseva skandinaavien asuttama valtio olisi täydellisesti korruptoitunut mädäntynyt persläpi?
Olisi muuten helkutin lohdullista, mikäli näin olisi; sehän osoittaisi että esim. muslimien maahanmuutosta ollaan huolestuttu ihan turhaan.


Lähellä päiväntasaajaa on enimmäkseen pohjoiseurooppalaisten perustama ja asuttama valtio, johon on sittemmin muuttanut miljoonia itäaasialaisia. Tuo valtio on nimeltään Australia ja se sijaitsee 10. ja 39. leveysasteiden välissä. Tropiikkiin sen pinta-alasta kuuluu noin puolet, millä alueella on lähes koko Queensland, jossa sijaitsee Brisbanen miljoonakaupunki. Onko Pohjois-Australia läpikorruptoitunut persläpi?

Tiedemies kirjoitti...

Otin mukaan leveysasteen, koska se näyttää selittävän asioita. Esimerkiksi Kiina on parempi paikka elää kuin Bangladesh, ja vielä paremmin, Mexico on parempi kuin Ecuador tai Peru, Kanada parempi kuin USA, Venäjä parempi kuin Kazakhstan, jne.

Jos se on tilastollisesti parempi selittäjä kuin islam, valkoihoisten osuus, jne., niin se näkyy tilastossa; ja näin todellakin on. Yksi aste kohti pohjoista tuo 0.28 pistettä lisää Newsweekin vertailuun, samoin kuin yksi prosentti lisää maahanmuuttajia. Sensijaan yksi prosentti lisää valkoihoisia ei tuo paljoakaan lisää pisteitä, vain 0.03, mutta tässä on hurja hajonta. Yksi prosentti lisää afrikkalaisia vie 0.1 pistettä, tässä hajonta on pienempi.

Luulen, että tämä tutkimus on sikäli arvoton, että afrikkalaisten määrä on merkittävän suuri oikeastaan vain Afrikassa. Etelä-Amerikassa ja USA:ssa prosentit ovat kymmenen luokkaa. Pitäisi oikeastaan katsoa mitä tapahtuu, jos jätämme Afrikan ja Aasian kokonaan pois, koska niissä Afrikkalaisten määrä on joko naurettavan pieni tai naurettavan suuri, ja afrikkalaisten määrä on oikeastaan pääosin vertailu euraasian ja Afrikan välillä.

Markku kirjoitti...

Jos halutaan tutkia afro-nilootikkojen osuuden väestöstä korrelaatiota elämänlaatuun valtiossa, Karinianmeren alue on paras tilastoaineisto, koska tuolla alueella on runsaasti vaihtelua sekä mainitussa osuudessa väestöstä että elämänlaadussa eri valtioissa.