Vanha sanonta sanoo, "vale, emävale, tilasto" olen täsmälleen tätä mieltä.
Tilastotieteen luennoitsija päivitti myös toista vanhaa sanontaa perin osuvasti lausahduksellaan: "Hyvä kuva kertoo enemmän kun tuhat sanaa ja huonolla kuvalla voi valehdella enemmän kun tuhannella sanalla".
Minulla ei sinällään ole mitään kuvia ja tilastoja vastaan, parhammillaan ne ovat erittäin havainnollisia ja mielenkiintoisia. Ongelma astuu kuvaan siinä vaiheessa kun niitä päästetään laatimaan tilastotieteilijä. Oppimateriaalissamme sanotaan mm. että:
"Pylväsdiagrammissa pylväiden välinen etäisyys tulee mieluusti olla 25-50% pylvään leveydestä"
Kaikella kunnioituksella, mutta mitä helkkarin merkitystä sillä raon leveydellä on kunhan siellä sellainen on? Lisäksi nuista on ohjeita ties vaikka kuinka paljon kaiken muunkin pikkusälän määrittämiseksi.
Pylväsdiagrammi on huono ja paha ja kamala tapa esittää asioita, mutta esimerkiksi ruko-lehtikuvio on ihan hyvä eritysmuoto asioille. Hetkinen... Ajatellaanpa huvikseen, etä meillä on arvoja välillä 30-50 vaikkapa seuraavasti: 30,30,31,31,35,36,37,37,38,39,39,40,40,41,42,43,44,44,45,45,46,47,47,50
Muodostetaanpa niistä huvikseen runkolehtikuvio käyttäen 2 rivin runkoa runkona 10 pistettä ja lehtenä 1piste. Esitys näyttää joltiseltaankin tältä.
3 0011
3 5677899
4 0012344
4 55677
5 0
Minusta tuo esitys ei ole järin havainnoillistava, saati selkeä. No, ehkä tilastotieteilijät ovat eri mieltä.
Piirakkadiagrammi, se vanha ja rakas värikäs ja ainakin minusta kohtullisen toimiva kun pitää vain saada suunnilleen suhteet selviksi jostain asiasta. No se ei ole hyvä koska se perustuu pinta-alaan, siinä ei saisi käyttää yli 6 osaa (mikä on sinällään hyvä) ja muutenkin se on epätarkka ja huono koska se on piirakkadiagrammi. Sen sijaan tilastotieteilijät tuntuvat rakastavan histogrammeja. Nehän siis ovat niitä pylväsdiagrammeja joissa pylväiden välillä ei ole väliä (joten sille välille ei ole sen kummempia prosenttirajoja, se on 0% ja sillä siisti) ja miten histogrammi eroaa pylväsdiagrammista? Siten, että siinäkin pelataan pinta-aloilla. (Piirakkadiagrammissa pahapaha, mutta histogrammissa hyvähyvä.) Ja ettei homma kävisi turhan helpoksi histogrammin ala-asteikko voidaan merkitä ainakin kolmella tavalla, lisäksi, ettei sen piirtäminen suinkaan olisi helppoa ja yksinkertaista täytyy pylväiden pituus ja korkeus määrittää laskemalla korjattu frekvenssi aineistoille joiden luokittelu ei ole tasavälistä. Sitten ynnäillään ja lasketaan ja saadaan tulokseksi kuva jossa on eri levyisiä ja eri korkuisia pylväitä ja joista ei ymmärrä yhtään mitään ellei niiden tulkitsemiseksi ole käynyt tilastotieteiden peruskurssia. Tässä on syy, miksen pidä tilastotieteistä oppiaineena.
Sitten se syy miksi juuri nyt kiehun raivosta ihan vaan yhdelle tilastotieteilijälle on se, että minulla on (kuten joku ehkä tietää) tuo selkä siinä määrin saamarin kipeä, etten ole kamalasti takamustani tuolla yliopiston puolela viimeaikoina kuluttanut. Siksipä olen koitanut ottaa selville nuita opiskeluasioita käymällä jututtamassa kurssien pitäjiä. No tuon tilastotieteen kurssinkin kohdalla kävin niin tekemässä ja kyselemässä juttuja tuolta kurssin vastuuhenkilöltä. Sain vastauksia, mutta tänään minulle selvisi sellainen pieni ja mukava asia, että tuohon kurssiin kuuluu laskuharjoituksia. (Tämä asia ei tullut yllätyksenä, olin tietoinen asiasta.) Ja niissä vaaditaan aktiivista läsnäoloa ja niissä on läsnäolopakko (tämä sensijaan tuli täysin puun takaa). No, en ole niitä harjoitustehtäviä saanut, niitä ei jaettu laskuharjoituksissa ja olen ollut poissa niistä jo kaksi viikkoa. Tämä kaikki siis tuli minulle täysin yllätyksenä kun takamukseni ensimmäistä kertaa ko. harjoituksiin raahasin tänään. Ja minä kävin henkilökohtaisesti kysymässä nuista kurssin suorittamiseen liittyvistä asioista siltä kurssin vetäjältä. Voitte ehkä uskoa, että olin varsin hyvällä tuulella juteltuani hetken sen laskuharjoitusten pitäjän kanssa. Toisten harjoitusten (joita siis ei edes ollut siellä laskuharjoitustilaisuudessa, että olisin niitä voinut siellä laskea ne on jaettu luennolla) palautus on 5 minuutin päästä, minä en ole palauttanut niitä ja se saattaa siis kaataa koko pahuksen kurssin suorittamisen. (Tuo kurssi on aavistuksen turha iso suoritettavaksi loppukokeella.) Aion kyllä käydä vaihtamassa pari sanaa sen vastuuhenkilön kanssa, ajattelin lisäksi spämmiä sen postilaatikkoa tänään nuilla laskuharjoitustehtävilä jotka sain pitkän etsimisen jälkeen hankittua itselleni. Minulla on skanneri kotonani, ne piti palauttaa perjantaina, eikä kukaan ole kernonut minulle MITEN ja MISSÄ ne pitää palauttaa... Kjäh kjäh.