miksi käytetään keskiarvoa tilastoissa

ihmettelen?

Mielestäni keskiarvon käytöstä tilastoissa tulisi luopua sillä se ei ota huomioon todennäköisyyttä ja antaa näin aina liian pessimistisiä tuloksia. Miksei käytetä pelkästään mediaania joka antaa realistisempia tuloksia?

15

146

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • 18+4

      sori piti mennä matematiikkapalstalle mutta käyhän se näinkin

    • 167

      Mediaani ei säilytä informaatiota yhtä hyvin kuin keskiarvo? Tai ainakin laskuista tulisi hankalampia, jos keskiarvoa ei käytettäisi?

      • 17+10

        Keskiarvo on tosiaan laskennallisesti kätevämpi. Jos on vaikkapa luvut 56, 58, 63 ja 67, keskiarvo on yksikäsitteisesti määritettävissä mutta mediaani epämääräisempi. Ja jos on tiedossa keskiarvo ja lukujen lukumäärä ja joukkoon lisätään uusia lukuja, voidaan uusi keskiarvo määrittää helpommin kuin mediaani. Joissakin tapauksissa mediaani on kuvaavampi ja sitä käytetään,


    • 13+2

      Virheen neliösumma on pienimmillään juuri keskiarvon kohdalla.
      Keskiarvo on myös odotuarvo todennäköisyyslaskennassa.

    • Xenia Onatop

      Erilaiset tilastolliset menetelmät perustuvat lähes aivan johonkin kurinalaiseen kvantitatiiviseen (optimaalisuus)kriteeriin. Yksi lukemattomien joukossa on suurimman uskottavuuden menetelmä. Parametrien suurimman uskottavuuden estimaattorit ovat ne arvot, jotka todennäköisimmin generoivat otoksen havainnot, ja gaussiselle ja riippumattomalle datalle se on havaintojen keskiarvo.

      Mediaani minimoi absoluuttisen virheen itseisarvon summan, ja sopii esim. impulsiiviselle datalle, esim. ammattiryhmien ansioille tai kuvalle, jossa on vähän voimakkaita (mustia/valkoisia) piikkejä. Mediaanilla on myös optimaalinen influenssifunktio.

      Mäkihypyssä tuomaroinnin suhteen käytetään alfa-trimmattua keskiarvoa, joka suodattaa pois puolueellista arvostelukäyttäytymistä.

      Paljon on mielenkiintoisia estimaattoreita. Voi kahlata läpi myös neuroverkkoja ja informaatioteoriaa.

      • Statistician

        Niin, klassinen tilastotiedehän on pitkälti normaalijakaumaan perustuvaa, eikä mediaani ole tyhjentävä estimaattori odotusarvolle. Kuitenkin löytyy vaihtoehtona runsaasti jakaumista riippumattomia (ei-parametrisia) menetelmiä.

        Kuvailussa mediaania pitäisi ehdottomasti käyttää keskiarvon sijaan, jos jakauma on huomattava vino (tulot, yritysten koko jne.).


      • 16+16
        Statistician kirjoitti:

        Niin, klassinen tilastotiedehän on pitkälti normaalijakaumaan perustuvaa, eikä mediaani ole tyhjentävä estimaattori odotusarvolle. Kuitenkin löytyy vaihtoehtona runsaasti jakaumista riippumattomia (ei-parametrisia) menetelmiä.

        Kuvailussa mediaania pitäisi ehdottomasti käyttää keskiarvon sijaan, jos jakauma on huomattava vino (tulot, yritysten koko jne.).

        Enpä tiedä onko aina noin. Otetaan esimerkki. Yritys 1 jossa 51% henkilöstöstä on minimipalkalla ja 49% on asiantuntijoita, päälliköitä ja johtajia joiden palkka on 2-4-kertainen. Ja yritys 2 jossa nuo prosenttiluvut ovat toisinpäin. Silloin mediaaneissa on suuri ero mutta keskiarvot ovat varsin lähellä tosiaan. Esim. kilpailukykyvertailussa tuo keskiarvo on relevantimpi.


      • Statistician
        16+16 kirjoitti:

        Enpä tiedä onko aina noin. Otetaan esimerkki. Yritys 1 jossa 51% henkilöstöstä on minimipalkalla ja 49% on asiantuntijoita, päälliköitä ja johtajia joiden palkka on 2-4-kertainen. Ja yritys 2 jossa nuo prosenttiluvut ovat toisinpäin. Silloin mediaaneissa on suuri ero mutta keskiarvot ovat varsin lähellä tosiaan. Esim. kilpailukykyvertailussa tuo keskiarvo on relevantimpi.

        En nyt oikein ymmärtänyt. Mediaani on siis luku, jonka molemmille puolille jää 50 % jakauman tapauksista. Tuossa esimerkissä mediaanipalkka on molemmissa yrityksissä suunnilleen sama, mutta keskiarvot erilaisia sen mukaan, miten tuo ylemmän palkkaluokan 2-4 -kertaisuus on jakautunut.
        En kyllä ymmärtänyt sitäkään, mitä tekemistä tuolla on kilpailukyvyn kanssa.
        Keskiluvut yleensäkin antavat aika niukan kuvan ilmiöstä. Jos on pää pakastimessa ja jalat kuumassa uunissa, pitäisi olla keskimäärin hyvä olo. Siksi yleensä kuvauksessa käytetään keskilukujen lisäksi hajontalukuja.


      • 4+18
        Statistician kirjoitti:

        En nyt oikein ymmärtänyt. Mediaani on siis luku, jonka molemmille puolille jää 50 % jakauman tapauksista. Tuossa esimerkissä mediaanipalkka on molemmissa yrityksissä suunnilleen sama, mutta keskiarvot erilaisia sen mukaan, miten tuo ylemmän palkkaluokan 2-4 -kertaisuus on jakautunut.
        En kyllä ymmärtänyt sitäkään, mitä tekemistä tuolla on kilpailukyvyn kanssa.
        Keskiluvut yleensäkin antavat aika niukan kuvan ilmiöstä. Jos on pää pakastimessa ja jalat kuumassa uunissa, pitäisi olla keskimäärin hyvä olo. Siksi yleensä kuvauksessa käytetään keskilukujen lisäksi hajontalukuja.

        Et tosiaan ymmärtänyt. Jos yrityksessä 1 on 51 % henkilöstöstä minimipalkalla, on myös mediaanina minimipalkka. Jos yrityksessä 2 saa 51 % henkilöstöstä minimipalkkaan nähden 2-4-kertaista palkkaa, on myös mediaanipalkka vähintään 2-kertainen minimipalkkaan nähden. Laskepa mediaani ja keskiarvo seuraavista kahdessa tapauksessa. Yrityksessä 1 saa 51 henkilöä 1000 € kuussa ja 49 henkilöä 2000 € kuussa. Yrityksessä 2 saa 49 henkilöä 1000 € kuussa ja 51 henkilöä 2000 € kuussa.

        Eli mediaanipalkoissa on noin 2-kertainen ero. Sen sijaan keskiarvot voivat olla lähellä toisiaan, jos tuon palkkahaitarin yläpään jakaumat ovat samankaltaiset. Kilpailukykyvertailussa keskipalkka on relevantimpi, sillä se kertaa henkilöstömäärä kertoo palkkakustannukset.


      • Statistician
        4+18 kirjoitti:

        Et tosiaan ymmärtänyt. Jos yrityksessä 1 on 51 % henkilöstöstä minimipalkalla, on myös mediaanina minimipalkka. Jos yrityksessä 2 saa 51 % henkilöstöstä minimipalkkaan nähden 2-4-kertaista palkkaa, on myös mediaanipalkka vähintään 2-kertainen minimipalkkaan nähden. Laskepa mediaani ja keskiarvo seuraavista kahdessa tapauksessa. Yrityksessä 1 saa 51 henkilöä 1000 € kuussa ja 49 henkilöä 2000 € kuussa. Yrityksessä 2 saa 49 henkilöä 1000 € kuussa ja 51 henkilöä 2000 € kuussa.

        Eli mediaanipalkoissa on noin 2-kertainen ero. Sen sijaan keskiarvot voivat olla lähellä toisiaan, jos tuon palkkahaitarin yläpään jakaumat ovat samankaltaiset. Kilpailukykyvertailussa keskipalkka on relevantimpi, sillä se kertaa henkilöstömäärä kertoo palkkakustannukset.

        Olet ymmärtänyt mediaanin väärin. Etsipä kumassakin yrityksessä se palkkamäärä, jonka molemmille puolille jää 50 % henkilöstöstä!
        Ihan täsmallinen luku löytyy interpoloimalla. Noilla esimerkkiarvoilla mediaanit eivät poikkea toisistaan merkitsevästi (Mann-Whitneyn U-testi).


      • 9+9
        Statistician kirjoitti:

        Olet ymmärtänyt mediaanin väärin. Etsipä kumassakin yrityksessä se palkkamäärä, jonka molemmille puolille jää 50 % henkilöstöstä!
        Ihan täsmallinen luku löytyy interpoloimalla. Noilla esimerkkiarvoilla mediaanit eivät poikkea toisistaan merkitsevästi (Mann-Whitneyn U-testi).

        http://fi.wikipedia.org/wiki/Mediaani


    • piruharakka

      Yritän kertoa sinulle lyhyesti.
      Keskiarvo, mediaani ym. tunnusluvut ovat vain numeroita, jotka on laskettu suuresta määrästä dataa. Tavallaan hash -arvoja, jotka eivät kerro oikeasta tilanteesta muuta kuin sen hashin verran.

      Tottakai voit käyttää mediaania tai mitä tahansa numeroa kertomaan jotakin suuresta joukosta lukuja mutta ikinä se ei ole yhdenvertainen sen alkuperäisen tulosjoukon kanssa.
      Tunnusluvut on vain tarkoitettu tekemään monimutkaisesta (suuresta määrästä dataa) yksinkertaisempi - niiden ei ole tarkoitus (eivätkä ne voi) kertoa koko todellisuutta.

    • MEDIAANI ÄIJÄ

      Erityisesti pituuksissa keskiarvo on huono koska erityisen lyhyitä on enemmän kuin erityisen pitkiä, tämä vääristää tuloksia huomattavasti. Ja siksi esim. suomalaisten peniksen keskipituus on muka joku naurettava 13cm. Miksei näissä voida käyttää sitä mediaania = paljon luotettavampi tulos ilman lisävaivaa? Kukkahattutäditkö vaatineet keskiarvon käyttöä ettei tule tuppikulleille paha mieli?

    • harhapolku

      Tilastoilla ainakin osataan todistella melkein mitä vaan. Tämä tunnetaan aika yleisesti ajatussuorana: tosi-valhe-tilasto(emävalhe). Tilastojen tulkinta taitaa olla vaikea laji.

    • 8+16

      "Tottakai voit käyttää mediaania tai mitä tahansa numeroa kertomaan jotakin suuresta joukosta lukuja mutta ikinä se ei ole yhdenvertainen sen alkuperäisen tulosjoukon kanssa."

      Riippuu käyttötarkoituksesta. Jos joku vaikkapa tekee selvitystä suomalaisten ansioista ja hän saa eteensä aakkosjärjestyksessä kaikkien suomalaisten verotettavat tulot, ei hän tee niillä mitään, ellei ole laitteita ja taitoa aineiston käsittelemiseksi. Tuossa tilanteessa hän olisi varmaan kiitollinen, jos saisi valmiina aineiston jaettuna väestöryhmiin ja fraktiileihin esim. kymmenyksen välein. Eli liika tietokin voi ongelma.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Tollokin tajuaa että Timo Vornanen

      oli joutunut äärimmäiseen tilanteeseen ampuessaa yhden laukauksen katuun. Ei poliisi tee tuollaista hetken mielijohteest
      Maailman menoa
      697
      5619
    2. Istuva kansanedustaja epäiltynä pahoinpitelystä ja ampuma-aserikoksesta

      Seiskan tietojen mukaan Timo Vornanen on epäiltynä pahoinpitelystä ja ampuma-aserikoksesta eikä kenellekään taatusti tul
      Maailman menoa
      480
      3601
    3. Timo Vornanen kilahti

      Mikähän sille kansanedustajalle polisiisi miehelle on noin pahasti mennyt hermot , että tulevaisuudensa pilasi totaalise
      Kotka
      160
      3405
    4. Pullonpalautusjärjestelmä muuttuu - paluu menneisyyteen

      EU suuressa viisaudessaan on päättänyt, että pulloja pitää kierrättää. Jos oikein ymmärsin, nykyisen järjestelmänmme ti
      Maailman menoa
      170
      2633
    5. Sininen farmari - Ford Focus- YFB-842 on poliisilta kadoksissa Kauhajärvellä

      https://alibi.fi/uutiset/poliisilta-poikkeuksellinen-vihjepyynto-autossa-oleva-henkilo-on-avuntarpeessa/?shared=29255-2d
      Lapua
      10
      2439
    6. 270
      2055
    7. Onko oikeudenmukaista? Yhdellä taholla yllättävä valta-asema Tähdet, tähdet -voittajan valinnassa!

      Näinpä, onko sinusta tämä oikein? Viime jaksossakin voittaja selvisi vain yhden äänen erolla ja tänä sunnuntaina ensimm
      Tv-sarjat
      23
      1517
    8. Persukansanedustaja Timo Vornanen ammuskellut Helsingissä

      Poliisi siviiliammatiltaan, luvallinen ase mukana baarissa tällä hemmetin valopääpersulla. Meni eduskunnasta suoraan baa
      Haapavesi
      107
      1442
    9. No kerros nyt nainen

      Kumpi mielestäsi oli se joka väärinkäsitti kaiken? Nyt voi olla jo rehellinen kun koko tilanne on jo lähes haihtunut.
      Ikävä
      100
      1399
    10. Nainen, mietit miten minä jaksan

      En voi hyvin. Nykyään elämäni on lähinnä selviytymistä tunnista ja päivästä toiseen. Usein tulee epävarma olo, että mite
      Ikävä
      89
      1180
    Aihe