Mielestäni keskiarvon käytöstä tilastoissa tulisi luopua sillä se ei ota huomioon todennäköisyyttä ja antaa näin aina liian pessimistisiä tuloksia. Miksei käytetä pelkästään mediaania joka antaa realistisempia tuloksia?
miksi käytetään keskiarvoa tilastoissa
15
140
Vastaukset
- 18+4
sori piti mennä matematiikkapalstalle mutta käyhän se näinkin
- 167
Mediaani ei säilytä informaatiota yhtä hyvin kuin keskiarvo? Tai ainakin laskuista tulisi hankalampia, jos keskiarvoa ei käytettäisi?
- 17+10
Keskiarvo on tosiaan laskennallisesti kätevämpi. Jos on vaikkapa luvut 56, 58, 63 ja 67, keskiarvo on yksikäsitteisesti määritettävissä mutta mediaani epämääräisempi. Ja jos on tiedossa keskiarvo ja lukujen lukumäärä ja joukkoon lisätään uusia lukuja, voidaan uusi keskiarvo määrittää helpommin kuin mediaani. Joissakin tapauksissa mediaani on kuvaavampi ja sitä käytetään,
- 13+2
Virheen neliösumma on pienimmillään juuri keskiarvon kohdalla.
Keskiarvo on myös odotuarvo todennäköisyyslaskennassa. - Xenia Onatop
Erilaiset tilastolliset menetelmät perustuvat lähes aivan johonkin kurinalaiseen kvantitatiiviseen (optimaalisuus)kriteeriin. Yksi lukemattomien joukossa on suurimman uskottavuuden menetelmä. Parametrien suurimman uskottavuuden estimaattorit ovat ne arvot, jotka todennäköisimmin generoivat otoksen havainnot, ja gaussiselle ja riippumattomalle datalle se on havaintojen keskiarvo.
Mediaani minimoi absoluuttisen virheen itseisarvon summan, ja sopii esim. impulsiiviselle datalle, esim. ammattiryhmien ansioille tai kuvalle, jossa on vähän voimakkaita (mustia/valkoisia) piikkejä. Mediaanilla on myös optimaalinen influenssifunktio.
Mäkihypyssä tuomaroinnin suhteen käytetään alfa-trimmattua keskiarvoa, joka suodattaa pois puolueellista arvostelukäyttäytymistä.
Paljon on mielenkiintoisia estimaattoreita. Voi kahlata läpi myös neuroverkkoja ja informaatioteoriaa.- Statistician
Niin, klassinen tilastotiedehän on pitkälti normaalijakaumaan perustuvaa, eikä mediaani ole tyhjentävä estimaattori odotusarvolle. Kuitenkin löytyy vaihtoehtona runsaasti jakaumista riippumattomia (ei-parametrisia) menetelmiä.
Kuvailussa mediaania pitäisi ehdottomasti käyttää keskiarvon sijaan, jos jakauma on huomattava vino (tulot, yritysten koko jne.). - 16+16
Statistician kirjoitti:
Niin, klassinen tilastotiedehän on pitkälti normaalijakaumaan perustuvaa, eikä mediaani ole tyhjentävä estimaattori odotusarvolle. Kuitenkin löytyy vaihtoehtona runsaasti jakaumista riippumattomia (ei-parametrisia) menetelmiä.
Kuvailussa mediaania pitäisi ehdottomasti käyttää keskiarvon sijaan, jos jakauma on huomattava vino (tulot, yritysten koko jne.).Enpä tiedä onko aina noin. Otetaan esimerkki. Yritys 1 jossa 51% henkilöstöstä on minimipalkalla ja 49% on asiantuntijoita, päälliköitä ja johtajia joiden palkka on 2-4-kertainen. Ja yritys 2 jossa nuo prosenttiluvut ovat toisinpäin. Silloin mediaaneissa on suuri ero mutta keskiarvot ovat varsin lähellä tosiaan. Esim. kilpailukykyvertailussa tuo keskiarvo on relevantimpi.
- Statistician
16+16 kirjoitti:
Enpä tiedä onko aina noin. Otetaan esimerkki. Yritys 1 jossa 51% henkilöstöstä on minimipalkalla ja 49% on asiantuntijoita, päälliköitä ja johtajia joiden palkka on 2-4-kertainen. Ja yritys 2 jossa nuo prosenttiluvut ovat toisinpäin. Silloin mediaaneissa on suuri ero mutta keskiarvot ovat varsin lähellä tosiaan. Esim. kilpailukykyvertailussa tuo keskiarvo on relevantimpi.
En nyt oikein ymmärtänyt. Mediaani on siis luku, jonka molemmille puolille jää 50 % jakauman tapauksista. Tuossa esimerkissä mediaanipalkka on molemmissa yrityksissä suunnilleen sama, mutta keskiarvot erilaisia sen mukaan, miten tuo ylemmän palkkaluokan 2-4 -kertaisuus on jakautunut.
En kyllä ymmärtänyt sitäkään, mitä tekemistä tuolla on kilpailukyvyn kanssa.
Keskiluvut yleensäkin antavat aika niukan kuvan ilmiöstä. Jos on pää pakastimessa ja jalat kuumassa uunissa, pitäisi olla keskimäärin hyvä olo. Siksi yleensä kuvauksessa käytetään keskilukujen lisäksi hajontalukuja. - 4+18
Statistician kirjoitti:
En nyt oikein ymmärtänyt. Mediaani on siis luku, jonka molemmille puolille jää 50 % jakauman tapauksista. Tuossa esimerkissä mediaanipalkka on molemmissa yrityksissä suunnilleen sama, mutta keskiarvot erilaisia sen mukaan, miten tuo ylemmän palkkaluokan 2-4 -kertaisuus on jakautunut.
En kyllä ymmärtänyt sitäkään, mitä tekemistä tuolla on kilpailukyvyn kanssa.
Keskiluvut yleensäkin antavat aika niukan kuvan ilmiöstä. Jos on pää pakastimessa ja jalat kuumassa uunissa, pitäisi olla keskimäärin hyvä olo. Siksi yleensä kuvauksessa käytetään keskilukujen lisäksi hajontalukuja.Et tosiaan ymmärtänyt. Jos yrityksessä 1 on 51 % henkilöstöstä minimipalkalla, on myös mediaanina minimipalkka. Jos yrityksessä 2 saa 51 % henkilöstöstä minimipalkkaan nähden 2-4-kertaista palkkaa, on myös mediaanipalkka vähintään 2-kertainen minimipalkkaan nähden. Laskepa mediaani ja keskiarvo seuraavista kahdessa tapauksessa. Yrityksessä 1 saa 51 henkilöä 1000 € kuussa ja 49 henkilöä 2000 € kuussa. Yrityksessä 2 saa 49 henkilöä 1000 € kuussa ja 51 henkilöä 2000 € kuussa.
Eli mediaanipalkoissa on noin 2-kertainen ero. Sen sijaan keskiarvot voivat olla lähellä toisiaan, jos tuon palkkahaitarin yläpään jakaumat ovat samankaltaiset. Kilpailukykyvertailussa keskipalkka on relevantimpi, sillä se kertaa henkilöstömäärä kertoo palkkakustannukset. - Statistician
4+18 kirjoitti:
Et tosiaan ymmärtänyt. Jos yrityksessä 1 on 51 % henkilöstöstä minimipalkalla, on myös mediaanina minimipalkka. Jos yrityksessä 2 saa 51 % henkilöstöstä minimipalkkaan nähden 2-4-kertaista palkkaa, on myös mediaanipalkka vähintään 2-kertainen minimipalkkaan nähden. Laskepa mediaani ja keskiarvo seuraavista kahdessa tapauksessa. Yrityksessä 1 saa 51 henkilöä 1000 € kuussa ja 49 henkilöä 2000 € kuussa. Yrityksessä 2 saa 49 henkilöä 1000 € kuussa ja 51 henkilöä 2000 € kuussa.
Eli mediaanipalkoissa on noin 2-kertainen ero. Sen sijaan keskiarvot voivat olla lähellä toisiaan, jos tuon palkkahaitarin yläpään jakaumat ovat samankaltaiset. Kilpailukykyvertailussa keskipalkka on relevantimpi, sillä se kertaa henkilöstömäärä kertoo palkkakustannukset.Olet ymmärtänyt mediaanin väärin. Etsipä kumassakin yrityksessä se palkkamäärä, jonka molemmille puolille jää 50 % henkilöstöstä!
Ihan täsmallinen luku löytyy interpoloimalla. Noilla esimerkkiarvoilla mediaanit eivät poikkea toisistaan merkitsevästi (Mann-Whitneyn U-testi). - 9+9
Statistician kirjoitti:
Olet ymmärtänyt mediaanin väärin. Etsipä kumassakin yrityksessä se palkkamäärä, jonka molemmille puolille jää 50 % henkilöstöstä!
Ihan täsmallinen luku löytyy interpoloimalla. Noilla esimerkkiarvoilla mediaanit eivät poikkea toisistaan merkitsevästi (Mann-Whitneyn U-testi).
- piruharakka
Yritän kertoa sinulle lyhyesti.
Keskiarvo, mediaani ym. tunnusluvut ovat vain numeroita, jotka on laskettu suuresta määrästä dataa. Tavallaan hash -arvoja, jotka eivät kerro oikeasta tilanteesta muuta kuin sen hashin verran.
Tottakai voit käyttää mediaania tai mitä tahansa numeroa kertomaan jotakin suuresta joukosta lukuja mutta ikinä se ei ole yhdenvertainen sen alkuperäisen tulosjoukon kanssa.
Tunnusluvut on vain tarkoitettu tekemään monimutkaisesta (suuresta määrästä dataa) yksinkertaisempi - niiden ei ole tarkoitus (eivätkä ne voi) kertoa koko todellisuutta. - MEDIAANI ÄIJÄ
Erityisesti pituuksissa keskiarvo on huono koska erityisen lyhyitä on enemmän kuin erityisen pitkiä, tämä vääristää tuloksia huomattavasti. Ja siksi esim. suomalaisten peniksen keskipituus on muka joku naurettava 13cm. Miksei näissä voida käyttää sitä mediaania = paljon luotettavampi tulos ilman lisävaivaa? Kukkahattutäditkö vaatineet keskiarvon käyttöä ettei tule tuppikulleille paha mieli?
- harhapolku
Tilastoilla ainakin osataan todistella melkein mitä vaan. Tämä tunnetaan aika yleisesti ajatussuorana: tosi-valhe-tilasto(emävalhe). Tilastojen tulkinta taitaa olla vaikea laji.
- 8+16
"Tottakai voit käyttää mediaania tai mitä tahansa numeroa kertomaan jotakin suuresta joukosta lukuja mutta ikinä se ei ole yhdenvertainen sen alkuperäisen tulosjoukon kanssa."
Riippuu käyttötarkoituksesta. Jos joku vaikkapa tekee selvitystä suomalaisten ansioista ja hän saa eteensä aakkosjärjestyksessä kaikkien suomalaisten verotettavat tulot, ei hän tee niillä mitään, ellei ole laitteita ja taitoa aineiston käsittelemiseksi. Tuossa tilanteessa hän olisi varmaan kiitollinen, jos saisi valmiina aineiston jaettuna väestöryhmiin ja fraktiileihin esim. kymmenyksen välein. Eli liika tietokin voi ongelma.
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
eerikäinen novassa sanoi ei kukaan enää aja manuaalivaihteilla
meillä on 3 autoa talissa ja kaikissa manuaalilaatikot, on meillä vielä tämmöiset vaikka toisin puhutaan.1501596Ilo, joka nousee silmiisi saakka
kun katseemme kohtaavat. Olet energinen, aito, ihana. Välillä tuijotat suoraan silmiini - enkä hämmenny, katson takaisin671586En oikeasti
Tiennyt että sinulla on ollut vaikeuksia ja huonoja aikoja. Olen oikeasti pahoillani, ja olisin myös toiminut eritavoin1311292Jokaisella on omat syntinsä
Minä olisin niin mielelläni sinun. Ehkä joskus viittasitkin siihen. Olet nainen ajatuksissani jatkuvasti ja taidat tietä661286- 421105
- 172948
90-luvulla maa syöksyi lamaan, ja silloinkin oli syypäinä samat tahot kuin nyt
Laman aiheuttajat olivat demarivetoinen virheellinen finanssipolitiikka, sekä ay-liikkeen taipumattomuus tilanteessa mik100890Mä olisin niin iloinen
Jos vielä joskus nähtäis.. Ollaanko tulkittu mies toisiamme väärin?. Kumpikin luuli ettei toinen tykkää, vaikka molemmat60744Olisitko ihminen minulle. Ihan ihminen vain.
Tiedätkö, että saan kyyneleet silmiini, niin syvästi sinua kaipaan. Meidän välillä on jotain todella syvää, kaunista ja42677Vakava varoitus perussuomalaisista!
Keskustan Annika Saarikolta veret seisauttavaa tekstiä, lukekaa uutinen kokonaisuudessaan, tässä siitä maistiainen: ”Ke155656