Jos Studentin t-jakauman kriittinen arvo on 2.08 (taulukosta), ja aineiston t-arvo on huomattavasti suurempi kuin tämä arvo, niin eikö se tarkoita, että aineisto ei ole jakaumaltaan normaali? Eli sitä ei voi käyttää testeissä, joiden aineiston tulisi olla normaalisti jakautunut?
Kiitän avusta.
Onko aineistoni normaalisti jakautunut?
12
2735
Vastaukset
- Statistician
Mistä ihmeestä revit tuon kriittisen arvon? Jostain aineiston testistä? Se ei kerro muuttujan (aineiston??) normaalijakautuneisuudesta mitään.
Normaalijakauneisuutta voidaan tutkia Kolmogorov-Smirnovin testillä tai χ²-yhteensopivuustestillä (goodness of fit); edellinen löytynee ohjelmistoista useammin, valikkkokohdasta Analyze --->Nonparametric tests tai vastavaa.
Kannattaa muistaa, että testauksessa nollahypoteesena on, ettei jakauma poikkea normaalijakaumasta. Siis mitä suurempi testisuureen arvo (p tai α), sitä todennäköisemmin muuttuja on ainakin likipitäen normaalijakautunut. Suureen arvon pitäisi ylittää valittu merkitsevyystaso (esim. 0.05), mieluiten reilusti.
Koko aineiston normaalijakautuneisuudesta (mitä se sitten lieneekin), siis kaikkien muuttujien (?), ei voi puhua muuten kuin tarkastelemalla kutakin muuttujaa erikseen.- apuatarvitaan
Kiitos vastauksesta!
Studentin t-jakauman taulukosta on kriittinen arvo.
Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).
Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten. - Statistician
apuatarvitaan kirjoitti:
Kiitos vastauksesta!
Studentin t-jakauman taulukosta on kriittinen arvo.
Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).
Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten.Jos muuttujat eivät ole normaalijakautuneita, voit käyttää t-testin sijasta Mann-Whitneyn U-testiä
https://fi.wikipedia.org/wiki/U-testi
U-testi muutenkin kelvollinen vaihtoehto, sillä sen voimaakuus ( kyky hylätä väärä nollahypoteesi) on melko pienilläkin otoksilla n. 95 % = 3/π) t-testin voimakkuudesta.
Keskiarvojen eron merkitsevyydestähän tässä kai on kyse? U-testi löytyy ohjelmistoista Nonparametric tests -valikosta. - apuatarvitaan
Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?
T. Aloittelija - Repe_Sorsa
apuatarvitaan kirjoitti:
Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?
T. AloittelijaNo onhan Statistician yllä esittänyt konstin neuvoineen: testaa Kolmogorov-Smirnovin testillä!
Kiitos muuten S:lle siitä vastauksesta, kun olin ulalla itsekin. miten päätellä normaalijakautuneisuus.
- feafs
Kolmogorov-Smirnov on aika julma testi, ja se tuomitsee jakauman ei-normaaliksi turhan herkästi. Usein käytännössä riittää, että piirtää kuvat joko alkuperäisistä arvoista tai residuaaleista, ja katsoo että ne ovat suunnilleen säännönmukaiset. Samalla näkee myös mahdolliset poikkeavat arvot.
- mutta en yritäkään väittää että tämä olisi aina ja kaikkialla toimiva tapa. Ja varsinkin jos koulutehtävistä on kyse, opettajan mielipide ja tehtävänanto ratkaisee.
- Jos jakauma on vino, epäparametristen testien sijaan voi kokeilla muunnoksia, mutta niissäkin on omat hankaluutensa.- Statiscian
Enpä pitäisi K-S:ää kovin "julmana". Normaalijakautuneisuuden testaamiseen löytyy kymmenkunta testiä ja K-S:n voimakkuus (eli "julmuus) on keskivaiheilla. Voimakkaimmilla testeillä (esim. Shapiro-Wilks, Anderson-Darling) on kuitenkin huomattavia rajoituksia datan suhteen, joten K-S lienee tästä syystä yleisin ohjelmistoissa.
Kiinnität kuitenkin huomiota hyvin tärkeään asiaan: poikkeviin havantoihin. Lievä vinous tai huipukkus ei jakaumassa ole oikestaan kovin tärkeä, mutta juuri poikkevat havainnot (outliers) voivat sotkea koko analyysin. Tällaiset kannattaa karsia otoksesta tai analysoida caseina erikseen, jos mieli käyttää parametrisia menetelmiä. Graafinen tarkastelu on hyvä aluksi.
Kuvitellaan esimerkki, jossa otosyksikköinä ovat Suomen kunnat: Takahikiä, Puutteenperä, Rimpisuo, ..., Helsinki. Muiden kuin Helsingin osalta voi aineistossa olla kahden muuttujan välillä korkea negatiinen korrelaatio, mutta H:n pitäminen analyysissa mukana muuttaa korrelaation heikosti positiiviseksi. Syynä se, että H. poikkeaa lähes kaikilta ominaisuuksilttaan muista Suomen kunnista, sijoittuu siis pistediagrammassa oikeaan yläkulmaan.
Jos käytetään regressioanalyysia, voidaan poikkevat tutkimusyksiköt tietysti ottaa malliin dummy-muuttujina.
- apuatarvitaan
Kiitos kaikille vastauksista. Eiköhän tämä nyt tästä (ja jos ei, niin häiriköin uudestaan).
- kysymys_testeistä
Mitä tarkoittaa parametrittömissä testeissä "two or more independent samples". Kaikki em. testit ovat tuon otsikon alla.
- Statistician
Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!
- kysynminäkin
Statistician kirjoitti:
Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!
Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?
- Statistician
kysynminäkin kirjoitti:
Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?
Esim. hyvä klassinen käytännön opas Siegel: Nonparametric Statistics esittelee seuraavat. Kahdelle otokselle McNemarin testi, merkkitesti, Wilcoxonin testi järjestetyille pareille, Walshin testi ja randomisaatiotesti. k:lle otokselle Cochranin Q-testi ja Friedmanin kaksisuuntainen varianssianalyysi. Noita voi yrittää myös googlettaa.
Muitakin löytyy tukuttain, mutta eiköhän noilla pääse alkuun tavallisimmissa analyysitilanteissa .
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
- 1313787
Katso: Ohhoh! Miina Äkkijyrkkä sai käskyn lähteä pois Farmi-kuvauksista -Kommentoi asiaa: "En ole.."
Tämä oli shokkiyllätys. Oliko tässä kyse tosiaan siitä, että Äkkijyrkkä sanoi asioita suoraan vai mistä.... Tsemppiä, Mi973439- 172478
Kyllä poisto toimii
Esitin illan suussa kysymyksen, joka koska palstalla riehuvaa häirikköä ja tiedustelin, eikö sitä saa julistettua pannaa281861"Joka miekkaan tarttuu, se siihen hukkuu"..
"Joka miekkaan tarttuu, se siihen hukkuu".. Näin puhui jo aikoinaan Jeesus, kun yksi hänen opetuslapsistaan löi miekalla231714Haluan jutella kanssasi Nainen
Olisiko jo aika tavata ja avata tunteemme...On niin paljon asioita joihin molemmat ehkä haluaisimme saada vastaukset...O151589Poliisiauto Omasp:n edessä parkissa
Poliisiauto oli parkissa monta tuntia Seinäjoen konttorin edessä tänään. Haettiinko joku tai jotain pankista tutkittavak191565Haluan tavata Sinut Rakkaani.
Olen valmis Kaikkeen kanssasi...Tulisitko vastaa Rakkaani...Olen todella valmistautunut tulevaan ja miettinyt tulevaisuu291496Onko mies niin,
että sinulle ei riitä yksi nainen? Minulle suhde tarkoittaa sitoutumista, tosin eihän se vankila saa olla kummallekaan.181471Hermo mennyt sotealueeseen?
Nyt hammaslääkäriaika peruttiin neljännen kerran. Perumiset alkoi tammikuussa. Nyt uusi aika elokuulle!????861436