Jos Studentin t-jakauman kriittinen arvo on 2.08 (taulukosta), ja aineiston t-arvo on huomattavasti suurempi kuin tämä arvo, niin eikö se tarkoita, että aineisto ei ole jakaumaltaan normaali? Eli sitä ei voi käyttää testeissä, joiden aineiston tulisi olla normaalisti jakautunut?
Kiitän avusta.
Onko aineistoni normaalisti jakautunut?
12
2729
Vastaukset
- Statistician
Mistä ihmeestä revit tuon kriittisen arvon? Jostain aineiston testistä? Se ei kerro muuttujan (aineiston??) normaalijakautuneisuudesta mitään.
Normaalijakauneisuutta voidaan tutkia Kolmogorov-Smirnovin testillä tai χ²-yhteensopivuustestillä (goodness of fit); edellinen löytynee ohjelmistoista useammin, valikkkokohdasta Analyze --->Nonparametric tests tai vastavaa.
Kannattaa muistaa, että testauksessa nollahypoteesena on, ettei jakauma poikkea normaalijakaumasta. Siis mitä suurempi testisuureen arvo (p tai α), sitä todennäköisemmin muuttuja on ainakin likipitäen normaalijakautunut. Suureen arvon pitäisi ylittää valittu merkitsevyystaso (esim. 0.05), mieluiten reilusti.
Koko aineiston normaalijakautuneisuudesta (mitä se sitten lieneekin), siis kaikkien muuttujien (?), ei voi puhua muuten kuin tarkastelemalla kutakin muuttujaa erikseen.- apuatarvitaan
Kiitos vastauksesta!
Studentin t-jakauman taulukosta on kriittinen arvo.
Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).
Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten. - Statistician
apuatarvitaan kirjoitti:
Kiitos vastauksesta!
Studentin t-jakauman taulukosta on kriittinen arvo.
Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).
Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten.Jos muuttujat eivät ole normaalijakautuneita, voit käyttää t-testin sijasta Mann-Whitneyn U-testiä
https://fi.wikipedia.org/wiki/U-testi
U-testi muutenkin kelvollinen vaihtoehto, sillä sen voimaakuus ( kyky hylätä väärä nollahypoteesi) on melko pienilläkin otoksilla n. 95 % = 3/π) t-testin voimakkuudesta.
Keskiarvojen eron merkitsevyydestähän tässä kai on kyse? U-testi löytyy ohjelmistoista Nonparametric tests -valikosta. - apuatarvitaan
Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?
T. Aloittelija - Repe_Sorsa
apuatarvitaan kirjoitti:
Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?
T. AloittelijaNo onhan Statistician yllä esittänyt konstin neuvoineen: testaa Kolmogorov-Smirnovin testillä!
Kiitos muuten S:lle siitä vastauksesta, kun olin ulalla itsekin. miten päätellä normaalijakautuneisuus.
- feafs
Kolmogorov-Smirnov on aika julma testi, ja se tuomitsee jakauman ei-normaaliksi turhan herkästi. Usein käytännössä riittää, että piirtää kuvat joko alkuperäisistä arvoista tai residuaaleista, ja katsoo että ne ovat suunnilleen säännönmukaiset. Samalla näkee myös mahdolliset poikkeavat arvot.
- mutta en yritäkään väittää että tämä olisi aina ja kaikkialla toimiva tapa. Ja varsinkin jos koulutehtävistä on kyse, opettajan mielipide ja tehtävänanto ratkaisee.
- Jos jakauma on vino, epäparametristen testien sijaan voi kokeilla muunnoksia, mutta niissäkin on omat hankaluutensa.- Statiscian
Enpä pitäisi K-S:ää kovin "julmana". Normaalijakautuneisuuden testaamiseen löytyy kymmenkunta testiä ja K-S:n voimakkuus (eli "julmuus) on keskivaiheilla. Voimakkaimmilla testeillä (esim. Shapiro-Wilks, Anderson-Darling) on kuitenkin huomattavia rajoituksia datan suhteen, joten K-S lienee tästä syystä yleisin ohjelmistoissa.
Kiinnität kuitenkin huomiota hyvin tärkeään asiaan: poikkeviin havantoihin. Lievä vinous tai huipukkus ei jakaumassa ole oikestaan kovin tärkeä, mutta juuri poikkevat havainnot (outliers) voivat sotkea koko analyysin. Tällaiset kannattaa karsia otoksesta tai analysoida caseina erikseen, jos mieli käyttää parametrisia menetelmiä. Graafinen tarkastelu on hyvä aluksi.
Kuvitellaan esimerkki, jossa otosyksikköinä ovat Suomen kunnat: Takahikiä, Puutteenperä, Rimpisuo, ..., Helsinki. Muiden kuin Helsingin osalta voi aineistossa olla kahden muuttujan välillä korkea negatiinen korrelaatio, mutta H:n pitäminen analyysissa mukana muuttaa korrelaation heikosti positiiviseksi. Syynä se, että H. poikkeaa lähes kaikilta ominaisuuksilttaan muista Suomen kunnista, sijoittuu siis pistediagrammassa oikeaan yläkulmaan.
Jos käytetään regressioanalyysia, voidaan poikkevat tutkimusyksiköt tietysti ottaa malliin dummy-muuttujina.
- apuatarvitaan
Kiitos kaikille vastauksista. Eiköhän tämä nyt tästä (ja jos ei, niin häiriköin uudestaan).
- kysymys_testeistä
Mitä tarkoittaa parametrittömissä testeissä "two or more independent samples". Kaikki em. testit ovat tuon otsikon alla.
- Statistician
Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!
- kysynminäkin
Statistician kirjoitti:
Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!
Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?
- Statistician
kysynminäkin kirjoitti:
Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?
Esim. hyvä klassinen käytännön opas Siegel: Nonparametric Statistics esittelee seuraavat. Kahdelle otokselle McNemarin testi, merkkitesti, Wilcoxonin testi järjestetyille pareille, Walshin testi ja randomisaatiotesti. k:lle otokselle Cochranin Q-testi ja Friedmanin kaksisuuntainen varianssianalyysi. Noita voi yrittää myös googlettaa.
Muitakin löytyy tukuttain, mutta eiköhän noilla pääse alkuun tavallisimmissa analyysitilanteissa .
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
- 261851
Miksi ihmeessä nainen seurustelit kanssani joskus
Olin ruma silloin ja nykyisin vielä rumempi En voi kuin miettiä että miksi Olitko vain rikki edellisestä suhteesta ja ha221779Heikki Silvennoinen petti vaimoaan vuosien ajan
Viiden lapsen isä Heikki kehuu kirjassaan kuinka paljon on pettänyt vaimoaan vuosien varrella.1161745Persut nimittivät kummeli-hahmon valtiosihteeriksi!
Persujen riveistä löytyi taas uusi törkyturpa valtiosihteeriksi! Jutun perusteella järjenjuoksu on kuin sketsihahmolla.701557Onko ministeri Juuso epäkelpo ministerin tehtäviensä hoitamiseen?
Eikö hänellä ole kompetenttia hoitaa sosiaali- ja terveysministetin toimialalle kuuluvia ministerin tehtäviä?581425Sakarjan kirjan 6. luku
Jolla korva on, se kuulkoon. Sain profetian 22.4.2023. Sen sisältö oli seuraava: Suomeen tulee nälänhätä niin, että se191232Elia tulee vielä
Johannes Kastaja oli Elia, mutta Jeesus sanoi, että Elia tulee vielä. Malakian kirjan profetia Eliasta toteutuu kokonaan361145Nellietä Emmaa ja Amandaa stressaa
Ukkii minnuu Emmaa ja Amandaa stressaa ihan sikana joten voidaanko me koko kolmikko hypätä ukin kainaloon ja syleilyyn k101127- 111108
Avaa sydämesi mulle
❤ ❤❤ Tahdon pelkkää hyvää sulle Sillä ilmeisesti puhumalla Avoimesti välillämme Kaikki taas selviää Kerro kaikki, tahdo361102