Onko aineistoni normaalisti jakautunut?

apuatarvitaan

Jos Studentin t-jakauman kriittinen arvo on 2.08 (taulukosta), ja aineiston t-arvo on huomattavasti suurempi kuin tämä arvo, niin eikö se tarkoita, että aineisto ei ole jakaumaltaan normaali? Eli sitä ei voi käyttää testeissä, joiden aineiston tulisi olla normaalisti jakautunut?

Kiitän avusta.

12

2729

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • Statistician

      Mistä ihmeestä revit tuon kriittisen arvon? Jostain aineiston testistä? Se ei kerro muuttujan (aineiston??) normaalijakautuneisuudesta mitään.

      Normaalijakauneisuutta voidaan tutkia Kolmogorov-Smirnovin testillä tai χ²-yhteensopivuustestillä (goodness of fit); edellinen löytynee ohjelmistoista useammin, valikkkokohdasta Analyze --->Nonparametric tests tai vastavaa.

      Kannattaa muistaa, että testauksessa nollahypoteesena on, ettei jakauma poikkea normaalijakaumasta. Siis mitä suurempi testisuureen arvo (p tai α), sitä todennäköisemmin muuttuja on ainakin likipitäen normaalijakautunut. Suureen arvon pitäisi ylittää valittu merkitsevyystaso (esim. 0.05), mieluiten reilusti.

      Koko aineiston normaalijakautuneisuudesta (mitä se sitten lieneekin), siis kaikkien muuttujien (?), ei voi puhua muuten kuin tarkastelemalla kutakin muuttujaa erikseen.

      • apuatarvitaan

        Kiitos vastauksesta!
        Studentin t-jakauman taulukosta on kriittinen arvo.

        Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).

        Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten.


      • Statistician
        apuatarvitaan kirjoitti:

        Kiitos vastauksesta!
        Studentin t-jakauman taulukosta on kriittinen arvo.

        Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).

        Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten.

        Jos muuttujat eivät ole normaalijakautuneita, voit käyttää t-testin sijasta Mann-Whitneyn U-testiä

        https://fi.wikipedia.org/wiki/U-testi

        U-testi muutenkin kelvollinen vaihtoehto, sillä sen voimaakuus ( kyky hylätä väärä nollahypoteesi) on melko pienilläkin otoksilla n. 95 % = 3/π) t-testin voimakkuudesta.

        Keskiarvojen eron merkitsevyydestähän tässä kai on kyse? U-testi löytyy ohjelmistoista Nonparametric tests -valikosta.


      • apuatarvitaan

        Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?

        T. Aloittelija


      • Repe_Sorsa
        apuatarvitaan kirjoitti:

        Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?

        T. Aloittelija

        No onhan Statistician yllä esittänyt konstin neuvoineen: testaa Kolmogorov-Smirnovin testillä!
        Kiitos muuten S:lle siitä vastauksesta, kun olin ulalla itsekin. miten päätellä normaalijakautuneisuus.


    • feafs

      Kolmogorov-Smirnov on aika julma testi, ja se tuomitsee jakauman ei-normaaliksi turhan herkästi. Usein käytännössä riittää, että piirtää kuvat joko alkuperäisistä arvoista tai residuaaleista, ja katsoo että ne ovat suunnilleen säännönmukaiset. Samalla näkee myös mahdolliset poikkeavat arvot.

      - mutta en yritäkään väittää että tämä olisi aina ja kaikkialla toimiva tapa. Ja varsinkin jos koulutehtävistä on kyse, opettajan mielipide ja tehtävänanto ratkaisee.


      - Jos jakauma on vino, epäparametristen testien sijaan voi kokeilla muunnoksia, mutta niissäkin on omat hankaluutensa.

      • Statiscian

        Enpä pitäisi K-S:ää kovin "julmana". Normaalijakautuneisuuden testaamiseen löytyy kymmenkunta testiä ja K-S:n voimakkuus (eli "julmuus) on keskivaiheilla. Voimakkaimmilla testeillä (esim. Shapiro-Wilks, Anderson-Darling) on kuitenkin huomattavia rajoituksia datan suhteen, joten K-S lienee tästä syystä yleisin ohjelmistoissa.

        Kiinnität kuitenkin huomiota hyvin tärkeään asiaan: poikkeviin havantoihin. Lievä vinous tai huipukkus ei jakaumassa ole oikestaan kovin tärkeä, mutta juuri poikkevat havainnot (outliers) voivat sotkea koko analyysin. Tällaiset kannattaa karsia otoksesta tai analysoida caseina erikseen, jos mieli käyttää parametrisia menetelmiä. Graafinen tarkastelu on hyvä aluksi.

        Kuvitellaan esimerkki, jossa otosyksikköinä ovat Suomen kunnat: Takahikiä, Puutteenperä, Rimpisuo, ..., Helsinki. Muiden kuin Helsingin osalta voi aineistossa olla kahden muuttujan välillä korkea negatiinen korrelaatio, mutta H:n pitäminen analyysissa mukana muuttaa korrelaation heikosti positiiviseksi. Syynä se, että H. poikkeaa lähes kaikilta ominaisuuksilttaan muista Suomen kunnista, sijoittuu siis pistediagrammassa oikeaan yläkulmaan.

        Jos käytetään regressioanalyysia, voidaan poikkevat tutkimusyksiköt tietysti ottaa malliin dummy-muuttujina.


    • apuatarvitaan

      Kiitos kaikille vastauksista. Eiköhän tämä nyt tästä (ja jos ei, niin häiriköin uudestaan).

    • kysymys_testeistä

      Mitä tarkoittaa parametrittömissä testeissä "two or more independent samples". Kaikki em. testit ovat tuon otsikon alla.

      • Statistician

        Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!


      • kysynminäkin
        Statistician kirjoitti:

        Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!

        Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?


      • Statistician
        kysynminäkin kirjoitti:

        Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?

        Esim. hyvä klassinen käytännön opas Siegel: Nonparametric Statistics esittelee seuraavat. Kahdelle otokselle McNemarin testi, merkkitesti, Wilcoxonin testi järjestetyille pareille, Walshin testi ja randomisaatiotesti. k:lle otokselle Cochranin Q-testi ja Friedmanin kaksisuuntainen varianssianalyysi. Noita voi yrittää myös googlettaa.
        Muitakin löytyy tukuttain, mutta eiköhän noilla pääse alkuun tavallisimmissa analyysitilanteissa .


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Taasko se show alkaa

      Koo osottaa taas mieltään
      Ikävä
      26
      1851
    2. Miksi ihmeessä nainen seurustelit kanssani joskus

      Olin ruma silloin ja nykyisin vielä rumempi En voi kuin miettiä että miksi Olitko vain rikki edellisestä suhteesta ja ha
      Ikävä
      22
      1779
    3. Heikki Silvennoinen petti vaimoaan vuosien ajan

      Viiden lapsen isä Heikki kehuu kirjassaan kuinka paljon on pettänyt vaimoaan vuosien varrella.
      Kotimaiset julkkisjuorut
      116
      1745
    4. Persut nimittivät kummeli-hahmon valtiosihteeriksi!

      Persujen riveistä löytyi taas uusi törkyturpa valtiosihteeriksi! Jutun perusteella järjenjuoksu on kuin sketsihahmolla.
      Perussuomalaiset
      70
      1557
    5. Onko ministeri Juuso epäkelpo ministerin tehtäviensä hoitamiseen?

      Eikö hänellä ole kompetenttia hoitaa sosiaali- ja terveysministetin toimialalle kuuluvia ministerin tehtäviä?
      Perussuomalaiset
      58
      1425
    6. Sakarjan kirjan 6. luku

      Jolla korva on, se kuulkoon. Sain profetian 22.4.2023. Sen sisältö oli seuraava: Suomeen tulee nälänhätä niin, että se
      Profetiat
      19
      1232
    7. Elia tulee vielä

      Johannes Kastaja oli Elia, mutta Jeesus sanoi, että Elia tulee vielä. Malakian kirjan profetia Eliasta toteutuu kokonaan
      Helluntailaisuus
      36
      1145
    8. Nellietä Emmaa ja Amandaa stressaa

      Ukkii minnuu Emmaa ja Amandaa stressaa ihan sikana joten voidaanko me koko kolmikko hypätä ukin kainaloon ja syleilyyn k
      Isovanhempien jutut
      10
      1127
    9. Söpö lutunen oot

      Kaipaan aina vaan, vaikkakin sitten yksipuolisesti.
      Ikävä
      11
      1108
    10. Avaa sydämesi mulle

      ❤ ❤❤ Tahdon pelkkää hyvää sulle Sillä ilmeisesti puhumalla Avoimesti välillämme Kaikki taas selviää Kerro kaikki, tahdo
      Ikävä
      36
      1102
    Aihe