Onko aineistoni normaalisti jakautunut?

apuatarvitaan

Jos Studentin t-jakauman kriittinen arvo on 2.08 (taulukosta), ja aineiston t-arvo on huomattavasti suurempi kuin tämä arvo, niin eikö se tarkoita, että aineisto ei ole jakaumaltaan normaali? Eli sitä ei voi käyttää testeissä, joiden aineiston tulisi olla normaalisti jakautunut?

Kiitän avusta.

12

2735

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • Statistician

      Mistä ihmeestä revit tuon kriittisen arvon? Jostain aineiston testistä? Se ei kerro muuttujan (aineiston??) normaalijakautuneisuudesta mitään.

      Normaalijakauneisuutta voidaan tutkia Kolmogorov-Smirnovin testillä tai χ²-yhteensopivuustestillä (goodness of fit); edellinen löytynee ohjelmistoista useammin, valikkkokohdasta Analyze --->Nonparametric tests tai vastavaa.

      Kannattaa muistaa, että testauksessa nollahypoteesena on, ettei jakauma poikkea normaalijakaumasta. Siis mitä suurempi testisuureen arvo (p tai α), sitä todennäköisemmin muuttuja on ainakin likipitäen normaalijakautunut. Suureen arvon pitäisi ylittää valittu merkitsevyystaso (esim. 0.05), mieluiten reilusti.

      Koko aineiston normaalijakautuneisuudesta (mitä se sitten lieneekin), siis kaikkien muuttujien (?), ei voi puhua muuten kuin tarkastelemalla kutakin muuttujaa erikseen.

      • apuatarvitaan

        Kiitos vastauksesta!
        Studentin t-jakauman taulukosta on kriittinen arvo.

        Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).

        Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten.


      • Statistician
        apuatarvitaan kirjoitti:

        Kiitos vastauksesta!
        Studentin t-jakauman taulukosta on kriittinen arvo.

        Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).

        Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten.

        Jos muuttujat eivät ole normaalijakautuneita, voit käyttää t-testin sijasta Mann-Whitneyn U-testiä

        https://fi.wikipedia.org/wiki/U-testi

        U-testi muutenkin kelvollinen vaihtoehto, sillä sen voimaakuus ( kyky hylätä väärä nollahypoteesi) on melko pienilläkin otoksilla n. 95 % = 3/π) t-testin voimakkuudesta.

        Keskiarvojen eron merkitsevyydestähän tässä kai on kyse? U-testi löytyy ohjelmistoista Nonparametric tests -valikosta.


      • apuatarvitaan

        Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?

        T. Aloittelija


      • Repe_Sorsa
        apuatarvitaan kirjoitti:

        Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?

        T. Aloittelija

        No onhan Statistician yllä esittänyt konstin neuvoineen: testaa Kolmogorov-Smirnovin testillä!
        Kiitos muuten S:lle siitä vastauksesta, kun olin ulalla itsekin. miten päätellä normaalijakautuneisuus.


    • feafs

      Kolmogorov-Smirnov on aika julma testi, ja se tuomitsee jakauman ei-normaaliksi turhan herkästi. Usein käytännössä riittää, että piirtää kuvat joko alkuperäisistä arvoista tai residuaaleista, ja katsoo että ne ovat suunnilleen säännönmukaiset. Samalla näkee myös mahdolliset poikkeavat arvot.

      - mutta en yritäkään väittää että tämä olisi aina ja kaikkialla toimiva tapa. Ja varsinkin jos koulutehtävistä on kyse, opettajan mielipide ja tehtävänanto ratkaisee.


      - Jos jakauma on vino, epäparametristen testien sijaan voi kokeilla muunnoksia, mutta niissäkin on omat hankaluutensa.

      • Statiscian

        Enpä pitäisi K-S:ää kovin "julmana". Normaalijakautuneisuuden testaamiseen löytyy kymmenkunta testiä ja K-S:n voimakkuus (eli "julmuus) on keskivaiheilla. Voimakkaimmilla testeillä (esim. Shapiro-Wilks, Anderson-Darling) on kuitenkin huomattavia rajoituksia datan suhteen, joten K-S lienee tästä syystä yleisin ohjelmistoissa.

        Kiinnität kuitenkin huomiota hyvin tärkeään asiaan: poikkeviin havantoihin. Lievä vinous tai huipukkus ei jakaumassa ole oikestaan kovin tärkeä, mutta juuri poikkevat havainnot (outliers) voivat sotkea koko analyysin. Tällaiset kannattaa karsia otoksesta tai analysoida caseina erikseen, jos mieli käyttää parametrisia menetelmiä. Graafinen tarkastelu on hyvä aluksi.

        Kuvitellaan esimerkki, jossa otosyksikköinä ovat Suomen kunnat: Takahikiä, Puutteenperä, Rimpisuo, ..., Helsinki. Muiden kuin Helsingin osalta voi aineistossa olla kahden muuttujan välillä korkea negatiinen korrelaatio, mutta H:n pitäminen analyysissa mukana muuttaa korrelaation heikosti positiiviseksi. Syynä se, että H. poikkeaa lähes kaikilta ominaisuuksilttaan muista Suomen kunnista, sijoittuu siis pistediagrammassa oikeaan yläkulmaan.

        Jos käytetään regressioanalyysia, voidaan poikkevat tutkimusyksiköt tietysti ottaa malliin dummy-muuttujina.


    • apuatarvitaan

      Kiitos kaikille vastauksista. Eiköhän tämä nyt tästä (ja jos ei, niin häiriköin uudestaan).

    • kysymys_testeistä

      Mitä tarkoittaa parametrittömissä testeissä "two or more independent samples". Kaikki em. testit ovat tuon otsikon alla.

      • Statistician

        Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!


      • kysynminäkin
        Statistician kirjoitti:

        Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!

        Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?


      • Statistician
        kysynminäkin kirjoitti:

        Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?

        Esim. hyvä klassinen käytännön opas Siegel: Nonparametric Statistics esittelee seuraavat. Kahdelle otokselle McNemarin testi, merkkitesti, Wilcoxonin testi järjestetyille pareille, Walshin testi ja randomisaatiotesti. k:lle otokselle Cochranin Q-testi ja Friedmanin kaksisuuntainen varianssianalyysi. Noita voi yrittää myös googlettaa.
        Muitakin löytyy tukuttain, mutta eiköhän noilla pääse alkuun tavallisimmissa analyysitilanteissa .


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. 131
      3787
    2. Katso: Ohhoh! Miina Äkkijyrkkä sai käskyn lähteä pois Farmi-kuvauksista -Kommentoi asiaa: "En ole.."

      Tämä oli shokkiyllätys. Oliko tässä kyse tosiaan siitä, että Äkkijyrkkä sanoi asioita suoraan vai mistä.... Tsemppiä, Mi
      Tv-sarjat
      97
      3439
    3. Voi kun mies rapsuttaisit mua sieltä

      Saisit myös sormiisi ihanan tuoksukasta rakkauden mahlaa.👄
      Ikävä
      17
      2478
    4. Kyllä poisto toimii

      Esitin illan suussa kysymyksen, joka koska palstalla riehuvaa häirikköä ja tiedustelin, eikö sitä saa julistettua pannaa
      80 plus
      28
      1861
    5. "Joka miekkaan tarttuu, se siihen hukkuu"..

      "Joka miekkaan tarttuu, se siihen hukkuu".. Näin puhui jo aikoinaan Jeesus, kun yksi hänen opetuslapsistaan löi miekalla
      Yhteiskunta
      23
      1714
    6. Haluan jutella kanssasi Nainen

      Olisiko jo aika tavata ja avata tunteemme...On niin paljon asioita joihin molemmat ehkä haluaisimme saada vastaukset...O
      Ikävä
      15
      1589
    7. Poliisiauto Omasp:n edessä parkissa

      Poliisiauto oli parkissa monta tuntia Seinäjoen konttorin edessä tänään. Haettiinko joku tai jotain pankista tutkittavak
      Seinäjoki
      19
      1565
    8. Haluan tavata Sinut Rakkaani.

      Olen valmis Kaikkeen kanssasi...Tulisitko vastaa Rakkaani...Olen todella valmistautunut tulevaan ja miettinyt tulevaisuu
      Ikävä
      29
      1496
    9. Onko mies niin,

      että sinulle ei riitä yksi nainen? Minulle suhde tarkoittaa sitoutumista, tosin eihän se vankila saa olla kummallekaan.
      Tunteet
      18
      1471
    10. Hermo mennyt sotealueeseen?

      Nyt hammaslääkäriaika peruttiin neljännen kerran. Perumiset alkoi tammikuussa. Nyt uusi aika elokuulle!????
      70 plus
      86
      1436
    Aihe