Onko aineistoni normaalisti jakautunut?

apuatarvitaan

Jos Studentin t-jakauman kriittinen arvo on 2.08 (taulukosta), ja aineiston t-arvo on huomattavasti suurempi kuin tämä arvo, niin eikö se tarkoita, että aineisto ei ole jakaumaltaan normaali? Eli sitä ei voi käyttää testeissä, joiden aineiston tulisi olla normaalisti jakautunut?

Kiitän avusta.

12

3196

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • Statistician

      Mistä ihmeestä revit tuon kriittisen arvon? Jostain aineiston testistä? Se ei kerro muuttujan (aineiston??) normaalijakautuneisuudesta mitään.

      Normaalijakauneisuutta voidaan tutkia Kolmogorov-Smirnovin testillä tai χ²-yhteensopivuustestillä (goodness of fit); edellinen löytynee ohjelmistoista useammin, valikkkokohdasta Analyze --->Nonparametric tests tai vastavaa.

      Kannattaa muistaa, että testauksessa nollahypoteesena on, ettei jakauma poikkea normaalijakaumasta. Siis mitä suurempi testisuureen arvo (p tai α), sitä todennäköisemmin muuttuja on ainakin likipitäen normaalijakautunut. Suureen arvon pitäisi ylittää valittu merkitsevyystaso (esim. 0.05), mieluiten reilusti.

      Koko aineiston normaalijakautuneisuudesta (mitä se sitten lieneekin), siis kaikkien muuttujien (?), ei voi puhua muuten kuin tarkastelemalla kutakin muuttujaa erikseen.

      • apuatarvitaan

        Kiitos vastauksesta!
        Studentin t-jakauman taulukosta on kriittinen arvo.

        Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).

        Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten.


      • Statistician
        apuatarvitaan kirjoitti:

        Kiitos vastauksesta!
        Studentin t-jakauman taulukosta on kriittinen arvo.

        Ideana tässä oli, että en voi tehdä tiettyjä testejä aineistollani, jos se ei ole jakaumaltaan normaali. Siis (lainaan oppikirjasta): 1. Normaalijakauma on symmetrinen. 2. Puolet pistemääristä on keskiarvoa (ja mediaania ja moodia) pienempiä ja puolet taas suurempia. 3. Normaalijakauman arvot ovat keskittyneet odotusarvon ympärille. Odotusarvoa paljon pienemmät ja suuremmat arvot ovat harvinaisia. 4. Normaalijakauman määrittelevät parametrit (satunnaismuuttujan odotusarvo; keskihajonta).

        Jakaumatestejä on useampi, nyt pitää keksiä, mikä niistä sopii aineistolleni parhaiten.

        Jos muuttujat eivät ole normaalijakautuneita, voit käyttää t-testin sijasta Mann-Whitneyn U-testiä

        https://fi.wikipedia.org/wiki/U-testi

        U-testi muutenkin kelvollinen vaihtoehto, sillä sen voimaakuus ( kyky hylätä väärä nollahypoteesi) on melko pienilläkin otoksilla n. 95 % = 3/π) t-testin voimakkuudesta.

        Keskiarvojen eron merkitsevyydestähän tässä kai on kyse? U-testi löytyy ohjelmistoista Nonparametric tests -valikosta.


      • apuatarvitaan

        Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?

        T. Aloittelija


      • Repe_Sorsa
        apuatarvitaan kirjoitti:

        Ok! Hyvä tietää. Mutta mistä tiedän, ovatko normalijakautuneita?

        T. Aloittelija

        No onhan Statistician yllä esittänyt konstin neuvoineen: testaa Kolmogorov-Smirnovin testillä!
        Kiitos muuten S:lle siitä vastauksesta, kun olin ulalla itsekin. miten päätellä normaalijakautuneisuus.


    • feafs

      Kolmogorov-Smirnov on aika julma testi, ja se tuomitsee jakauman ei-normaaliksi turhan herkästi. Usein käytännössä riittää, että piirtää kuvat joko alkuperäisistä arvoista tai residuaaleista, ja katsoo että ne ovat suunnilleen säännönmukaiset. Samalla näkee myös mahdolliset poikkeavat arvot.

      - mutta en yritäkään väittää että tämä olisi aina ja kaikkialla toimiva tapa. Ja varsinkin jos koulutehtävistä on kyse, opettajan mielipide ja tehtävänanto ratkaisee.


      - Jos jakauma on vino, epäparametristen testien sijaan voi kokeilla muunnoksia, mutta niissäkin on omat hankaluutensa.

      • Statiscian

        Enpä pitäisi K-S:ää kovin "julmana". Normaalijakautuneisuuden testaamiseen löytyy kymmenkunta testiä ja K-S:n voimakkuus (eli "julmuus) on keskivaiheilla. Voimakkaimmilla testeillä (esim. Shapiro-Wilks, Anderson-Darling) on kuitenkin huomattavia rajoituksia datan suhteen, joten K-S lienee tästä syystä yleisin ohjelmistoissa.

        Kiinnität kuitenkin huomiota hyvin tärkeään asiaan: poikkeviin havantoihin. Lievä vinous tai huipukkus ei jakaumassa ole oikestaan kovin tärkeä, mutta juuri poikkevat havainnot (outliers) voivat sotkea koko analyysin. Tällaiset kannattaa karsia otoksesta tai analysoida caseina erikseen, jos mieli käyttää parametrisia menetelmiä. Graafinen tarkastelu on hyvä aluksi.

        Kuvitellaan esimerkki, jossa otosyksikköinä ovat Suomen kunnat: Takahikiä, Puutteenperä, Rimpisuo, ..., Helsinki. Muiden kuin Helsingin osalta voi aineistossa olla kahden muuttujan välillä korkea negatiinen korrelaatio, mutta H:n pitäminen analyysissa mukana muuttaa korrelaation heikosti positiiviseksi. Syynä se, että H. poikkeaa lähes kaikilta ominaisuuksilttaan muista Suomen kunnista, sijoittuu siis pistediagrammassa oikeaan yläkulmaan.

        Jos käytetään regressioanalyysia, voidaan poikkevat tutkimusyksiköt tietysti ottaa malliin dummy-muuttujina.


    • apuatarvitaan

      Kiitos kaikille vastauksista. Eiköhän tämä nyt tästä (ja jos ei, niin häiriköin uudestaan).

    • kysymys_testeistä

      Mitä tarkoittaa parametrittömissä testeissä "two or more independent samples". Kaikki em. testit ovat tuon otsikon alla.

      • Statistician

        Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!


      • kysynminäkin
        Statistician kirjoitti:

        Samaa kuin parametrisissa. Tyypillinen esimerkki riippuvista otoksista (related, non-independent) on muutoksen merkitsevyyden tarkastelu samassa perusjoukossa, usein samassa otoksessa, ajan kuluessa tai koekäsittelyn jälkeen. Riippuville otoksille on kylllä lukuisia ei-parametrisia testejä!

        Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?


      • Statistician
        kysynminäkin kirjoitti:

        Mitä parametrittömiä testejä sitten näille riippuville otoksille oikein on?

        Esim. hyvä klassinen käytännön opas Siegel: Nonparametric Statistics esittelee seuraavat. Kahdelle otokselle McNemarin testi, merkkitesti, Wilcoxonin testi järjestetyille pareille, Walshin testi ja randomisaatiotesti. k:lle otokselle Cochranin Q-testi ja Friedmanin kaksisuuntainen varianssianalyysi. Noita voi yrittää myös googlettaa.
        Muitakin löytyy tukuttain, mutta eiköhän noilla pääse alkuun tavallisimmissa analyysitilanteissa .


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Oi mun haniseni

      Mul on ihan törkee ikävä sua. En jaksais tätä enää. Oon odottanut niin kauan, mutta vielä pitää sitä tehdä. Tekis mieli
      Ikävä
      30
      5792
    2. Kyllä mulla on sua ikävä

      Teen muita juttuja, mutta kannan sua mielessäni mukana. Oot ensimmäinen ajatus aamulla ja viimeinen illalla. Välissä läm
      Ikävä
      14
      4364
    3. Hei rakas sinä

      Vaikka käyn täällä vähemmän, niin ikäväni on pahempaa. Pelkään että olen ihan hukassa😔 mitä sinä ajattelet? naiselle
      Tunteet
      40
      3237
    4. IS:n tiedot: Toni Immonen irtisanottiin MTV:ltä Toni Immonen työskenteli pitkään MTV:llä.

      IS:n tiedot: Toni Immonen irtisanottiin MTV:ltä Toni Immonen työskenteli pitkään MTV:llä. IS uutisoi torstaina Toni Imm
      Maailman menoa
      52
      2951
    5. Israel aloitti 3. maailmansodan

      https://www.is.fi/ulkomaat/art-2000011297979.html Israel se sitten aloitti näköjään kolmannen maailmansodan.
      Maailman menoa
      339
      1549
    6. Vihdoin tiedän että tämä on molemminpuolista

      Saattoi se koko ajan olla silmiemme edessä mutta kumpikaan ei uskaltanut sitä toivoa. Kunpa nähtäisiin pian, toivottavas
      Ikävä
      86
      1338
    7. Haluaisin lähettää sulle viestin

      Mutta en enää uskalla. Miehelle.
      Ikävä
      62
      1276
    8. Nainen, meidän talossa on säännöt

      1. Mies on aina oikeassa. 2. Ei vastaväitteitä. 3. Mäkättäminen kielletty. 4. Suhde on tärkein. 5. Ei salaisuuksia. 6. E
      Ikävä
      232
      1206
    9. Miellytänkö sinun silmää?

      Varmaan ainakin vähän, jos tykkäät minusta. Siis jos tykkäät.
      Ikävä
      79
      1169
    10. Natoon liittyminen on alkanut kaduttaa.

      Nato on muuttunut niin paljon, että se ei ole enää se mihin haluttiin liittyä. Usa on vetäytynyt ja 5% osuus valtion tul
      Maailman menoa
      401
      1161
    Aihe