Päättely Kruskall-Wallisin testim perusteella

Gradupähkinä

Olen tehnyt Kruskall-Wallisin testejä aineistolle, jossa esim testaan ikäluokkien erilaisia arvioita mielipideasteikolliselle muuttujalle (1-5). Ryhmiä on siis useita (esimerkiksi siis nuoret, keski-ikäiset ja vanhat. Esimerkki nuorten keskiarvo on 4,28, keski-ikäisten 4,08 ja vanhojen 3,72. KW : p on 0,030 eli merkitsevä.
Miten siis päättelen mikä/mitkä ryhmät eroavat tilastollisesti merkitsevästi? Voinko väittää, että testin perusteella niin nuoret, keski-ikäiset kuin vanhat eroavat keskenään tyytyväisyydessään vai siis mitä tuosta voi siis päätellä?

23

291

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • näinkai

      An ole statisti, mutta muistaakseni seuraavaa selitettiin tilastotieteen peruskurssilla:

      Kruskallin–Wallisin testissä pitää laskea otosten lukumäärä k (>2) ja testisuureen arvoa verrataan khii^2(k-1)-jakaumasta saatuun lukemaan. Eri ryhmät vertaillaan monivertailun avulla. Jos p-arvo on pienempi kuin valittu taso, niin nollahypoteesi hylätään.

    • Statistician

      Vaitoehtoinen hypoteesi on, että ainakin joku (mediaani)arvoista poikkeaa muista. Ääripäät tässä siis ainakin poikkevat. Muut parittaiset vertailut voi tehdä esim. Mann-Whitneyn U-testillä.

      • Gradupähkinä

        Eli rautalangasta vääntäen aina kuin p on merkitsevä, niin tilastollisesti merkitsevä ero on vähintään alimman keskiarvon ja ylimmän keskiarvon saaneiden ryhmien välillä? Esimerkissä siis nuorilla ja vanhoilla on eroa, keski-ikäisten kohdalla tarvii testata lisää.


      • Statistician
        Gradupähkinä kirjoitti:

        Eli rautalangasta vääntäen aina kuin p on merkitsevä, niin tilastollisesti merkitsevä ero on vähintään alimman keskiarvon ja ylimmän keskiarvon saaneiden ryhmien välillä? Esimerkissä siis nuorilla ja vanhoilla on eroa, keski-ikäisten kohdalla tarvii testata lisää.

        Näin juuri.


      • Gradupähkinä
        Statistician kirjoitti:

        Näin juuri.

        Kiitos!


      • Gradupähkinä

        Löysinkin SPSS:stä tuon pairwise comparisons -toiminnon, jolla voi nuo parivertailut tehdä. Mielenkiintoista, että K-W näyttää merkitsevää, mutta parivertailussa yksikään adj. sig arvo ei taas ole merkitsevä. Ilmeisesti sitten niin, että pienimmän adj sig arvon saava pari eroaa. Jos eroaa nekään.


      • Statistician
        Gradupähkinä kirjoitti:

        Löysinkin SPSS:stä tuon pairwise comparisons -toiminnon, jolla voi nuo parivertailut tehdä. Mielenkiintoista, että K-W näyttää merkitsevää, mutta parivertailussa yksikään adj. sig arvo ei taas ole merkitsevä. Ilmeisesti sitten niin, että pienimmän adj sig arvon saava pari eroaa. Jos eroaa nekään.

        Valistunut arvaukseni on, että parewise käyttää parametrista t-testivertailua, joka on nirsompi kuin ei-parametrinen K-W.

        Kun merkitsevyystaso K-W:llä oli kuitenkin niinkin hyvä kuin 0.03, ja etenkään jos jakaumat eivät ole kovin normaalisia, suosittelisin pysymään ei-parametrisella puolella ja tekemään parivertailut Mann-Whitney:lla (jonka voimakkuus, siis kyky hylätä väärä nollahypoteesi, on yli 90 % t-testin voimakkuudesta).


      • Gradupähkinä
        Statistician kirjoitti:

        Valistunut arvaukseni on, että parewise käyttää parametrista t-testivertailua, joka on nirsompi kuin ei-parametrinen K-W.

        Kun merkitsevyystaso K-W:llä oli kuitenkin niinkin hyvä kuin 0.03, ja etenkään jos jakaumat eivät ole kovin normaalisia, suosittelisin pysymään ei-parametrisella puolella ja tekemään parivertailut Mann-Whitney:lla (jonka voimakkuus, siis kyky hylätä väärä nollahypoteesi, on yli 90 % t-testin voimakkuudesta).

        Kiitos, kommenttisi oli kiinnostava. Muuallakin on ollut keskustelua Mann-Whitneyn käyttämisestä ko .tilanteessa, mutta sitten "yleensä" ilmeisesti tyydytään siihen mitä SPSS puskee ulos omasta parivertailustaan. Tosiaan tilastotieteen ymmärrykseni ole mikään erityinen vahvuuteni :) Alan harvoja kvanttipuolen graduja lukiessa yksikään kirjoittaja ei kirjoita parivertailuista mitään, vaikka K-W:tä on käyttänyt. Todettu tosiaan esim, että " X sai suurimman keskiarvon ja siten eroaa muista ryhmistä". En kyllä teknisesti äkkiseltään keksi, miten tuon Mann-Whitneyn voisi tehdä SPSS:llä, joka automaattisesti nakuttaa parametrittomat testit sapluunansa mukaan. Ehkä ennätän tutustua aiheeseen.


      • matikisti

        Tuota, miksi sinun pitäisi välttämättä käyttää SPSS:ää jos et osaa? Esimerkiksi R:llä Mann-Whitney menee suokelin näppärästi kolmella rivillä:

        > a = c(30, 32, 33, 33,36,37,40,44)
        > b = c(27, 29, 31, 34, 34, 35,41,12,324,34,4,-2.4)
        > wilcox.test(a,b, alternative="less", correct=TRUE)

        Wilcoxon rank sum test with continuity correction

        data: a and b
        W = 64, p-value = 0.8989
        alternative hypothesis: true location shift is less than 0

        Warning message:
        In wilcox.test.default(a, b, alternative = "less", correct = TRUE) :
        cannot compute exact p-value with ties
        >


      • Gradupähkinä
        matikisti kirjoitti:

        Tuota, miksi sinun pitäisi välttämättä käyttää SPSS:ää jos et osaa? Esimerkiksi R:llä Mann-Whitney menee suokelin näppärästi kolmella rivillä:

        > a = c(30, 32, 33, 33,36,37,40,44)
        > b = c(27, 29, 31, 34, 34, 35,41,12,324,34,4,-2.4)
        > wilcox.test(a,b, alternative="less", correct=TRUE)

        Wilcoxon rank sum test with continuity correction

        data: a and b
        W = 64, p-value = 0.8989
        alternative hypothesis: true location shift is less than 0

        Warning message:
        In wilcox.test.default(a, b, alternative = "less", correct = TRUE) :
        cannot compute exact p-value with ties
        >

        Kiitän vinkistä. Syy SPSS- riippuvuuteen on siis ihan vain se, että mistään muusta ei ole hajua ja osaamista siis vieläkin vähemmän kuin SPSS:stä. R:stä en ole koskaan kuullutkaan, mutta googlettelemallahan sitä löytää.


      • Statistician
        Gradupähkinä kirjoitti:

        Kiitän vinkistä. Syy SPSS- riippuvuuteen on siis ihan vain se, että mistään muusta ei ole hajua ja osaamista siis vieläkin vähemmän kuin SPSS:stä. R:stä en ole koskaan kuullutkaan, mutta googlettelemallahan sitä löytää.

        Eikös se Mann-Whitney löydy sieltä Nonparametric-valikosta? Näin muistelen, kun itselläni ei juuri nyt ole koneella SPSS:ää, vain sen sen vaatimattomampi vastine PSPP Linuxille.


      • Gradupähkinä
        Statistician kirjoitti:

        Eikös se Mann-Whitney löydy sieltä Nonparametric-valikosta? Näin muistelen, kun itselläni ei juuri nyt ole koneella SPSS:ää, vain sen sen vaatimattomampi vastine PSPP Linuxille.

        Juu kyllähän se M-W tuolta SPSS:stä on poimittavissa, ja eiköhän sieltä löydy vielä joku valikko, miten parivertailutkin sais tehtyä muuttujalla, jossa useampi luokka. Nyt iski vielä epäusko, että miten päin mäkiä oonkaan tekemässä jos siis yritän saada selvyyttä siihen vaikuttaako asiakkaan oma käytös ja henkilökunnan käytös asiakkaan luottamukseen. Alun perin siis aattelin muodostaa Likert 1-5 mittariston perusteella esim passiiviset ja aktiiviset asiakkaat / henkilökunta ja testata U:lla eroja luottamuksessa( kyllä, osittainen luottamus, ei). Mutta hiipi epäilys, että oon hahmottanut riippuvat ja riippumattomat tilanteet väärin..


      • Statistician
        Gradupähkinä kirjoitti:

        Juu kyllähän se M-W tuolta SPSS:stä on poimittavissa, ja eiköhän sieltä löydy vielä joku valikko, miten parivertailutkin sais tehtyä muuttujalla, jossa useampi luokka. Nyt iski vielä epäusko, että miten päin mäkiä oonkaan tekemässä jos siis yritän saada selvyyttä siihen vaikuttaako asiakkaan oma käytös ja henkilökunnan käytös asiakkaan luottamukseen. Alun perin siis aattelin muodostaa Likert 1-5 mittariston perusteella esim passiiviset ja aktiiviset asiakkaat / henkilökunta ja testata U:lla eroja luottamuksessa( kyllä, osittainen luottamus, ei). Mutta hiipi epäilys, että oon hahmottanut riippuvat ja riippumattomat tilanteet väärin..

        Minulle tulee nyt sellainen fiilis, että graduntekosi menee melkoiseksi hakuammunnaksi. Kehottaisin yli 500 gradua/diplomityötä ohjanneena tekemään koko aineistolle analyysisuunnitelman ja pysymään siinä:
        a) Mitä riippuvuuksia ja eroja haluat selvittää
        b) Mitkä ovat soveliaat tilastolliset analyysimenetelmät

        Sellaisista testiä joka samalla kertaa testaisi useiden ryhmien keskiarvojen tai mediaanien erojen merkitsevyyden pareittain, ei ole. Kuten aiemmin kerroin, K-W:ssa (ja ANOVASSA) nollahypoteesi on, että keskiluvat ovat yhtä suuret ja vaihtoehtoinen hytpoteesi, että joku poikkeaa muista. Saman voi tehdä pareittain M-W:lla tai parametrisessa tapauksessa t-testeillä.


      • matikisti
        Statistician kirjoitti:

        Minulle tulee nyt sellainen fiilis, että graduntekosi menee melkoiseksi hakuammunnaksi. Kehottaisin yli 500 gradua/diplomityötä ohjanneena tekemään koko aineistolle analyysisuunnitelman ja pysymään siinä:
        a) Mitä riippuvuuksia ja eroja haluat selvittää
        b) Mitkä ovat soveliaat tilastolliset analyysimenetelmät

        Sellaisista testiä joka samalla kertaa testaisi useiden ryhmien keskiarvojen tai mediaanien erojen merkitsevyyden pareittain, ei ole. Kuten aiemmin kerroin, K-W:ssa (ja ANOVASSA) nollahypoteesi on, että keskiluvat ovat yhtä suuret ja vaihtoehtoinen hytpoteesi, että joku poikkeaa muista. Saman voi tehdä pareittain M-W:lla tai parametrisessa tapauksessa t-testeillä.

        "Sellaisista testiä joka samalla kertaa testaisi useiden ryhmien keskiarvojen tai mediaanien erojen merkitsevyyden pareittain, ei ole."

        Miksei tämä toimisi? https://en.wikipedia.org/wiki/Tukey's_range_test


      • Statistician
        matikisti kirjoitti:

        "Sellaisista testiä joka samalla kertaa testaisi useiden ryhmien keskiarvojen tai mediaanien erojen merkitsevyyden pareittain, ei ole."

        Miksei tämä toimisi? https://en.wikipedia.org/wiki/Tukey's_range_test

        . OK, perun puheeni , mutta en ihan kokonaan ;-).Tukey'n testistä oli aikoinaan keskustelua alan lehdissä. Sehän on itse asiassa sama kuin parittain tehdyt t-testit. Kun ne "niputetaan yhteen" Tukey'n tavalla, seuraa kova vaatimus: ryhmien varianssien pitäisi olla yhtä suuria. Tämä on käytännössä melkoisen utopistista. Silmiini, ei ole sattunut analyysia, siitä, miten herkkä testi on tämän vaatimuksen rikkomiselle.


      • matikisti

        Ahaa. Mukava oppia uutta. Joku Googlaamalla vastaan tullut sivu sanoo, että Gamesin–Howellin testissä varianssien yhtäsuuruutta ei tarvita, mutta mulla ei ole mitään kokemusta tästä.


      • Statistician
        matikisti kirjoitti:

        Ahaa. Mukava oppia uutta. Joku Googlaamalla vastaan tullut sivu sanoo, että Gamesin–Howellin testissä varianssien yhtäsuuruutta ei tarvita, mutta mulla ei ole mitään kokemusta tästä.

        Tämä ketju nyt menee ihan vituralleen, jos tarkoitus on auttaa aloittajaa gradunteossa, kun käytössä on SPSS.

        Games & Howell toimii, kun ryhmiä on max kolme, mutta kuten testin kehittäjät itse toteavat alkuperäisen artikkelinsa abstraktissa "Satisfactotory control with unequal n's of three and up is dubious even with this statistic. Vaadittaisiin siis ryhmiltä samaa otoskokoa. Muistaakseni Tukey lähti juuri eliminoimaan tätä vaatimusta, mutta tuloksena oli vaatimus yhtäsuurista variansseista.

        Ohjelmistopaketteihin on yleensä valittu käytännössä käyttökelposia testejä. Kaikenlaisia, toki usein teoreettisesti mielenkiintoisia, kehitelmiä kyllä löytyy lähes ---> oo. Itsekin olen selalista joskus harrastanut, jopa suppealla menestyksellä.


      • matikisti

        Mutta jos ohjelmistopaketista ei löydy oikeaa testiä, on vaihdettava ohjelmistoa ja tarvittaessa kehitettävä itse oikea testi.


      • Staticician
        matikisti kirjoitti:

        Mutta jos ohjelmistopaketista ei löydy oikeaa testiä, on vaihdettava ohjelmistoa ja tarvittaessa kehitettävä itse oikea testi.

        Ja höpö-höpö, esim. SPSS:stä löytyy kaikki tarpeellinen gradua tekevän aloittajan ongelmiin.


    • munmielipide

      Ei graduja tehdä keskustelupalstojen avulla. Ohjaaja on sitä varten, että häneltä voi kysyä apua.

      • Statistician

        Niin, periaatteessa olen samaa mieltä. Pitäisikin lähettää lasku ohjajalle! Vaikuttaa, että aloittaja on kauppatieteilijä, ja siellä ei proffatasoa myöten ole aina kvantitatiivisten analyysimenetelmien tuntemus ihan huipputasoa.

        En tämäntyyppisissä töissä kuitenkaan pidä nettiapua epäsopivana. Menetelmät ovat vain apuvälineitä, ja niiden käytössä voi kyllä auttaa. Gradun kokonaisarvon pitäisi kyllä määrittyä ensisijaisesti muilla perusteilla, kunhan menetelmien kanssa ei tee mitään täystöppäilyjä.


    • Gradupähkinä

      Ymmärrän kyllä kommentit siitä, että voi vaikuttaa hieman epätoivoiselta tehdä graduaan keskustelupalstalla huutelemalla. Mutta toisaalta ajattelen, että ei tämä sen kummempaa ole kuin kysyä vinkkiä kaverilta, joka tietää kenties paremmin. Ja kyllä, olen tietoinen metodikirjallisuuden olemassa olosta ja olen myös lukenut niitä. En tokikaan oleta, että kukaan täällä nyt työstäni sinänsä ottaa vastuuta kuin minä itse. Otan kiitoksella vastaan kaikki kommentit, jos joku haluaa kommentoida.

      Ja mitä tulee ohjaukseen, niin olen saanut vain kommentit siitä, että tutkija elää valintojen maailmassa. Totta sekin, mutta omaa työtäni ko. kommentti ei kuitenkaan suuresti selkeyttänyt varsinkin, kun opetuksessa skipattiin kvanttipuoli, koska proffa ei asiasta halunnut porukkaa tentityttää. Kommentteja annetaan sitten esitarkastuksessa, jos tarvetta. Ikävää vain, jos siihen asti tehty homma on sitten ihan väärin. Mutta varmasti omassakin asenteessa on korjattavaa ja duunia tehtävä. Ja madallettava varmaankin rimaa sellaiselle tasolle, jonka ymmärtää.

      • ei-tilastotieteilijä

        Vinkkejä voi kai pyytää mistä vaan. On kuitenkin omalla vastuullasi luottaa vinkkeihin ja tehdä analyysi oikein. Kaikissa lähteissä voi olla virheitä, niin keskustelupalstoilla kuin artikkeleissa. Joku voi jopa yrittää huijata täällä tahallaan. Toivottavasti osaat opetella valitsemasi testin teorian niin hyvin, että pystyt luottamaan tulokseen ja että tarvittava testi soveltuu käyttötarkoitukseesi. Mutta jos opettelen tilastotiedettä syvällisesti gradua tehdessäsi, pystyt varmaankin itsekin pättelemään, onko tilastollinen analyysi tehty ihan väärin.

        Kaikkihan me elämme valintojen maailmassa. Jos emme, olisi aika moni asia jo automatisoitu.


    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Heikki Silvennoinen petti vaimoaan vuosien ajan

      Viiden lapsen isä Heikki kehuu kirjassaan kuinka paljon on pettänyt vaimoaan vuosien varrella.
      Kotimaiset julkkisjuorut
      146
      2591
    2. Taasko se show alkaa

      Koo osottaa taas mieltään
      Ikävä
      24
      1986
    3. Miksi ihmeessä nainen seurustelit kanssani joskus

      Olin ruma silloin ja nykyisin vielä rumempi En voi kuin miettiä että miksi Olitko vain rikki edellisestä suhteesta ja ha
      Ikävä
      23
      1968
    4. Persut nimittivät kummeli-hahmon valtiosihteeriksi!

      Persujen riveistä löytyi taas uusi törkyturpa valtiosihteeriksi! Jutun perusteella järjenjuoksu on kuin sketsihahmolla.
      Perussuomalaiset
      89
      1776
    5. Onko ministeri Juuso epäkelpo ministerin tehtäviensä hoitamiseen?

      Eikö hänellä ole kompetenttia hoitaa sosiaali- ja terveysministetin toimialalle kuuluvia ministerin tehtäviä?
      Perussuomalaiset
      67
      1530
    6. Sakarjan kirjan 6. luku

      Jolla korva on, se kuulkoon. Sain profetian 22.4.2023. Sen sisältö oli seuraava: Suomeen tulee nälänhätä niin, että se
      Profetiat
      20
      1306
    7. Avaa sydämesi mulle

      ❤ ❤❤ Tahdon pelkkää hyvää sulle Sillä ilmeisesti puhumalla Avoimesti välillämme Kaikki taas selviää Kerro kaikki, tahdo
      Ikävä
      37
      1202
    8. Söpö lutunen oot

      Kaipaan aina vaan, vaikkakin sitten yksipuolisesti.
      Ikävä
      11
      1198
    9. Elia tulee vielä

      Johannes Kastaja oli Elia, mutta Jeesus sanoi, että Elia tulee vielä. Malakian kirjan profetia Eliasta toteutuu kokonaan
      Helluntailaisuus
      36
      1188
    10. Nellietä Emmaa ja Amandaa stressaa

      Ukkii minnuu Emmaa ja Amandaa stressaa ihan sikana joten voidaanko me koko kolmikko hypätä ukin kainaloon ja syleilyyn k
      Isovanhempien jutut
      10
      1167
    Aihe