Päättely Kruskall-Wallisin testim perusteella

Gradupähkinä

2015-03-28 15:30:46

Olen tehnyt Kruskall-Wallisin testejä aineistolle, jossa esim testaan ikäluokkien erilaisia arvioita mielipideasteikolliselle muuttujalle (1-5). Ryhmiä on siis useita (esimerkiksi siis nuoret, keski-ikäiset ja vanhat. Esimerkki nuorten keskiarvo on 4,28, keski-ikäisten 4,08 ja vanhojen 3,72. KW : p on 0,030 eli merkitsevä.
Miten siis päättelen mikä/mitkä ryhmät eroavat tilastollisesti merkitsevästi? Voinko väittää, että testin perusteella niin nuoret, keski-ikäiset kuin vanhat eroavat keskenään tyytyväisyydessään vai siis mitä tuosta voi siis päätellä?

291

Äänestä

Vastaukset

näinkai
2015-03-28 18:56:16
An ole statisti, mutta muistaakseni seuraavaa selitettiin tilastotieteen peruskurssilla:

Kruskallin–Wallisin testissä pitää laskea otosten lukumäärä k (>2) ja testisuureen arvoa verrataan khii^2(k-1)-jakaumasta saatuun lukemaan. Eri ryhmät vertaillaan monivertailun avulla. Jos p-arvo on pienempi kuin valittu taso, niin nollahypoteesi hylätään.
Statistician
2015-03-28 23:11:52
Vaitoehtoinen hypoteesi on, että ainakin joku (mediaani)arvoista poikkeaa muista. Ääripäät tässä siis ainakin poikkevat. Muut parittaiset vertailut voi tehdä esim. Mann-Whitneyn U-testillä.
- Gradupähkinä
  2015-03-29 12:01:13
  Eli rautalangasta vääntäen aina kuin p on merkitsevä, niin tilastollisesti merkitsevä ero on vähintään alimman keskiarvon ja ylimmän keskiarvon saaneiden ryhmien välillä? Esimerkissä siis nuorilla ja vanhoilla on eroa, keski-ikäisten kohdalla tarvii testata lisää.
- Statistician
  2015-03-29 19:45:17
  Gradupähkinä kirjoitti:
  Eli rautalangasta vääntäen aina kuin p on merkitsevä, niin tilastollisesti merkitsevä ero on vähintään alimman keskiarvon ja ylimmän keskiarvon saaneiden ryhmien välillä? Esimerkissä siis nuorilla ja vanhoilla on eroa, keski-ikäisten kohdalla tarvii testata lisää.
  Näin juuri.
- Gradupähkinä
  2015-03-31 11:17:06
  Statistician kirjoitti:
  Näin juuri.
  Kiitos!
- Gradupähkinä
  2015-04-01 15:13:42
  Löysinkin SPSS:stä tuon pairwise comparisons -toiminnon, jolla voi nuo parivertailut tehdä. Mielenkiintoista, että K-W näyttää merkitsevää, mutta parivertailussa yksikään adj. sig arvo ei taas ole merkitsevä. Ilmeisesti sitten niin, että pienimmän adj sig arvon saava pari eroaa. Jos eroaa nekään.
- Statistician
  2015-04-02 03:11:32
  Gradupähkinä kirjoitti:
  Löysinkin SPSS:stä tuon pairwise comparisons -toiminnon, jolla voi nuo parivertailut tehdä. Mielenkiintoista, että K-W näyttää merkitsevää, mutta parivertailussa yksikään adj. sig arvo ei taas ole merkitsevä. Ilmeisesti sitten niin, että pienimmän adj sig arvon saava pari eroaa. Jos eroaa nekään.
  Valistunut arvaukseni on, että parewise käyttää parametrista t-testivertailua, joka on nirsompi kuin ei-parametrinen K-W.
  
  Kun merkitsevyystaso K-W:llä oli kuitenkin niinkin hyvä kuin 0.03, ja etenkään jos jakaumat eivät ole kovin normaalisia, suosittelisin pysymään ei-parametrisella puolella ja tekemään parivertailut Mann-Whitney:lla (jonka voimakkuus, siis kyky hylätä väärä nollahypoteesi, on yli 90 % t-testin voimakkuudesta).
- Gradupähkinä
  2015-04-02 16:54:08
  Statistician kirjoitti:
  Valistunut arvaukseni on, että parewise käyttää parametrista t-testivertailua, joka on nirsompi kuin ei-parametrinen K-W.
  
  Kun merkitsevyystaso K-W:llä oli kuitenkin niinkin hyvä kuin 0.03, ja etenkään jos jakaumat eivät ole kovin normaalisia, suosittelisin pysymään ei-parametrisella puolella ja tekemään parivertailut Mann-Whitney:lla (jonka voimakkuus, siis kyky hylätä väärä nollahypoteesi, on yli 90 % t-testin voimakkuudesta).
  Kiitos, kommenttisi oli kiinnostava. Muuallakin on ollut keskustelua Mann-Whitneyn käyttämisestä ko .tilanteessa, mutta sitten "yleensä" ilmeisesti tyydytään siihen mitä SPSS puskee ulos omasta parivertailustaan. Tosiaan tilastotieteen ymmärrykseni ole mikään erityinen vahvuuteni :) Alan harvoja kvanttipuolen graduja lukiessa yksikään kirjoittaja ei kirjoita parivertailuista mitään, vaikka K-W:tä on käyttänyt. Todettu tosiaan esim, että " X sai suurimman keskiarvon ja siten eroaa muista ryhmistä". En kyllä teknisesti äkkiseltään keksi, miten tuon Mann-Whitneyn voisi tehdä SPSS:llä, joka automaattisesti nakuttaa parametrittomat testit sapluunansa mukaan. Ehkä ennätän tutustua aiheeseen.
- matikisti
  2015-04-02 17:55:51
  Tuota, miksi sinun pitäisi välttämättä käyttää SPSS:ää jos et osaa? Esimerkiksi R:llä Mann-Whitney menee suokelin näppärästi kolmella rivillä:
  
  > a = c(30, 32, 33, 33,36,37,40,44)
  > b = c(27, 29, 31, 34, 34, 35,41,12,324,34,4,-2.4)
  > wilcox.test(a,b, alternative="less", correct=TRUE)
  
  Wilcoxon rank sum test with continuity correction
  
  data: a and b
  W = 64, p-value = 0.8989
  alternative hypothesis: true location shift is less than 0
  
  Warning message:
  In wilcox.test.default(a, b, alternative = "less", correct = TRUE) :
  cannot compute exact p-value with ties
  >
- Gradupähkinä
  2015-04-02 20:15:08
  matikisti kirjoitti:
  Tuota, miksi sinun pitäisi välttämättä käyttää SPSS:ää jos et osaa? Esimerkiksi R:llä Mann-Whitney menee suokelin näppärästi kolmella rivillä:
  
  > a = c(30, 32, 33, 33,36,37,40,44)
  > b = c(27, 29, 31, 34, 34, 35,41,12,324,34,4,-2.4)
  > wilcox.test(a,b, alternative="less", correct=TRUE)
  
  Wilcoxon rank sum test with continuity correction
  
  data: a and b
  W = 64, p-value = 0.8989
  alternative hypothesis: true location shift is less than 0
  
  Warning message:
  In wilcox.test.default(a, b, alternative = "less", correct = TRUE) :
  cannot compute exact p-value with ties
  >
  Kiitän vinkistä. Syy SPSS- riippuvuuteen on siis ihan vain se, että mistään muusta ei ole hajua ja osaamista siis vieläkin vähemmän kuin SPSS:stä. R:stä en ole koskaan kuullutkaan, mutta googlettelemallahan sitä löytää.
- Statistician
  2015-04-02 23:27:29
  Gradupähkinä kirjoitti:
  Kiitän vinkistä. Syy SPSS- riippuvuuteen on siis ihan vain se, että mistään muusta ei ole hajua ja osaamista siis vieläkin vähemmän kuin SPSS:stä. R:stä en ole koskaan kuullutkaan, mutta googlettelemallahan sitä löytää.
  Eikös se Mann-Whitney löydy sieltä Nonparametric-valikosta? Näin muistelen, kun itselläni ei juuri nyt ole koneella SPSS:ää, vain sen sen vaatimattomampi vastine PSPP Linuxille.
- Gradupähkinä
  2015-04-05 12:19:37
  Statistician kirjoitti:
  Eikös se Mann-Whitney löydy sieltä Nonparametric-valikosta? Näin muistelen, kun itselläni ei juuri nyt ole koneella SPSS:ää, vain sen sen vaatimattomampi vastine PSPP Linuxille.
  Juu kyllähän se M-W tuolta SPSS:stä on poimittavissa, ja eiköhän sieltä löydy vielä joku valikko, miten parivertailutkin sais tehtyä muuttujalla, jossa useampi luokka. Nyt iski vielä epäusko, että miten päin mäkiä oonkaan tekemässä jos siis yritän saada selvyyttä siihen vaikuttaako asiakkaan oma käytös ja henkilökunnan käytös asiakkaan luottamukseen. Alun perin siis aattelin muodostaa Likert 1-5 mittariston perusteella esim passiiviset ja aktiiviset asiakkaat / henkilökunta ja testata U:lla eroja luottamuksessa( kyllä, osittainen luottamus, ei). Mutta hiipi epäilys, että oon hahmottanut riippuvat ja riippumattomat tilanteet väärin..
- Statistician
  2015-04-06 11:23:37
  Gradupähkinä kirjoitti:
  Juu kyllähän se M-W tuolta SPSS:stä on poimittavissa, ja eiköhän sieltä löydy vielä joku valikko, miten parivertailutkin sais tehtyä muuttujalla, jossa useampi luokka. Nyt iski vielä epäusko, että miten päin mäkiä oonkaan tekemässä jos siis yritän saada selvyyttä siihen vaikuttaako asiakkaan oma käytös ja henkilökunnan käytös asiakkaan luottamukseen. Alun perin siis aattelin muodostaa Likert 1-5 mittariston perusteella esim passiiviset ja aktiiviset asiakkaat / henkilökunta ja testata U:lla eroja luottamuksessa( kyllä, osittainen luottamus, ei). Mutta hiipi epäilys, että oon hahmottanut riippuvat ja riippumattomat tilanteet väärin..
  Minulle tulee nyt sellainen fiilis, että graduntekosi menee melkoiseksi hakuammunnaksi. Kehottaisin yli 500 gradua/diplomityötä ohjanneena tekemään koko aineistolle analyysisuunnitelman ja pysymään siinä:
  a) Mitä riippuvuuksia ja eroja haluat selvittää
  b) Mitkä ovat soveliaat tilastolliset analyysimenetelmät
  
  Sellaisista testiä joka samalla kertaa testaisi useiden ryhmien keskiarvojen tai mediaanien erojen merkitsevyyden pareittain, ei ole. Kuten aiemmin kerroin, K-W:ssa (ja ANOVASSA) nollahypoteesi on, että keskiluvat ovat yhtä suuret ja vaihtoehtoinen hytpoteesi, että joku poikkeaa muista. Saman voi tehdä pareittain M-W:lla tai parametrisessa tapauksessa t-testeillä.
- matikisti
  2015-04-06 13:11:08
  Statistician kirjoitti:
  Minulle tulee nyt sellainen fiilis, että graduntekosi menee melkoiseksi hakuammunnaksi. Kehottaisin yli 500 gradua/diplomityötä ohjanneena tekemään koko aineistolle analyysisuunnitelman ja pysymään siinä:
  a) Mitä riippuvuuksia ja eroja haluat selvittää
  b) Mitkä ovat soveliaat tilastolliset analyysimenetelmät
  
  Sellaisista testiä joka samalla kertaa testaisi useiden ryhmien keskiarvojen tai mediaanien erojen merkitsevyyden pareittain, ei ole. Kuten aiemmin kerroin, K-W:ssa (ja ANOVASSA) nollahypoteesi on, että keskiluvat ovat yhtä suuret ja vaihtoehtoinen hytpoteesi, että joku poikkeaa muista. Saman voi tehdä pareittain M-W:lla tai parametrisessa tapauksessa t-testeillä.
  "Sellaisista testiä joka samalla kertaa testaisi useiden ryhmien keskiarvojen tai mediaanien erojen merkitsevyyden pareittain, ei ole."
  
  Miksei tämä toimisi? https://en.wikipedia.org/wiki/Tukey's_range_test
- Statistician
  2015-04-06 20:16:07
  matikisti kirjoitti:
  "Sellaisista testiä joka samalla kertaa testaisi useiden ryhmien keskiarvojen tai mediaanien erojen merkitsevyyden pareittain, ei ole."
  
  Miksei tämä toimisi? https://en.wikipedia.org/wiki/Tukey's_range_test
  . OK, perun puheeni , mutta en ihan kokonaan ;-).Tukey'n testistä oli aikoinaan keskustelua alan lehdissä. Sehän on itse asiassa sama kuin parittain tehdyt t-testit. Kun ne "niputetaan yhteen" Tukey'n tavalla, seuraa kova vaatimus: ryhmien varianssien pitäisi olla yhtä suuria. Tämä on käytännössä melkoisen utopistista. Silmiini, ei ole sattunut analyysia, siitä, miten herkkä testi on tämän vaatimuksen rikkomiselle.
- matikisti
  2015-04-06 20:36:20
  Ahaa. Mukava oppia uutta. Joku Googlaamalla vastaan tullut sivu sanoo, että Gamesin–Howellin testissä varianssien yhtäsuuruutta ei tarvita, mutta mulla ei ole mitään kokemusta tästä.
- Statistician
  2015-04-06 23:46:13
  matikisti kirjoitti:
  Ahaa. Mukava oppia uutta. Joku Googlaamalla vastaan tullut sivu sanoo, että Gamesin–Howellin testissä varianssien yhtäsuuruutta ei tarvita, mutta mulla ei ole mitään kokemusta tästä.
  Tämä ketju nyt menee ihan vituralleen, jos tarkoitus on auttaa aloittajaa gradunteossa, kun käytössä on SPSS.
  
  Games & Howell toimii, kun ryhmiä on max kolme, mutta kuten testin kehittäjät itse toteavat alkuperäisen artikkelinsa abstraktissa "Satisfactotory control with unequal n's of three and up is dubious even with this statistic. Vaadittaisiin siis ryhmiltä samaa otoskokoa. Muistaakseni Tukey lähti juuri eliminoimaan tätä vaatimusta, mutta tuloksena oli vaatimus yhtäsuurista variansseista.
  
  Ohjelmistopaketteihin on yleensä valittu käytännössä käyttökelposia testejä. Kaikenlaisia, toki usein teoreettisesti mielenkiintoisia, kehitelmiä kyllä löytyy lähes ---> oo. Itsekin olen selalista joskus harrastanut, jopa suppealla menestyksellä.
- matikisti
  2015-04-07 00:06:21
  Mutta jos ohjelmistopaketista ei löydy oikeaa testiä, on vaihdettava ohjelmistoa ja tarvittaessa kehitettävä itse oikea testi.
- Staticician
  2015-04-07 04:08:34
  matikisti kirjoitti:
  Mutta jos ohjelmistopaketista ei löydy oikeaa testiä, on vaihdettava ohjelmistoa ja tarvittaessa kehitettävä itse oikea testi.
  Ja höpö-höpö, esim. SPSS:stä löytyy kaikki tarpeellinen gradua tekevän aloittajan ongelmiin.
munmielipide
2015-04-06 12:38:02
Ei graduja tehdä keskustelupalstojen avulla. Ohjaaja on sitä varten, että häneltä voi kysyä apua.
- Statistician
  2015-04-07 00:04:15
  Niin, periaatteessa olen samaa mieltä. Pitäisikin lähettää lasku ohjajalle! Vaikuttaa, että aloittaja on kauppatieteilijä, ja siellä ei proffatasoa myöten ole aina kvantitatiivisten analyysimenetelmien tuntemus ihan huipputasoa.
  
  En tämäntyyppisissä töissä kuitenkaan pidä nettiapua epäsopivana. Menetelmät ovat vain apuvälineitä, ja niiden käytössä voi kyllä auttaa. Gradun kokonaisarvon pitäisi kyllä määrittyä ensisijaisesti muilla perusteilla, kunhan menetelmien kanssa ei tee mitään täystöppäilyjä.
Gradupähkinä
2015-04-07 17:30:07
Ymmärrän kyllä kommentit siitä, että voi vaikuttaa hieman epätoivoiselta tehdä graduaan keskustelupalstalla huutelemalla. Mutta toisaalta ajattelen, että ei tämä sen kummempaa ole kuin kysyä vinkkiä kaverilta, joka tietää kenties paremmin. Ja kyllä, olen tietoinen metodikirjallisuuden olemassa olosta ja olen myös lukenut niitä. En tokikaan oleta, että kukaan täällä nyt työstäni sinänsä ottaa vastuuta kuin minä itse. Otan kiitoksella vastaan kaikki kommentit, jos joku haluaa kommentoida.

Ja mitä tulee ohjaukseen, niin olen saanut vain kommentit siitä, että tutkija elää valintojen maailmassa. Totta sekin, mutta omaa työtäni ko. kommentti ei kuitenkaan suuresti selkeyttänyt varsinkin, kun opetuksessa skipattiin kvanttipuoli, koska proffa ei asiasta halunnut porukkaa tentityttää. Kommentteja annetaan sitten esitarkastuksessa, jos tarvetta. Ikävää vain, jos siihen asti tehty homma on sitten ihan väärin. Mutta varmasti omassakin asenteessa on korjattavaa ja duunia tehtävä. Ja madallettava varmaankin rimaa sellaiselle tasolle, jonka ymmärtää.
- ei-tilastotieteilijä
  2015-04-07 18:35:09
  Vinkkejä voi kai pyytää mistä vaan. On kuitenkin omalla vastuullasi luottaa vinkkeihin ja tehdä analyysi oikein. Kaikissa lähteissä voi olla virheitä, niin keskustelupalstoilla kuin artikkeleissa. Joku voi jopa yrittää huijata täällä tahallaan. Toivottavasti osaat opetella valitsemasi testin teorian niin hyvin, että pystyt luottamaan tulokseen ja että tarvittava testi soveltuu käyttötarkoitukseesi. Mutta jos opettelen tilastotiedettä syvällisesti gradua tehdessäsi, pystyt varmaankin itsekin pättelemään, onko tilastollinen analyysi tehty ihan väärin.
  
  Kaikkihan me elämme valintojen maailmassa. Jos emme, olisi aika moni asia jo automatisoitu.

Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

Takaisin ylös

Luetuimmat keskustelut

Heikki Silvennoinen petti vaimoaan vuosien ajan
Viiden lapsen isä Heikki kehuu kirjassaan kuinka paljon on pettänyt vaimoaan vuosien varrella.
23.04.2024 07:28Kotimaiset julkkisjuorut
146
2591
Taasko se show alkaa
Koo osottaa taas mieltään
23.04.2024 01:59Ikävä
24
1986
Miksi ihmeessä nainen seurustelit kanssani joskus
Olin ruma silloin ja nykyisin vielä rumempi En voi kuin miettiä että miksi Olitko vain rikki edellisestä suhteesta ja ha
23.04.2024 00:49Ikävä
23
1968
Persut nimittivät kummeli-hahmon valtiosihteeriksi!
Persujen riveistä löytyi taas uusi törkyturpa valtiosihteeriksi! Jutun perusteella järjenjuoksu on kuin sketsihahmolla.
23.04.2024 01:45Perussuomalaiset
89
1776
Onko ministeri Juuso epäkelpo ministerin tehtäviensä hoitamiseen?
Eikö hänellä ole kompetenttia hoitaa sosiaali- ja terveysministetin toimialalle kuuluvia ministerin tehtäviä?
23.04.2024 01:01Perussuomalaiset
67
1530
Sakarjan kirjan 6. luku
Jolla korva on, se kuulkoon. Sain profetian 22.4.2023. Sen sisältö oli seuraava: Suomeen tulee nälänhätä niin, että se
23.04.2024 01:39Profetiat
20
1306
Avaa sydämesi mulle
❤ ❤❤ Tahdon pelkkää hyvää sulle Sillä ilmeisesti puhumalla Avoimesti välillämme Kaikki taas selviää Kerro kaikki, tahdo
23.04.2024 23:09Ikävä
37
1202
Söpö lutunen oot
Kaipaan aina vaan, vaikkakin sitten yksipuolisesti.
23.04.2024 23:21Ikävä
11
1198
Elia tulee vielä
Johannes Kastaja oli Elia, mutta Jeesus sanoi, että Elia tulee vielä. Malakian kirjan profetia Eliasta toteutuu kokonaan
23.04.2024 01:40Helluntailaisuus
36
1188
Nellietä Emmaa ja Amandaa stressaa
Ukkii minnuu Emmaa ja Amandaa stressaa ihan sikana joten voidaanko me koko kolmikko hypätä ukin kainaloon ja syleilyyn k
24.04.2024 00:15Isovanhempien jutut
10
1167

Päättely Kruskall-Wallisin testim perusteella

Vastaukset

Gradupähkinä kirjoitti:

Statistician kirjoitti:

Gradupähkinä kirjoitti:

Statistician kirjoitti:

matikisti kirjoitti:

Gradupähkinä kirjoitti:

Statistician kirjoitti:

Gradupähkinä kirjoitti:

Statistician kirjoitti:

matikisti kirjoitti:

matikisti kirjoitti:

matikisti kirjoitti:

Luetuimmat keskustelut

Heikki Silvennoinen petti vaimoaan vuosien ajan

Taasko se show alkaa

Miksi ihmeessä nainen seurustelit kanssani joskus

Persut nimittivät kummeli-hahmon valtiosihteeriksi!

Onko ministeri Juuso epäkelpo ministerin tehtäviensä hoitamiseen?

Sakarjan kirjan 6. luku

Avaa sydämesi mulle

Söpö lutunen oot

Elia tulee vielä

Nellietä Emmaa ja Amandaa stressaa

Iso konflikti puhkeaa Farmi Suomessa - Veeti Kallio lataa pöytään viisaat sanat: "Jos ei ole..."

Heikki Silvennoinen petti vaimoaan vuosien ajan

KL: Mikko Kekäläinen paljastaa - Tapasi Kristiina-vaimonsa yllättävällä tavalla: "Se oli hyvä..."

Farmi Suomi: Miina Äkkijyrkkä saa täyslaidallisen ryöpytystä - Romahtaa täysin: "Julkisesti häpäisi"

Kenen etua Stubb ajaa Euroopassa ilmoittaessaan olevansa enemmän Ruotsalainen

Pelastakaa Lapset: Netti ei ole turvallinen paikka lapsille - Erätauko-tilaisuus to 25.4.2024

Tätä et nähnyt TV:ssä: Sofia Zida paljastaa Farmi-kuvauksista: "Kun mä tulin tänne, luulin, että..."

Voi, mikä reissu! Suosikkijuontaja Niko Saarinen ja Outi-äiti yhteisissä lomakuvissa - Katso tästä!

Elokapina viivästytti lentokoneen lähtöä tällä kertaa

Oho! Farmi-tippuja Wallu Valpio ei säästele sanojaan Farmi-oloista "Se oli niin luotaantyöntävää..."