Regressioanalyysi SPSS:llä

Graduongelmia

Tunnen kyllä regressioanalyysin mielestäni hyvin, mutta SPSS:ää huonosti. Miten siinä voi tsekata mallin autokorrelaatiota, multikollineaarisuutta, heteroskedastisuutta ja virhetermin normaalijakautuneisuutta? En ainakaan kohtuullisella vaivannäöllä löydä SPSS:stä noihin viittaavaa regressioanalyysin alta.

Jouluksi pitäisi valmistua kokopäivätyön ohella ja tekstikin on kesken. Joten kiirekin olisi, eli kiitollisuuteni on ylitsevuotavainen, jos joku valaisisi.

6

196

    Vastaukset

    Anonyymi (Kirjaudu / Rekisteröidy)
    5000
    • jaapajaa

      Google auttaa, SPSS autocorrelation jne. Voit toki tehdä analyysit vaikka R:llä tai Matlabilla jos SPSS ei ole tuttu.

    • Statistician

      Ei noita kaikkia saa SPSS:ssä ihan suoraan regressioanalyysin alta, osan kuitenkin. Se, mitä kannataa tehdä heti estimointivaIheessa, on tallentaa virhetermin arvot muuttujien jatkoksi.

      Ensimmäisen kertaluvun autokorrelaatiota mittava Durbin-Watsonin testisuure (D-W) tulostuu muistaakseni automaattisesti (rastita, jos ei!). D-W:n tulkinta on vähän kinkkinen (katso kirjasta/luennoista): mitä lähempnä kakkosta, sitä parempi.

      Multikollineaarisuutta varten on VIF, jota en kuitenkaan pidä kovin hyvänä. Voit katsoa korrelaatiomatriisista, korreloivatko selittävät muuttujat merkitsevästi. Kleinin säännön mukaan mikään selittäjien korrelaatio ei saa olla korkeampi kuin yhteiskorrelaatio R, mikä sekin on aika väljä kriteeri. Ehkä paras konsti on ajaa koko malli stepwise-estimoinnilla, jolloin muiden kanssa korkeasti korreloivat selittäjät jäävät mallista pois.

      Heteroskedastisuuden tarkastelussa voi laskea Spearmanin järjestyskorrelaation virhetermin ja selittäjien välille (tai r:n virhetermin itseisarvojen ja selittäjien välille). Merkitsevä korrelaatio tarkoitaa heteroskedastisuutta ko. muuttujan suhteen.

      Virhetermin normaalijakautuneisuuden voi testata Kolmogorov-Smirnovin testiillä (K-S). Huomaa, että tässä nollahypoteesi on, ettei jakauma poikkea normaalisti, joten mitä suurempi p-arvo, sitä parempi.

      Oma taiteenlajinsa on sitten mallin korjailu, jos noita epätoivottuja ilmiöitä esiintyy mallissa. Kannataa katsoa temppuja jostain oppikirjasta, jos luenneoilla ei ole käyty läpi (esim. Koutsoyiannis: Theory of Econometrics on hyvä).

      Jos malli on puhtaasti ennustamista varten, ei multikollineaarisuutta ja heteroskedastisuutta yleensä pidetä vaarallisena, koska saman rakenteen voidaan olettaa pysyvän myös tulevaisuudessa, ja R^2 on tärkein mallin hyvyyden kriteeri. Selittävässä, teoriaa testaavassa tms. mallissa merkitsevyystestit ja em. tarkastelut ovat sen sijaan yhtä tärkeitä kuin selityskerroin.

      • _aloittaja_

        Suurkiitos asiantuntevasta vastauksesta! Tein nuo temput ja malli näyttää muuten hyvältä, mutta yhden selittävän muuttujan kohdalla on vähän heteroskedastisuutta, siis Spearman poikkeaa nollasta p-tasolla 0.06. Viitsisitkö vielä kertoa, onko tuo kovinkin vaarallista, ja jos on, millä tempulla asia olisi korjattavissa?


    • Statistician

      Saat pikavastauksen, kun vilkaisin ketjua ennen koneen sulkemista. Jos kaikki muu on mallissa kunnossa, tuo on pikkuseikka; pistä asiasta huomatus kuitenkin vaikka ala-viitteeseen, niin ei nirsoimmallakaan tarkastajalla ole nipottamista. Olet ilmeisesti käyttänyt koko mallissa testien merkisevyystasona 0,05:ttä, mutta 0,10:kin on vielä sallittavuuden rajoissa.

      Voit tietysti kokeilla muutamia niksipirkka-temppuja, esim katsoa, mitä tapahtuu, kun käytät tuon muuttujan sijasta sen logaritmiarvoja. Yleensä kannattaa heti kättelyssä estimoida malli muuttujien sekä perus- että logaritmiarvoilla, jos takana ei ole kovin vankaa teoriaa mallin ja muuttujien riippuvuuksien muodosta. Itse ole aluksi tottunut katsomaan lisäksi mahdolliset "sekamuodot" korrelaatiomatriisista: mitkä selittäjien tai niiden logaritmien korrlaatiot ovat korkeimmat y:n ja log y.n kanssa.

      Jos tietty selittäjä - kuten tapauksessasi - aiheuttaa heteroskedastisuutta - on yksinkertaisin eliminointitapa jakaa koko malli tuolla muuttujalla. Tämä voi kuitenkin tulosten tulkinnan kanssa olla ongelmallista. Sofistikoidumpi tapa on käyttää painotettua regressiota, joka taas vaatisi oman tarinansa.

      Sinuna olisi tuohon tulokseen tyytyväinen ja korkeintaan kokeilisin, muuttaako tuon yhden muutujan log-arvojen käyttö tilannetta mitenkään.

      • -aloittaja_

        Kiitos vielä tästäkin! Log-arvon käyttö ei parantanut tilannetta, joten annan mallin olla tällaisenaan.


    • Yllättynyt

      Huh-huh. Minäkin luulin osaavani regessioanalyysin, pidin sitä samana kuin Gaussin pienimmän neliösumman menetelmää. Tämä ketju osoitti, että opittavaa on, ja paljon.

    Ketjusta on poistettu 0 sääntöjenvastaista viestiä.

    Luetuimmat keskustelut

    1. Voitasko leikkiä jotain tunnisteleikkiä?

      Tietäisi ketä täällä käy kaipaamassa.. kerro jotain mikä liittyy sinuun ja häneen eikä muut tiedä. Vastaan itsekin kohta
      Ikävä
      77
      1756
    2. Tietysti jokainen ansaitsee

      Hän varmasti ansaitsee vain parasta ja sopivinta tietenkin, suon sen onnen hänelle enemmän kuin mielelläni. Aika on nyt
      Ikävä
      17
      1663
    3. Millä voin

      Hyvittää kaiken?
      Ikävä
      14
      1448
    4. Välitän sinusta mies

      Kaikki mitä yritin kertoa tänään ei mennyt ihan putkeen..Joka jäi jälkeenpäin ajateltuna suoraan sanottuna harmittaa aiv
      Työpaikkaromanssit
      5
      1131
    5. En voi sille mitään

      Tulen niin pahalle tuulelle tästä paikasta nykyisin. Nähnyt ja lukenut jo kaiken ja teidän juttu on samaa illasta toisee
      Ikävä
      12
      1128
    6. 50+ naiset kyl

      Lemottaa sillille mut myös niitte kaka lemottaa pahlle ku kävin naiste veskis nuuhiin
      Ikävä
      19
      1120
    7. hieman diabetes...

      Kävin eilen kaverin kanssa keskusapteekissa kun on muutama kuukausi sitten tullut suomesta ja oli diabetes insuliinit lo
      Pattaya
      12
      1096
    8. Annetaanko olla vaan

      Siinä se, tavallaan kysymys ja toteamuskin. Niin turhaa, niin rikkovaa. On niin äärettömän tärkeä, ja rakas olo.. N
      Ikävä
      29
      1081
    9. Miten joku voi käyttää koko elämänsä

      siihen että nostelee täällä vanhoja ketjuja ja troIIaa niihin jotain linkkiä mitä kukaan ei avaa? Ihmisellä ei ole mitää
      Tunteet
      5
      1062
    10. Pakkoruotsi on leikkikieli, jota ei ole tarkoituskaan osata

      Pakkoruotsi on leikkikieli. Ennen leikkikieltä sanottiin siansaksaksi, sitten keksittiin tilalle pakkoruotsi. Pakkoruot
      Kielipolitiikka
      7
      1050
    Aihe