Tunnen kyllä regressioanalyysin mielestäni hyvin, mutta SPSS:ää huonosti. Miten siinä voi tsekata mallin autokorrelaatiota, multikollineaarisuutta, heteroskedastisuutta ja virhetermin normaalijakautuneisuutta? En ainakaan kohtuullisella vaivannäöllä löydä SPSS:stä noihin viittaavaa regressioanalyysin alta.
Jouluksi pitäisi valmistua kokopäivätyön ohella ja tekstikin on kesken. Joten kiirekin olisi, eli kiitollisuuteni on ylitsevuotavainen, jos joku valaisisi.
Regressioanalyysi SPSS:llä
6
262
Vastaukset
- jaapajaa
Google auttaa, SPSS autocorrelation jne. Voit toki tehdä analyysit vaikka R:llä tai Matlabilla jos SPSS ei ole tuttu.
- Statistician
Ei noita kaikkia saa SPSS:ssä ihan suoraan regressioanalyysin alta, osan kuitenkin. Se, mitä kannataa tehdä heti estimointivaIheessa, on tallentaa virhetermin arvot muuttujien jatkoksi.
Ensimmäisen kertaluvun autokorrelaatiota mittava Durbin-Watsonin testisuure (D-W) tulostuu muistaakseni automaattisesti (rastita, jos ei!). D-W:n tulkinta on vähän kinkkinen (katso kirjasta/luennoista): mitä lähempnä kakkosta, sitä parempi.
Multikollineaarisuutta varten on VIF, jota en kuitenkaan pidä kovin hyvänä. Voit katsoa korrelaatiomatriisista, korreloivatko selittävät muuttujat merkitsevästi. Kleinin säännön mukaan mikään selittäjien korrelaatio ei saa olla korkeampi kuin yhteiskorrelaatio R, mikä sekin on aika väljä kriteeri. Ehkä paras konsti on ajaa koko malli stepwise-estimoinnilla, jolloin muiden kanssa korkeasti korreloivat selittäjät jäävät mallista pois.
Heteroskedastisuuden tarkastelussa voi laskea Spearmanin järjestyskorrelaation virhetermin ja selittäjien välille (tai r:n virhetermin itseisarvojen ja selittäjien välille). Merkitsevä korrelaatio tarkoitaa heteroskedastisuutta ko. muuttujan suhteen.
Virhetermin normaalijakautuneisuuden voi testata Kolmogorov-Smirnovin testiillä (K-S). Huomaa, että tässä nollahypoteesi on, ettei jakauma poikkea normaalisti, joten mitä suurempi p-arvo, sitä parempi.
Oma taiteenlajinsa on sitten mallin korjailu, jos noita epätoivottuja ilmiöitä esiintyy mallissa. Kannataa katsoa temppuja jostain oppikirjasta, jos luenneoilla ei ole käyty läpi (esim. Koutsoyiannis: Theory of Econometrics on hyvä).
Jos malli on puhtaasti ennustamista varten, ei multikollineaarisuutta ja heteroskedastisuutta yleensä pidetä vaarallisena, koska saman rakenteen voidaan olettaa pysyvän myös tulevaisuudessa, ja R^2 on tärkein mallin hyvyyden kriteeri. Selittävässä, teoriaa testaavassa tms. mallissa merkitsevyystestit ja em. tarkastelut ovat sen sijaan yhtä tärkeitä kuin selityskerroin.- _aloittaja_
Suurkiitos asiantuntevasta vastauksesta! Tein nuo temput ja malli näyttää muuten hyvältä, mutta yhden selittävän muuttujan kohdalla on vähän heteroskedastisuutta, siis Spearman poikkeaa nollasta p-tasolla 0.06. Viitsisitkö vielä kertoa, onko tuo kovinkin vaarallista, ja jos on, millä tempulla asia olisi korjattavissa?
- Statistician
Saat pikavastauksen, kun vilkaisin ketjua ennen koneen sulkemista. Jos kaikki muu on mallissa kunnossa, tuo on pikkuseikka; pistä asiasta huomatus kuitenkin vaikka ala-viitteeseen, niin ei nirsoimmallakaan tarkastajalla ole nipottamista. Olet ilmeisesti käyttänyt koko mallissa testien merkisevyystasona 0,05:ttä, mutta 0,10:kin on vielä sallittavuuden rajoissa.
Voit tietysti kokeilla muutamia niksipirkka-temppuja, esim katsoa, mitä tapahtuu, kun käytät tuon muuttujan sijasta sen logaritmiarvoja. Yleensä kannattaa heti kättelyssä estimoida malli muuttujien sekä perus- että logaritmiarvoilla, jos takana ei ole kovin vankaa teoriaa mallin ja muuttujien riippuvuuksien muodosta. Itse ole aluksi tottunut katsomaan lisäksi mahdolliset "sekamuodot" korrelaatiomatriisista: mitkä selittäjien tai niiden logaritmien korrlaatiot ovat korkeimmat y:n ja log y.n kanssa.
Jos tietty selittäjä - kuten tapauksessasi - aiheuttaa heteroskedastisuutta - on yksinkertaisin eliminointitapa jakaa koko malli tuolla muuttujalla. Tämä voi kuitenkin tulosten tulkinnan kanssa olla ongelmallista. Sofistikoidumpi tapa on käyttää painotettua regressiota, joka taas vaatisi oman tarinansa.
Sinuna olisi tuohon tulokseen tyytyväinen ja korkeintaan kokeilisin, muuttaako tuon yhden muutujan log-arvojen käyttö tilannetta mitenkään.- -aloittaja_
Kiitos vielä tästäkin! Log-arvon käyttö ei parantanut tilannetta, joten annan mallin olla tällaisenaan.
- Yllättynyt
Huh-huh. Minäkin luulin osaavani regessioanalyysin, pidin sitä samana kuin Gaussin pienimmän neliösumman menetelmää. Tämä ketju osoitti, että opittavaa on, ja paljon.
Ketjusta on poistettu 0 sääntöjenvastaista viestiä.
Luetuimmat keskustelut
Fuengirola.fi: Danny avautuu yllättäen ex-rakas Erika Vikmanista: "Sanoisin, että hän on..."
Danny matkasi Aurinkorannikolle Helmi Loukasmäen kanssa. Musiikkineuvoksella on silmää naiskauneudelle ja hänen ex-raka953032GALLUP: Kuka voittaa The Voice of Finland -kisan: Oliver, Janina, Julia vai Mohammad?
GALLUP: Kuka voittaa The Voice of Finland -kisan: Oliver, Janina, Julia vai Mohammad? Tänään jännittävä finaalilähetys431147- 831122
Tämä on kyllä heittämällä erikoisin ihmissuhde mitä on koskaan ollut
Hulluinta on se että ei edes ole varsinaista suhdetta minkäänlaista, mutta tuntuu kuin olisit elämässäni mukana koko aja511015Helikopteri pörrää ja POLIISIT on eristettynä pururadan vieressä!
Suojatehtävä pitää kiireisenä. Kulut ovat kovat!31974- 67858
Tunnustan
Vaikka peitän sen erittäin hyvin niin tunnustan että pidän sinusta erittäin paljon, mieheltä naiselle39852- 53837
- 44822
- 71770