Hva er trinnvis regresjon?
Regresjonsanalyse er en mye brukt statistisk tilnærming som søker å identifisere sammenhenger mellom variabler. Tanken er å samle relevante data for å ta bedre informerte beslutninger og er en vanlig praksis i investeringsverdenen. Trinnvis regresjon er den trinnvise iterative konstruksjonen av en regresjonsmodell som innebærer automatisk valg av uavhengige variabler. Tilgjengeligheten av statistiske programvarepakker gjør trinnvis regresjon mulig, selv i modeller med hundrevis av variabler.
Typer trinnvis regresjon
Det underliggende målet med trinnvis regresjon er gjennom en serie tester (F-tester, t-tester) å finne et sett av uavhengige variabler som betydelig påvirker den avhengige variabelen. Dette gjøres med datamaskiner gjennom iterasjon, som er prosessen med å komme til resultater eller beslutninger ved å gå gjennom gjentatte runder eller sykluser med analyse. Å gjennomføre tester automatisk med hjelp fra statistiske programvarepakker har fordelen av å spare tid for den enkelte.
Viktige takeaways
- Regresjonsanalyse er en statistisk tilnærming som søker å forstå og måle sammenhenger mellom uavhengige og avhengige variabler. Stegvis regresjon er en metode som undersøker den statistiske betydningen av hver uavhengige variabel i modellen. Fremgangsmåten for valg av valg legger til en variabel og tester deretter for statistisk betydning. Den bakover eliminasjonsmetoden begynner med en modell lastet med mange variabler og fjerner deretter en variabel for å teste dens betydning i forhold til de samlede resultatene. Stegvis regresjon har mange kritikere, da det er tilnærming som passer data til en modell for å oppnå et ønsket resultat.
Trinnvis regresjon kan oppnås enten ved å prøve ut en uavhengig variabel om gangen og inkludere den i regresjonsmodellen hvis den er statistisk signifikant eller ved å inkludere alle potensielle uavhengige variabler i modellen og eliminere de som ikke er statistisk signifikante. Noen bruker en kombinasjon av begge metodene, og det er derfor tre tilnærminger til trinnvis regresjon:
- Valg fremover begynner med ingen variabler i modellen, tester hver variabel når den er lagt til i modellen, og holder deretter de som anses som mest statistisk signifikante - gjenta prosessen til resultatene er optimale. Bakgrunnen eliminering starter med et sett av uavhengige variabler, slette en om gangen, deretter teste for å se om den fjernede variabelen er statistisk signifikant. Veiledende eliminering er en kombinasjon av de to første metodene som tester hvilke variabler som skal inkluderes eller ekskluderes.
Et eksempel på en trinnvis regresjon ved bruk av bakover eliminasjonsmetoden ville være et forsøk på å forstå energibruk på en fabrikk ved å bruke variabler som utstyrstid, utstyrsalder, stabstørrelse, temperaturer utenfor og årstid. Modellen inkluderer alle variablene - så fjernes hver enkelt om gangen for å bestemme hvilke som er minst statistisk signifikante. Til slutt kan modellen vise at tiden på året og temperaturene er mest betydningsfulle, noe som muligens antyder at energiforbruket på fabrikken er når klimaanlegget er på det høyeste.
Begrensninger i trinnvis regresjon
Regresjonsanalyse, både lineær og multivariat, er mye brukt i investeringsverdenen i dag. Ideen er ofte å finne mønstre som eksisterte i fortiden som kanskje også vil komme tilbake i fremtiden. En enkel lineær regresjon, for eksempel, kan se på pris-til-inntjeningsforhold og aksjeavkastning over mange år for å avgjøre om aksjer med lav P / E-ratio (uavhengig variabel) tilbyr høyere avkastning (avhengig variabel). Problemet med denne tilnærmingen er at markedsforholdene ofte endres og forhold som har vært i fortiden ikke nødvendigvis stemmer i nåtid eller fremtid.
I mellomtiden har den trinnvise regresjonsprosessen mange kritikere, og det er til og med samtaler om å slutte å bruke metoden helt. Statistikere merker flere ulemper ved tilnærmingen, inkludert feil resultater, en iboende skjevhet i selve prosessen, og nødvendigheten av betydelig datakraft for å utvikle komplekse regresjonsmodeller gjennom iterasjon.
