Hva er en variasjonsinflasjonsfaktor?
Variansinflasjon fVariance inflasjonsfaktor (VIF) er et mål på mengden multikollinearitet i et sett med flere regresjonsvariabler. Matematisk er VIF for en regresjonsmodellvariabel lik forholdet mellom den generelle modellvariansen og variansen til en modell som bare inkluderer den enkeltstående uavhengige variabelen. Dette forholdet beregnes for hver uavhengige variabel. En høy VIF indikerer at den tilhørende uavhengige variabelen er svært kollinær med de andre variablene i modellen.
Viktige takeaways
- En variansinflasjonsfaktor (VIF) gir et mål på multikollinearitet blant de uavhengige variablene i en multippel regresjonsmodell. Å oppdage multikollinearitet er viktig fordi det ikke reduserer modellens forklaringskraft, men reduserer den statistiske betydningen av de uavhengige variablene. En stor VIF på en uavhengig variabel indikerer et sterkt kollinært forhold til de andre variablene som bør vurderes eller justeres for i strukturen til modellen og valg av uavhengige variabler.
Forstå en variasjonsinflasjonsfaktor
En multippel regresjon brukes når en person vil teste effekten av flere variabler på et bestemt utfall. Den avhengige variabelen er utfallet som blir utøvd av de uavhengige variablene, som er innspillene i modellen. Multikollinearitet eksisterer når det er en lineær sammenheng, eller korrelasjon, mellom en eller flere av de uavhengige variablene eller inngangene. Multikollinearitet skaper et problem i den multiple regresjonen fordi siden innspillene alle påvirker hverandre, er de faktisk ikke uavhengige, og det er vanskelig å teste hvor mye kombinasjonen av de uavhengige variablene påvirker den avhengige variabelen eller utfallet i regresjonsmodellen.. Statistisk sett vil en multippel regresjonsmodell der det er høy multikollinearitet gjøre det vanskeligere å estimere forholdet mellom hver av de uavhengige variablene og den avhengige variabelen. Små endringer i dataene som er brukt eller i strukturen til modellligningen kan gi store og uberegnelige endringer i de estimerte koeffisientene på de uavhengige variablene.
For å sikre at modellen er riktig spesifisert og fungerer korrekt, er det tester som kan kjøres for multikollinearitet. Variasjonsinflasjonsfaktor er et slikt måleverktøy. Å bruke variansinflasjonsfaktorer er med på å identifisere alvorlighetsgraden av eventuelle multikollinearitetsproblemer, slik at modellen kan justeres. Variasjonsinflasjonsfaktor måler hvor mye atferden (variansen) til en uavhengig variabel påvirkes, eller oppblåses, av dens interaksjon / korrelasjon med de andre uavhengige variablene. Variasjonsinflasjonsfaktorer tillater et raskt mål på hvor mye en variabel bidrar til standardfeilen i regresjonen. Når det foreligger betydelige multikollinearitetsproblemer, vil variansinflasjonsfaktoren være veldig stor for de involverte variablene. Etter at disse variablene er identifisert, kan flere tilnærminger brukes til å eliminere eller kombinere kollinære variabler, og løse multikollinearitetsproblemet.
Selv om multikollinearitet ikke reduserer modellens samlede prediktive kraft, kan den gi estimater av regresjonskoeffisientene som ikke er statistisk signifikante. På en måte kan det tenkes som en slags dobbeltregning i modellen. Når to eller flere uavhengige variabler er nært beslektede eller måler nesten den samme tingen, blir den underliggende effekten som de måler regnskapsført to ganger (eller flere) på tvers av variablene, og det blir vanskelig eller umulig å si hvilken variabel som virkelig påvirker uavhengig variabel. Dette er et problem fordi målet med mange økonometriske modeller er å teste nøyaktig denne typen statistiske forhold mellom de uavhengige variablene og den avhengige variabelen.
For eksempel, hvis en økonom ønsker å teste om det er en statistisk signifikant sammenheng mellom arbeidsledigheten (som en uavhengig variabel) og inflasjonsraten (som den avhengige variabelen). Hvis du inkluderer ekstra uavhengige variabler som er relatert til arbeidsledigheten, vil slike nye innledende krav til arbeidsløshet sannsynligvis innføre multikollinearitet i modellen. Den overordnede modellen kan vise til sterk, statistisk tilstrekkelig forklaringskraft, men kan ikke identifisere om effekten hovedsakelig skyldes arbeidsledigheten eller de nye innledende kravene til arbeidsløshet. Dette er hva VIF vil oppdage, og det vil antyde at du kanskje dropper en av variablene ut av modellen eller finner en måte å konsolidere dem for å fange deres felles effekt, avhengig av hvilken spesifikk hypotese forskeren er interessert i å teste.
