Hva er multikollinearitet?
Multikollinearitet er forekomsten av høye interkorrelasjoner blant uavhengige variabler i en multippel regresjonsmodell. Multikollinearitet kan føre til skjevt eller misvisende resultater når en forsker eller analytiker prøver å bestemme hvor godt hver uavhengige variabel kan brukes mest effektivt for å forutsi eller forstå den avhengige variabelen i en statistisk modell. Generelt kan multikollinearitet føre til større konfidensintervaller og mindre pålitelige sannsynlighetsverdier for de uavhengige variablene. Det vil si at de statistiske slutningene fra en modell med multikollinearitet ikke er pålitelige.
Forstå multikollinearitet
Statistiske analytikere bruker flere regresjonsmodeller for å forutsi verdien av en spesifisert avhengig variabel basert på verdiene til to eller flere uavhengige variabler. Den avhengige variabelen blir noen ganger referert til som utfalls-, mål- eller kriterievariabelen. Et eksempel er en multivariat regresjonsmodell som prøver å forutse aksjeavkastning basert på elementer som pris / inntjeningsgrad, markedsverdi, tidligere resultater eller andre data. Aksjeavkastningen er den avhengige variabelen, og de forskjellige delene av økonomiske data er de uavhengige variablene.
Viktige takeaways
- Multikollinearitet er et statistisk konsept der uavhengige variabler i en modell er korrelert. Multikollinearitet blant uavhengige variabler vil resultere i mindre pålitelige statistiske inferenser. Det er bedre å bruke uavhengige variabler som ikke er korrelert eller repeterende når man bygger flere regresjonsmodeller som bruker to eller flere variabler.
Multikollinearitet i en multippel regresjonsmodell indikerer at kollinære uavhengige variabler er relatert på noen måte, selv om forholdet kanskje eller ikke er tilfeldig. For eksempel kan tidligere resultater være relatert til markedskapitalisering, da aksjer som har hatt gode resultater tidligere har økte markedsverdier. Med andre ord, multikollinearitet kan eksistere når to uavhengige variabler er sterkt korrelert. Det kan også skje hvis en uavhengig variabel beregnes fra andre variabler i datasettet, eller hvis to uavhengige variabler gir lignende og repeterende resultater.
En av de vanligste måtene å eliminere problemet med multikollinearitet er å først identifisere kollinære uavhengige variabler og deretter fjerne alle unntatt en. Det er også mulig å eliminere multikollinearitet ved å kombinere to eller flere kollinære variabler til en enkelt variabel. Statistisk analyse kan deretter utføres for å studere forholdet mellom den spesifiserte avhengige variabelen og bare en enkelt uavhengig variabel.
Eksempel på multikollinearitet
For investering er multikollinearitet en vanlig vurdering når du utfører teknisk analyse for å forutsi sannsynlige fremtidige kursbevegelser på et verdipapir, for eksempel en aksje eller en råvarefremtid. Markedsanalytikere ønsker å unngå å bruke tekniske indikatorer som er kollinære ved at de er basert på veldig like eller relaterte innspill; de har en tendens til å avsløre lignende prediksjoner angående den avhengige variabelen i prisbevegelse. I stedet må markedsanalyse være basert på markant forskjellige uavhengige variabler for å sikre at de analyserer markedet fra forskjellige uavhengige analytiske synspunkter.
Notert teknisk analytiker John Bollinger, skaper av Bollinger Bands-indikatoren, bemerker at "en kardinal regel for vellykket bruk av teknisk analyse krever at man unngår multikollinearitet blant indikatorer."
For å løse problemet unngår analytikere å bruke to eller flere tekniske indikatorer av samme type. I stedet analyserer de en sikkerhet ved hjelp av en type indikator, for eksempel en momentumindikator, og foretar deretter separat analyse ved hjelp av en annen type indikator, for eksempel en trendindikator.
Et eksempel på et potensielt multikollinearitetsproblem er å utføre teknisk analyse bare ved bruk av flere lignende indikatorer, for eksempel stokastikk, relativ styrkeindeks (RSI) og Williams% R, som alle er momentumindikatorer som er avhengige av lignende innganger og sannsynligvis vil produsere lignende resultater. I dette tilfellet er det bedre å fjerne alle unntatt en av indikatorene, eller finne en måte å slå sammen flere av dem til bare en indikator, samtidig som du legger til en trendindikator som sannsynligvis ikke vil være sterkt korrelert med momentumindikatoren.
