Hva er R-Squared?
R-kvadrat (R 2) er et statistisk mål som representerer andelen av variansen for en avhengig variabel som er forklart med en uavhengig variabel eller variabler i en regresjonsmodell. Mens korrelasjon forklarer styrken i forholdet mellom en uavhengig og avhengig variabel, forklarer R-kvadratet i hvilken grad variansen til en variabel forklarer variansen til den andre variabelen. Så hvis R2 for en modell er 0, 50, kan omtrent halvparten av den observerte variasjonen forklares med modellens innganger.
Ved investering blir R-kvadrat generelt tolket som prosentandelen av et fond eller verdipapirets bevegelser som kan forklares med bevegelser i en referanseindeks. For eksempel identifiserer en R-kvadrat for en rentepapir kontra en obligasjonsindeks sikkerhetsandelens andel av prisbevegelsen som er forutsigbar basert på en prisbevegelse på indeksen. Det samme kan brukes på en aksje versus S&P 500-indeksen, eller en hvilken som helst annen relevant indeks.
Det kan også være kjent som bestemmelseskoeffisienten.
Formelen for R-Squared Is
R2 = 1 − Total variasjonForklaret variasjon
Viktige takeaways
- R-Squared er et statistisk mål på passform som indikerer hvor mye variasjon av en avhengig variabel som er forklart av de uavhengige variablene i en regresjonsmodell. Ved investering tolkes R-squared generelt som prosentandelen av et fond eller verdipapirets bevegelser som kan forklares med bevegelser i en referanseindeks. En R-kvadrat på 100% betyr at alle bevegelser av en sikkerhet (eller annen avhengig variabel) er fullstendig forklart av bevegelser i indeksen (eller den uavhengige variabelen du er interessert i).
Beregning av R-kvadrat
Selve beregningen av R-kvadrat krever flere trinn. Dette inkluderer å ta datapunktene (observasjoner) for avhengige og uavhengige variabler og finne linjen med best passform, ofte fra en regresjonsmodell. Derfra ville du beregne forutsagte verdier, trekke fra faktiske verdier og kvadratere resultatene. Dette gir en liste over kvadratiske feil, som deretter summeres og tilsvarer den forklarte variansen.
For å beregne den totale variansen, vil du trekke den gjennomsnittlige faktiske verdien fra de forutsagte verdiene, kvadratere resultatene og summere dem. Derfra deler du den første summen av feil (forklart varians) med den andre summen (total varians), trekker resultatet fra en, så har du R-kvadratet.
R-kvadrat
Hva forteller R-Squared deg?
R-kvadratiske verdier varierer fra 0 til 1 og er ofte oppgitt som prosenter fra 0% til 100%. En R-kvadrat på 100% betyr at alle bevegelser av en sikkerhet (eller en annen avhengig variabel) er fullstendig forklart av bevegelser i indeksen (eller den uavhengige variabelen du er interessert i).
Ved å investere indikerer en høy R-kvadrat, mellom 85% og 100%, aksje- eller fondets ytelse beveger seg relativt i tråd med indeksen. Et fond med lav R-kvadrat, 70% eller mindre, indikerer at sikkerheten generelt ikke følger bevegelsene til indeksen. En høyere R-kvadratverdi vil indikere et mer nyttig betatall. For eksempel, hvis en aksje eller fond har en R-kvadratverdi på nær 100%, men har en beta under 1, er det mest sannsynlig at det gir høyere risikojustert avkastning.
Forskjellen mellom R-Squared og Justert R-Squared
R-Squared fungerer bare som beregnet i en enkel lineær regresjonsmodell med en forklaringsvariabel. Med en multiple regresjon som består av flere uavhengige variabler, må R-Squared justeres. Det justerte R-kvadratet sammenligner den beskrivende kraften til regresjonsmodeller som inkluderer forskjellige antall prediktorer. Hver prediktor som er lagt til i en modell, øker R-kvadratet og reduserer den aldri. Dermed kan en modell med flere termer synes å ha en bedre passform bare for det faktum at den har flere vilkår, mens den justerte R-kvadratet kompenserer for tilsetningen av variabler og bare øker hvis den nye termen forbedrer modellen over det som ville være oppnådd med sannsynlighet og reduseres når en prediktor forbedrer modellen mindre enn det som er forutsagt ved en tilfeldighet. I en overmonteringstilstand oppnås en feil høy verdi av R-kvadrat, som fører til redusert evne til å forutsi. Dette er ikke tilfelle med justert R-kvadrat.
Mens standard R-kvadrat kan brukes til å sammenligne godheten til to eller modellere forskjellige modeller, er justert R-kvadrat ikke en god beregning for å sammenligne ikke-lineære modeller eller flere lineære regresjoner.
Forskjellen mellom R-Squared og Beta
Beta og R-kvadrat er to relaterte, men forskjellige, målinger av korrelasjon, men beta er et mål på relativ risiko. Et aksjefond med høyt R-kvadrat korrelerer høyt med en referanseindeks. Hvis betaen også er høy, kan den gi høyere avkastning enn referanseporteføljen, spesielt i oksemarkeder. R-kvadrat måler hvor nær hver endring i pris på en eiendel er korrelert med en referanseindeks. Beta måler hvor store prisendringene er i forhold til en referanseindeks. Brukt sammen gir R-kvadrat og beta investorer et grundig bilde av ytelsen til kapitalforvaltere. En beta på nøyaktig 1, 0 betyr at risikoen (volatiliteten) for eiendelen er identisk med referanseporteføljen. I hovedsak er R-squared en statistisk analyseteknikk for praktisk bruk og pålitelighet av betas av verdipapirer.
Begrensninger av R-Squared
R-kvadrat vil gi deg et estimat av forholdet mellom bevegelser av en avhengig variabel basert på en uavhengig variabels bevegelser. Den forteller deg ikke om den valgte modellen din er god eller dårlig, og den vil heller ikke fortelle deg om dataene og spådommene er partiske. Et høyt eller lavt R-kvadrat er ikke nødvendigvis bra eller dårlig, siden det ikke formidler påliteligheten til modellen, og heller ikke om du har valgt riktig regresjon. Du kan få en lav R-kvadrat for en god modell, eller en høy R-kvadrat for en dårlig montert modell, og omvendt.
