Hva er bestemmelseskoeffisienten?
Bestemmelseskoeffisienten er et mål som brukes i statistisk analyse som vurderer hvor godt en modell forklarer og spår fremtidige resultater. Det er en indikasjon på nivået av forklart variasjon i datasettet. Bestemmelseskoeffisienten, også ofte kjent som "R-kvadrat", brukes som en retningslinje for å måle modellens nøyaktighet.
En måte å tolke dette tallet på er å si at variablene inkludert i en gitt modell forklarer omtrent x% av den observerte variasjonen. Så hvis R2 = 0, 50, kan omtrent halvparten av den observerte variasjonen forklares med modellen.
R-kvadrat
Viktige takeaways
- Bestemmelseskoeffisienten er en kompleks idé sentrert om den statistiske analysen av en fremtidig datamodell. Bestemmelseskoeffisienten brukes til å forklare hvor stor variasjon av en faktor som kan være forårsaket av forholdet til en annen faktor.
Forstå bestemmelseskoeffisienten
Bestemmelseskoeffisienten brukes til å forklare hvor stor variasjon av en faktor som kan være forårsaket av forholdet til en annen faktor. Den er avhengig av kraftig i trendanalyse og er representert som en verdi mellom 0 og 1.
Jo nærmere verdien er 1, jo bedre er passformen eller forholdet mellom de to faktorene. Bestemmelseskoeffisienten er kvadratet av korrelasjonskoeffisienten, også kjent som "R", som lar den vise graden av lineær korrelasjon mellom to variabler.
Denne korrelasjonen er kjent som "godhet med passform." En verdi på 1, 0 indikerer perfekt passform, og det er dermed en veldig pålitelig modell for fremtidige prognoser, noe som indikerer at modellen forklarer alle observerte variasjoner. En verdi på 0 derimot, indikerer at modellen ikke klarer å modellere dataene i det hele tatt. For en modell med flere variabler, for eksempel en multiple regresjonsmodell, er den justerte R2 en bedre bestemmelseskoeffisient. I økonomi blir en R2-verdi over 0, 60 sett på som verdt.
Fordeler med å analysere bestemmelseskoeffisienten
Bestemmelseskoeffisienten er kvadratet av korrelasjonen mellom de forutsagte score i et datasett kontra det faktiske settet med score. Det kan også uttrykkes som kvadratet for korrelasjonen mellom X- og Y-score, hvor X er den uavhengige variabelen og Y er den avhengige variabelen.
Uansett representasjon, betyr en R-kvadrat lik 0 at den avhengige variabelen ikke kan forutsies ved bruk av den uavhengige variabelen. Motsatt, hvis det tilsvarer 1, betyr det at den avhengige av en variabel alltid er spådd av den uavhengige variabelen.
En bestemmelseskoeffisient som faller innenfor dette området, måler i hvilken grad den avhengige variabelen er spådd av den uavhengige variabelen. En R-kvadrat på 0, 20 betyr for eksempel at 20% av den avhengige variabelen er spådd av den uavhengige variabelen.
Passformens godhet, eller graden av lineær sammenheng, måler avstanden mellom en montert linje på en graf og alle datapunktene som er spredt rundt grafen. Det stramme datasettet vil ha en regresjonslinje som er veldig nær poengene og har et høyt passningsnivå, noe som betyr at avstanden mellom linjen og dataene er veldig liten. En god passform har en R-kvadrat som er nær 1.
Imidlertid er R-squared ikke i stand til å bestemme om datapunktene eller spådommene er partiske. Det forteller heller ikke analytikeren eller brukeren om koeffisienten for bestemmelsesverdi er god eller ikke. En lav R-kvadrat er for eksempel ikke dårlig, og det er opp til personen å ta en avgjørelse basert på R-kvadratnummeret.
Bestemmelseskoeffisienten skal ikke tolkes naivt. For eksempel, hvis R-kvadratet til en modell rapporteres til 75%, er variansen til feilene 75% mindre enn variasjonen til den avhengige variabelen, og standardavviket for feilene er 50% mindre enn standardavviket til den avhengige variabel. Standardavviket for modellens feil er omtrent en tredjedel av størrelsen på standardavviket for feilene du vil få med en modell som kun er konstant.
Til slutt, selv om en R-kvadratverdi er stor, kan det ikke være noen statistisk betydning av forklaringsvariablene i en modell, eller den effektive størrelsen på disse variablene kan være veldig liten i praktisk termer.
