Hva er den resterende summen av kvadrater (RSS)?
En gjenværende sum av kvadrater (RSS) er en statistisk teknikk som brukes til å måle variansmengden i et datasett som ikke er forklart med en regresjonsmodell. Regresjon er en måling som hjelper til med å bestemme styrken i forholdet mellom en avhengig variabel og en serie andre endrede variabler eller uavhengige variabler.
Den resterende summen av kvadratene måler mengden feil som gjenstår mellom regresjonsfunksjonen og datasettet. En mindre gjenværende sum av kvadratetallet representerer en regresjonsfunksjon. Rest sum av kvadrater - også kjent som summen av kvadratiske rester - bestemmer i hovedsak hvor godt en regresjonsmodell forklarer eller representerer dataene i modellen.
Viktige takeaways
- En gjenværende sum av kvadrater (RSS) er en statistisk teknikk som brukes til å måle variansmengden i et datasett som ikke er forklart med en regresjonsmodell. Restsummen av kvadrater er en av mange statistiske egenskaper som nyter en renessanse i finansmarkedene. Ideelt sett bør summen av kvadratiske rester være en mindre eller lavere verdi i enhver regresjonsmodell.
Forstå den resterende summen av kvadrater (RSS)
Finansmarkedene har i økende grad blitt mer kvantitativt drevet; som sådan, på jakt etter en fordel, bruker mange investorer avanserte statistiske teknikker for å hjelpe sine beslutninger. Big data, maskinlæring og kunstig intelligens applikasjoner krever ytterligere bruk av statistiske egenskaper for å veilede moderne investeringsstrategier. Den resterende summen av kvadrater - eller RSS-statistikk - er en av mange statistiske egenskaper som nyter en renessanse.
Statistiske modeller brukes av investorer og porteføljeforvaltere for å spore en investerings pris og bruke disse dataene til å forutsi fremtidige bevegelser. Studien - kalt regresjonsanalyse - kan innebære å analysere forholdet i prisbevegelser mellom en vare og aksjene til selskaper som driver med å produsere varen.
Enhver modell kan ha avvik mellom forutsagte verdier og faktiske resultater. Selv om avvikene kan forklares med regresjonsanalysen, representerer restsummen av kvadrater variansene eller feilene som ikke er forklart.
Siden en tilstrekkelig kompleks regresjonsfunksjon kan gjøres for å tilpasse praktisk talt ethvert datasett, er ytterligere studier nødvendig for å bestemme om regresjonsfunksjonen faktisk er nyttig for å forklare variansen til datasettet. Typisk er imidlertid en mindre eller lavere verdi for den resterende summen av firkanter ideell i enhver modell, siden det betyr at det er mindre variasjon i datasettet. Med andre ord, jo lavere summen av kvadratiske rester, jo bedre er regresjonsmodellen til å forklare dataene.
