Varians er en måling av spredningen mellom tallene i et datasett. Variansen måler hvor langt hvert tall i settet er fra gjennomsnittet.
Ved hjelp av et datasettdiagram kan vi observere hva den lineære sammenhengen mellom de forskjellige datapunktene eller tallene er. Dette gjør vi ved å tegne en regresjonslinje, som prøver å minimere avstanden til ethvert individuelt datapunkt fra selve linjen. I diagrammet nedenfor er datapunktene de blå prikkene, den oransje linjen er regresjonslinjen, og de røde pilene er avstanden fra observerte data og regresjonslinjen.
Bilde av Julie Bang © Investopedia 2020
Når vi beregner en varians, spør vi, gitt forholdet mellom alle disse datapunktene, hvor stor avstand forventer vi på neste datapunkt? Denne "avstanden" kalles feilbegrepet, og det er hva variansen måler.
I seg selv er varians ofte ikke nyttig fordi den ikke har en enhet, noe som gjør det vanskelig å måle og sammenligne. Imidlertid er kvadratroten av avvik standardavviket, og det er både praktisk som en måling.
Beregner variant i Excel
Det er enkelt å beregne varians i Excel hvis du allerede har lagt inn datasettet i programvaren. I eksemplet nedenfor vil vi beregne variansen på 20 dager med daglig avkastning i det svært populære børshandlede fondet (ETF) som heter SPY, som investerer i S&P 500.
- Formelen er = VAR.S (velg data)
Årsaken til at du vil bruke VAR.S og ikke VAR.P (som er en annen formel som tilbys) er at du ofte ikke har hele datamengden å måle. For eksempel, hvis vi hadde alle avkastninger i historien til SPY ETF i tabellen vår, kunne vi bruke populasjonsmåling VAR.P, men siden vi bare måler de siste 20 dagene for å illustrere konseptet, vil vi bruke VAR.S.
Som du ser, forteller den beregnede variansverdien til.000018674 oss lite om datasettet, i seg selv. Hvis vi gikk videre med den firkantede roten for å få standardavviket for avkastning, ville det være mer nyttig.
