Normaldistribusjonsformelen er basert på to enkle parametere - gjennomsnitt og standardavvik - som kvantifiserer egenskapene til et gitt datasett. Mens middelet indikerer den "sentrale" eller gjennomsnittsverdien for hele datasettet, indikerer standardavviket "spredning" eller variasjon av datapunkter rundt den gjennomsnittlige verdien.
Vurder følgende 2 datasett:
Datasett 1 = {10, 10, 10, 10, 10, 10, 10, 10, 10, 10}
Datasett 2 = {6, 8, 10, 12, 14, 14, 12, 10, 8, 6}
For Dataset1 betyr middel = 10 og standardavvik (stddev) = 0
For Dataset2 betyr gjennomsnitt = 10 og standardavvik (stddev) = 2, 83
La oss tegne disse verdiene for DataSet1:
Tilsvarende for DataSet2:
Den røde horisontale linjen i begge grafene ovenfor indikerer "middelverdien" eller gjennomsnittsverdien for hvert datasett (10 i begge tilfeller). De rosa pilene i den andre grafen indikerer spredning eller variasjon av dataverdier fra middelverdien. Dette er representert med standardavviksverdi på 2, 83 i tilfelle DataSet2. Siden DataSet1 har alle verdier like (som 10 hver) og ingen variasjoner, er stddev-verdien null, og derfor er ingen rosa piler gjeldende.
Stddev-verdien har noen få betydningsfulle og nyttige egenskaper som er ekstremt nyttige i dataanalyse. For en normalfordeling er dataverdiene symmetrisk fordelt på hver side av middelverdien. For ethvert normalt distribuert datasett, plottdiagram med stddev på horisontal akse og nr. av dataverdier på vertikal akse, oppnås følgende graf.
Egenskaper ved en normal distribusjon
- Normalkurven er symmetrisk om middelverdien; Gjennomsnittet er i midten og deler området i to halvdeler; Det totale arealet under kurven er lik 1 for gjennomsnittet = 0 og stdev = 1; Fordelingen er fullstendig beskrevet av dens gjennomsnitt og stddev
Som det fremgår av grafen over representerer stddev følgende:
- 68, 3% av dataverdiene er innenfor 1 standardavvik fra gjennomsnittet (-1 til +1) 95, 4% av dataverdiene er innenfor 2 standardavvik for gjennomsnittet (-2 til +2) 99, 7% av dataverdiene er innenfor 3 standardavvik av gjennomsnittet (-3 til +3)
Området under den klokkeformede kurven indikerer, når det er målt, ønsket sannsynlighet for et gitt område:
- mindre enn X: - f.eks. sannsynligheten for at dataverdier er mindre enn 70 større enn X - f.eks. sannsynligheten for at dataverdiene er større enn 95 mellom X 1 og X 2 - f.eks. sannsynligheten for dataverdier mellom 65 og 85
der X er en verdi av interesse (eksempler nedenfor).
Å plotte og beregne området er ikke alltid praktisk, da forskjellige datasett vil ha forskjellige middelverdier og stddevverdier. For å tilrettelegge for en enhetlig standardmetode for enkle beregninger og anvendeligheten til problemer i den virkelige verden, ble standardkonvertering til Z-verdier introdusert, som utgjør en del av Normal Distribusjon Tabell.
Z = (X - middel) / stddev, der X er den tilfeldige variabelen.
I utgangspunktet tvinger denne konverteringen middelverdien og stddev til å standardiseres til henholdsvis 0 og 1, noe som gjør det mulig å bruke et standarddefinert sett med Z-verdier (fra normalfordelingstabellen) for enkle beregninger. Et snapshot av standard z-verdistabell som inneholder sannsynlighetsverdier er som følger:
z |
0, 00 |
0.01 |
0, 02 |
0, 03 |
0, 04 |
0.05 |
0, 06 |
0.0 |
0, 00000 |
0, 00399 |
0, 00798 |
0, 01197 |
0, 01595 |
0, 01994 |
… |
0.1 |
0, 0398 |
0, 04380 |
0, 04776 |
0, 05172 |
0, 05567 |
0, 05966 |
… |
0.2 |
0, 0793 |
0, 08317 |
0, 08706 |
0, 09095 |
0, 09483 |
0, 09871 |
… |
0.3 |
0, 11791 |
0, 12172 |
0, 12552 |
0, 12930 |
0, 13307 |
0, 13683 |
… |
0.4 |
0, 15542 |
0, 15910 |
0, 16276 |
0, 16640 |
0, 17003 |
0, 17364 |
… |
0.5 |
0, 19146 |
0, 19497 |
0, 19847 |
0, 20194 |
0, 20540 |
0, 20884 |
… |
0.6 |
0, 22575 |
0, 22907 |
0, 23237 |
0, 23565 |
0, 23891 |
0, 24215 |
… |
0.7 |
0, 25804 |
0, 26115 |
0, 26424 |
0, 26730 |
0, 27035 |
0, 27337 |
… |
... |
… |
… |
… |
… |
… |
… |
… |
For å finne sannsynligheten relatert til z-verdien på 0.239865, avrund den først til 2 desimaler (dvs. 0, 24). Kontroller deretter for de to første signifikante sifrene (0.2) i radene og for det minst betydelige sifferet (gjenværende 0, 04) i kolonnen. Det vil føre til en verdi av 0, 09483.
Her finner du hele normalfordelingstabellen, med presisjon opptil 5 desimaler for sannsynlighetsverdier (inkludert de for negative verdier).
La oss se noen eksempler fra det virkelige liv. Høyden på individer i en stor gruppe følger et normalt distribusjonsmønster. Anta at vi har et sett på 100 individer hvis høyder er registrert og gjennomsnittet og stddev er beregnet til henholdsvis 66 og 6 inches.
Her er noen eksempler på spørsmål som enkelt kan besvares ved bruk av z-verdistabellen:
- Hva er sannsynligheten for at en person i gruppen er 70 tommer eller mindre?
Spørsmål er å finne kumulativ verdi av P (X <= 70) dvs. i hele datasettet på 100, hvor mange verdier vil være mellom 0 og 70.
La oss først konvertere X-verdi på 70 til den tilsvarende Z-verdien.
Z = (X - middel) / stddev = (70-66) / 6 = 4/6 = 0.66667 = 0, 67 (runde til 2 desimaler)
Vi må nå finne P (Z <= 0.67) = 0. 24857 (fra z-tabellen over)
det vil si at det er en 24.857% sannsynlighet for at et individ i gruppen vil være mindre enn eller lik 70 tommer.
Men hold på - ovenstående er ufullstendig. Husk at vi leter etter sannsynlighet for alle mulige høyder opp til 70 dvs. fra 0 til 70. Ovennevnte gir deg bare delen fra middel til ønsket verdi (dvs. 66 til 70). Vi må inkludere den andre halvparten - fra 0 til 66 - for å komme frem til riktig svar.
Siden 0 til 66 representerer halvparten (dvs. en ekstrem til midtveis gjennomsnitt), er sannsynligheten ganske enkelt 0, 5.
Derav riktig sannsynlighet for at en person er 70 tommer eller mindre = 0.24857 + 0.5 = 0. 74857 = 74.857%
Grafisk (ved å beregne området) er dette de to oppsummerte regionene som representerer løsningen:
- Hva er sannsynligheten for at en person er 75 tommer eller høyere?
dvs. Finn komplementær kumulativ P (X> = 75).
Z = (X - middel) / stddev = (75-66) / 6 = 9/6 = 1, 5
P (Z> = 1, 5) = 1- P (Z <= 1, 5) = 1 - (0, 5 + 0, 43319) = 0, 06681 = 6, 681%
- Hva er sannsynligheten for at en person er mellom 52 tommer og 67 tommer?
Finn P (52 <= X <= 67).
P (52 <= X <= 67) = P = P (-2, 33 <= Z <= 0, 17)
= P (Z <= 0, 17) –P (Z <= -0, 233) = (0, 5 + 0, 56749) - (.40905) =
Denne normale distribusjonstabellen (og z-verdiene) finner ofte bruk for alle sannsynlighetsberegninger på forventede kursbevegelser i aksjemarkedet for aksjer og indekser. De brukes i rekkebasert handel, identifisering av trend eller nedtrend, støtte eller motstandsnivå, og andre tekniske indikatorer basert på normale distribusjonsbegrep for gjennomsnitt og standardavvik.
Sammenlign investeringskontoer × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra. Leverandørens beskrivelserelaterte artikler
Handel grunnleggende utdanning
Hypotetesting i finans: konsept og eksempler
Risikostyring
Optimaliser porteføljen din ved hjelp av normal distribusjon
Teknisk analyse grunnutdanning
Den lineære regresjonen av tid og pris
Risikostyring
Bruken og begrensningene for flyktighet
Finansiell analyse
Hvordan beregne Value at Risk (VaR) i Excel
Verktøy for grunnleggende analyse
Forstå målinger av volatilitet
PartnerkoblingerRelaterte vilkår
Konfidensintervall Definisjon Konfidensintervall, i statistikk, refererer til sannsynligheten for at en populasjonsparameter vil falle mellom to angitte verdier. mer Risikostyring i finans I finansverdenen er risikostyring prosessen med å identifisere, analysere og akseptere eller redusere usikkerhet i investeringsbeslutninger. Risikostyring oppstår når en investor eller fondsforvalter analyserer og forsøker å tallfeste potensialet for tap i en investering. mer Forstå Spot Rate Treasury Curve Spot rate Treasury curve er definert som en avkastningskurve konstruert ved bruk av Treasury spotrenter fremfor avkastning. Spotrenten Treasury curve kan brukes som målestokk for prisfastsettelse av obligasjoner. mer Definisjon av Gini-indeks Gini-indeksen er et statistisk mål for distribusjon som ofte brukes som et mål for økonomisk ulikhet. mer Capital Asset Pricing Model (CAPM) Capital Asset Pricing Model er en modell som beskriver forholdet mellom risiko og forventet avkastning. mer Forstå det harmoniske middelet Det harmoniske middelverdien er et gjennomsnitt som brukes i finans for å gjennomsnittlig multipliser som pris-inntjeningsgraden. mer