Hva er en T-distribusjon?
T-fordelingen, også kjent som Studentens t-distribusjon, er en type sannsynlighetsfordeling som ligner på normalfordelingen med bjelleformen, men har tyngre haler. T-fordelinger har større sjanse for ekstreme verdier enn normale fordelinger, derav de fetere halene.
Viktige takeaways
- T-fordelingen er en kontinuerlig sannsynlighetsfordeling av z-poengsum når det estimerte standardavviket brukes i nevneren i stedet for det sanne standardavviket. T-fordelingen, som normalfordelingen, er bjelleformet og symmetrisk, men den har tyngre haler, noe som betyr at det har en tendens til å produsere verdier som faller langt fra dets gjennomsnitt. T-tester brukes i statistikk for å estimere betydning.
Hva forteller en T-distribusjon deg?
Haletyngden bestemmes av en parameter for T-fordelingen kalt frihetsgrader, med mindre verdier som gir tyngre haler, og med høyere verdier som gjør at T-fordelingen ligner en standard normalfordeling med et gjennomsnitt på 0, og et standardavvik på 1. T-distribusjon er også kjent som "Student's T Distribution."
Den blå regionen illustrerer en to-halers hypotetest. CKTaylor
Når en prøve av n observasjoner er tatt fra en normalt fordelt populasjon som har gjennomsnittlig M og standardavvik D, vil prøvenes gjennomsnitt, m og prøven standardavvik, d, avvike fra M og D på grunn av prøvenes tilfeldighet.
En z-poengsum kan beregnes med populasjonsstandardavviket som Z = (m - M) / {D / sqrt (n)}, og denne verdien har normalfordeling med gjennomsnitt 0 og standardavvik 1. Men når denne z- poengsum beregnes ved å bruke estimert standardavvik, og gir T = (m - M) / {d / sqrt (n)}, forskjellen mellom d og D gjør at fordelingen er en T-distribusjon med (n - 1) frihetsgrader i stedet for normalfordelingen med gjennomsnitt 0 og standardavvik 1.
Eksempel på hvordan du bruker en T-distribusjon
Ta følgende eksempel for hvordan t-distribusjoner blir brukt i statistisk analyse. Husk først at et konfidensintervall for middelverdien er et verdiområde, beregnet ut fra dataene, ment for å fange et “populasjonsmiddel”. Dette intervallet er m + - t * d / sqrt (n), hvor t er en kritisk verdi fra T-fordelingen.
For eksempel er et 95% konfidensintervall for gjennomsnittlig avkastning av Dow Jones Industrial Average i de 27 handelsdagene før 9/11/2001 -0, 33%, (+/- 2, 055) * 1, 07 / sqrt (27), gir en (vedvarende) gjennomsnittlig avkastning som et antall mellom -0, 75% og + 0, 09%. Tallet 2.055, mengden standardfeil å justere etter, finnes fra T-distribusjonen.
Fordi T-distribusjonen har fetere haler enn en normalfordeling, kan den brukes som en modell for økonomisk avkastning som viser overflødig kurtose, noe som vil gi rom for en mer realistisk beregning av Value at Risk (VaR) i slike tilfeller.
Forskjellen mellom en T-distribusjon og en normal distribusjon
Normale fordelinger brukes når befolkningsfordelingen antas å være normal. T-fordelingen er lik normalfordelingen, bare med fetere haler. Begge antar en normalt fordelt befolkning. T-distribusjoner har høyere kurtose enn normale distribusjoner. Sannsynligheten for å få verdier veldig langt fra gjennomsnittet er større med en T-distribusjon enn en normalfordeling.
Begrensninger ved bruk av en T-distribusjon
T-fordelingen kan skje nøyaktighet i forhold til normalfordelingen. Mangelen oppstår bare når det er behov for perfekt normalitet. Forskjellen mellom å bruke en normal og T-distribusjon er imidlertid relativt liten.
