Innholdsfortegnelse
- Hva er en T-test?
- Forklare T-testen
- Tvetydige testresultater
- T-test antagelser
- Beregning av T-tester
- Korrelert (eller sammenkoblet) T-test
- Equal Variance (Pooled) T-test
- Ujevn variasjon T-test
- Bestemme hvilken T-test du skal bruke
- Uvanlig variant T-testeksempel
Hva er en T-test?
En t-test er en type inferensiell statistikk som brukes for å avgjøre om det er en betydelig forskjell mellom midlene til to grupper, som kan ha sammenheng i visse funksjoner. Det brukes mest når datasettene, i likhet med datasettet som er registrert som resultatet av å vende en mynt 100 ganger, vil følge en normal fordeling og kan ha ukjente avvik. En t-test brukes som et testverktøy for hypotese, som tillater testing av en antagelse som er relevant for en populasjon.
En t-test ser på t-statistikken, t-distribusjonsverdiene og frihetsgradene for å bestemme sannsynligheten for forskjell mellom to datasett. For å gjennomføre en test med tre eller flere variabler, må man bruke en variansanalyse.
T-Test
Forklare T-testen
I hovedsak lar en t-test oss sammenligne gjennomsnittsverdiene for de to datasettene og bestemme om de kom fra samme populasjon. I eksemplene ovenfor, hvis vi skulle ta et utvalg av studenter fra klasse A og et annet utvalg av elever fra klasse B, ville vi ikke forvente at de hadde nøyaktig samme middelverdi og standardavvik. Tilsvarende, prøver tatt fra den placebo-matede kontrollgruppen og de som ble tatt fra den medikament som ble foreskrevet, bør ha et litt annet gjennomsnitt og standardavvik.
Matematisk tar t-testen en prøve fra hvert av de to settene og etablerer problemstillingen ved å anta en nullhypotese om at de to midlene er like. Basert på gjeldende formler, blir visse verdier beregnet og sammenlignet med standardverdiene, og antatt nullhypotese blir akseptert eller avvist i samsvar med det.
Hvis nullhypotesen kvalifiserer til å bli avvist, indikerer det at datavlesningen er sterk og ikke er tilfeldig. T-testen er bare en av mange tester som brukes til dette formålet. Statistikere må i tillegg bruke andre tester enn t-testen for å undersøke flere variabler og tester med større prøvestørrelser. For en stor prøvestørrelse bruker statistikere en z-test. Andre testalternativer inkluderer chi-square-testen og f-testen.
Det er tre typer t-tester, og de kategoriseres som avhengige og uavhengige t-tester.
Viktige takeaways
- En t-test er en type inferensiell statistikk som brukes for å avgjøre om det er en betydelig forskjell mellom midlene til to grupper, som kan være relatert til visse funksjoner. T-testen er en av mange tester som brukes til hypotetesting i statistikk. Beregning av en t-test krever tre viktige dataverdier. De inkluderer forskjellen mellom middelverdiene fra hvert datasett (kalt gjennomsnittsforskjellen), standardavviket for hver gruppe, og antall dataverdier for hver gruppe. Det er flere forskjellige typer t-test som kan utføres avhengig av på nødvendige data og type analyse.
Tvetydige testresultater
Tenk på at en legemiddelprodusent ønsker å teste en nyoppfunnet medisin. Den følger standard prosedyre for å prøve stoffet på en gruppe pasienter og gi placebo til en annen gruppe, kalt kontrollgruppen. Placebo gitt til kontrollgruppen er et stoff uten beregnet terapeutisk verdi og fungerer som et mål for å måle hvordan den andre gruppen, som får det aktuelle stoffet, reagerer.
Etter medisinforsøket rapporterte medlemmene i den placebo-matede kontrollgruppen en økning i gjennomsnittlig levealder på tre år, mens medlemmene i gruppen som får forskrevet det nye legemidlet rapporterer om en økning i gjennomsnittlig levealder på fire år. Øyeblikkelig observasjon kan indikere at stoffet faktisk fungerer ettersom resultatene er bedre for gruppen som bruker stoffet. Imidlertid er det også mulig at observasjonen kan skyldes en tilfeldig forekomst, spesielt et overraskende stykke flaks. En t-test er nyttig for å konkludere om resultatene faktisk er riktige og gjeldende for hele befolkningen.
På en skole scoret 100 elever i klasse A i gjennomsnitt 85% med et standardavvik på 3%. Ytterligere 100 elever som tilhørte klasse B scoret i gjennomsnitt 87% med et standardavvik på 4%. Mens gjennomsnittet av klasse B er bedre enn det for klasse A, kan det ikke være riktig å hoppe til den konklusjon at den samlede ytelsen til elevene i klasse B er bedre enn studentene i klasse A. Dette skyldes, sammen med betyr at standardavviket for klasse B også er høyere enn det for klasse A. Det indikerer at deres ekstreme prosenter, på nedre og høyere side, var mye mer spredt sammenlignet med den i klasse A. En t-test kan bidra til å bestemme hvilken klasse gikk bedre.
T-test antagelser
- Den første antagelsen om t-tester gjelder målestokk. Forutsetningen for en t-test er at måleskalaen som brukes på dataene som samles inn, følger en kontinuerlig eller ordinær skala, for eksempel score for en IQ-test. Den andre forutsetningen som er gjort er at en enkel tilfeldig prøve, at dataene er samlet fra en representativ, tilfeldig valgt del av den totale befolkningen. Den tredje forutsetningen er at dataene, når de er plottet, resulterer i en normal fordeling, bjelleformet distribusjonskurve. Den fjerde antakelsen er en rimelig stor prøvestørrelse brukes. Større prøvestørrelse betyr at fordelingen av resultatene bør nærme seg en normal bjelleformet kurve. Den endelige forutsetningen er homogeniteten til variansen. Homogen eller lik varians eksisterer når standardavvikene for prøver er tilnærmet like.
Beregning av T-tester
Beregning av en t-test krever tre viktige dataverdier. De inkluderer forskjellen mellom middelverdiene fra hvert datasett (kalt gjennomsnittsforskjellen), standardavviket for hver gruppe og antall dataverdier for hver gruppe.
Utfallet av t-testen produserer t-verdien. Denne beregnede t-verdien blir deretter sammenlignet med en verdi oppnådd fra en kritisk verdistabell (kalt T-distribusjonstabellen). Denne sammenligningen hjelper til med å bestemme hvor sannsynlig forskjellen mellom midlene skjedde ved en tilfeldighet eller om datasettene virkelig har iboende forskjeller. T-testen stiller spørsmål ved om forskjellen mellom gruppene representerer en sann forskjell i studien eller om det sannsynligvis er en meningsløs statistisk forskjell.
T-distribusjonsbord
T-distribusjonstabellen er tilgjengelig i en-hale og to-halers format. Førstnevnte brukes til å vurdere saker som har en fast verdi eller et område med en tydelig retning (positiv eller negativ). For eksempel, hva er sannsynligheten for at utgangsverdien forblir under -3, eller blir mer enn syv når du ruller et par terninger? Det siste brukes til rekkevidde-bundet analyse, for eksempel å spørre om koordinatene faller mellom -2 og +2.
Beregningene kan utføres med standardprogrammer som støtter nødvendige statistiske funksjoner, som de som finnes i MS Excel.
T-verdier og frihetsgrader
T-testen produserer to verdier som utgang: t-verdi og frihetsgrader. T-verdien er et forhold mellom forskjellen mellom gjennomsnittet av de to prøvesettene og forskjellen som eksisterer i prøvesettene. Mens tellerverdien (forskjellen mellom middelet til de to prøvesettene) er enkel å beregne, kan nevneren (forskjellen som eksisterer i prøvesettene) bli litt komplisert avhengig av hvilken type dataverdier som er involvert. Nevner av forholdet er en måling av spredning eller variabilitet. Høyere verdier av t-verdien, også kalt t-score, indikerer at det er en stor forskjell mellom de to prøvesettene. Jo mindre t-verdi, desto mer likhet eksisterer det mellom de to prøvesettene.
- En stor t-poengsum indikerer at gruppene er forskjellige. En liten t-poengsum indikerer at gruppene er like.
Grader av frihet refererer til verdiene i en studie som har frihet til å variere og er avgjørende for å vurdere viktigheten og gyldigheten av nullhypotesen. Beregning av disse verdiene avhenger vanligvis av antall dataposter som er tilgjengelige i prøvesettet.
Korrelert (eller sammenkoblet) T-test
Den korrelerte t-testen blir utført når prøvene typisk består av matchede par av lignende enheter, eller når det er tilfeller av gjentatte tiltak. Det kan for eksempel være tilfeller av at de samme pasientene blir testet gjentatte ganger - før og etter å ha mottatt en bestemt behandling. I slike tilfeller blir hver pasient brukt som kontrollprøve mot seg selv.
Denne metoden gjelder også tilfeller der prøvene er relatert på noen måte eller har samsvarende egenskaper, for eksempel en sammenlignende analyse som involverer barn, foreldre eller søsken. Korrelerte eller sammenkoblede t-tester er av avhengig type, da disse involverer tilfeller der de to settene med prøver er relatert.
Formelen for beregning av t-verdien og frihetsgrader for en sammenkoblet t-test er:
- Gjennomsnitt1 og gjennomsnitt2 er gjennomsnittsverdiene for hvert av prøvesettene, mens var1 og var2 representerer variansen til hvert av prøvesettene.
De resterende to typene tilhører de uavhengige t-testene. Prøvene av disse typene er valgt uavhengig av hverandre - det vil si at datasettene i de to gruppene ikke refererer til de samme verdiene. De inkluderer tilfeller som en gruppe på 100 pasienter som blir delt opp i to sett med 50 pasienter hver. En av gruppene blir kontrollgruppen og får placebo, mens den andre gruppen får den foreskrevne behandlingen. Dette utgjør to uavhengige utvalgsgrupper som er uparret med hverandre.
Lik variasjon (eller samlet) T-test
T-testen for lik varians brukes når antall prøver i hver gruppe er det samme, eller hvis variansen til de to datasettene er lik. Følgende formel brukes for å beregne t-verdi og frihetsgrader for likvarians t-test:
T-verdi = n1 + n2−2 (n1−1) × var12 + (n2−1) × var22 × n11 + n21 middel1 − middel2 der: gjennomsnitt1 og gjennomsnitt2 = Gjennomsnittsverdier for hver prøve og var2 = Variasjon av hvert prøvesett n1 og n2 = Antall poster i hvert prøvesett
og, Degrees of Freedom = n1 + n2−2where: n1 og n2 = Antall poster i hvert prøvesett
Ujevn variasjon T-test
Den ulik varians t-testen brukes når antall prøver i hver gruppe er forskjellig, og variansen til de to datasettene også er forskjellig. Denne testen kalles også Welchs t-test. Følgende formel brukes for å beregne t-verdi og frihetsgrader for en ulik varians t-test:
T-verdi = n1var12 + n2var22 gjennomsnitt1 − middel2 der: middel1 og middel2 = Gjennomsnittsverdier for hver prøvesettvar1 og var2 = Variasjon av hvert prøvesett n1 og n2 = Antall poster i hvert prøvesett
og, Degrees of Freedom = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 hvor: var1 og var2 = Variasjon av hvert av prøvesettene1 og n2 = Antall av poster i hvert prøvesett
Bestemme riktig T-test som skal brukes
Følgende flytdiagram kan brukes til å bestemme hvilken t-test som skal brukes basert på egenskapene til prøvesettene. De viktigste elementene som skal vurderes inkluderer om eksempelpostene er like, antall dataposter i hvert prøvesett og variansen til hvert prøvesett.
Bilde av Julie Bang © Investopedia 2019
Uvanlig variant T-testeksempel
Anta at vi tar en diagonal måling av malerier mottatt i et kunstgalleri. En gruppe prøver inkluderer 10 malerier, mens den andre inkluderer 20 malerier. Datasettene, med tilsvarende gjennomsnitt og variansverdier, er som følger:
Sett 1 | Sett 2 | |
19, 7 | 28.3 | |
20.4 | 26.7 | |
19.6 | 20.1 | |
17.8 | 23, 3 | |
18.5 | 25.2 | |
18.9 | 22.1 | |
18.3 | 17.7 | |
18.9 | 27.6 | |
19.5 | 20, 6 | |
21.95 | 13.7 | |
23, 2 | ||
17, 5 | ||
20, 6 | ||
18 | ||
23.9 | ||
21.6 | ||
24, 3 | ||
20.4 | ||
23.9 | ||
13.3 | ||
Mener | 19, 4 | 21.6 |
Forskjell | 1.4 | 17.1 |
Selv om gjennomsnittet av sett 2 er høyere enn det for sett 1, kan vi ikke konkludere med at alle malerier har en gjennomsnittlig lengde på rundt 21, 6 enheter siden variasjonen av sett 2 er betydelig høyere enn sett 1. Er dette tilfeldig, eller eksisterer forskjeller virkelig? i den totale befolkningen av alle maleriene som ble mottatt i kunstgalleriet? Vi etablerer problemet ved å anta nullhypotesen om at middelverdien er det samme mellom de to prøvesettene og utfører en t-test for å bekrefte om hypotesen stemmer.
Siden antallet dataregistreringer er forskjellig (n1 = 10 og n2 = 20) og variansen også er forskjellig, beregnes t-verdien og frihetsgrader for det ovennevnte datasettet ved å bruke formelen som er nevnt i T-testen Uqual Variance seksjon.
T-verdien er -2.24787. Siden minustegnet kan ignoreres når du sammenligner de to t-verdiene, er den beregnede verdien 2.24787.
Gradene av frihetsverdien er 24, 38 og reduseres til 24, på grunn av formeldefinisjonen som krever avrunding av verdien til minst mulig heltallverdi.
Når en normal fordeling antas, kan man spesifisere et sannsynlighetsnivå (alfa-nivå, nivå av betydning, p ) som kriterium for aksept. I de fleste tilfeller kan en verdi på 5% antas.
Ved å bruke graden av frihetsverdi som 24 og et 5% nivå av betydning, gir en titt på t-verdifordelingstabellen en verdi på 2.064. Sammenligning av denne verdien mot den beregnede verdien på 2.247 indikerer at den beregnede t-verdien er større enn tabellverdien på et signifikansnivå på 5%. Derfor er det trygt å avvise nullhypotesen om at det ikke er noen forskjell mellom virkemidler. Befolkningssettet har iboende forskjeller, og de er ikke tilfeldig.
Sammenlign investeringskontoer × Tilbudene som vises i denne tabellen er fra partnerskap som Investopedia mottar kompensasjon fra. Leverandørens beskrivelseRelaterte vilkår
Hvordan Analyse av variasjon (ANOVA) fungerer Analyse av varians (ANOVA) er et statistisk analyseverktøy som skiller den totale variabiliteten som finnes i et datasett i to komponenter: tilfeldige og systematiske faktorer. mer Z-Test Definisjon En z-test er en statistisk test som brukes til å bestemme om to populasjonsmidler er forskjellige når variansene er kjent og utvalgets størrelse er stor. mer Degrees of Freedom Definition Degrees of Freedom refererer til det maksimale antallet logisk uavhengige verdier, som er verdier som har frihet til å variere, i datautvalget. mer Forståelse av T-distribusjon AT-distribusjon er en type sannsynlighetsfunksjon som er passende for å estimere populasjonsparametere for små prøvestørrelser eller ukjente avvik. mer Hva Semi-Avvik måler Semi-avvik er en metode for å evaluere svingninger under gjennomsnittet i avkastningen på investeringen. Det brukes som et alternativ til standardavvik. mer Bonferroni-test En Bonferroni-test er en type test for flere sammenligninger som brukes i statistisk analyse. mer Partnerkoblingerrelaterte artikler
Økonomi
Hvilke forutsetninger gjøres når du gjennomfører en t-test?
Risikostyring
Bruke historisk volatilitet for å måle fremtidig risiko
Aksjehandelstrategi og utdanning
Slik bruker du Excel for å simulere aksjekurser
Finansielle forhold
Hvordan beregner du IRR i Excel?
Matematikk og statistikk
Hva er en relativ standardfeil
Finansielle forhold
Hva er formelen for beregning av netto nåverdi (NPV) i Excel?
