Innholdsfortegnelse
- T-testen
- T-test antagelser
T-tester brukes ofte i statistikk og økonometrikk for å fastslå at verdiene til to utfall eller variabler er forskjellige fra hverandre. For eksempel hvis du vil vite om mengden kake som spises av personer over 400 kilo, er statistisk signifikant forskjellig fra dem under 400 pund.
De vanlige forutsetningene som gjøres når du utfører en t-test inkluderer de som angår målestokk, tilfeldig prøvetaking, normalitet av datadistribusjon, tilstrekkeligheten av utvalgsstørrelse og likhet av varians i standardavvik.
Viktige takeaways
- En t-test en statistikkmetode som brukes for å bestemme om det er en signifikant forskjell mellom midlene til to grupper basert på et utvalg av data. Testen er avhengig av et sett av forutsetninger for at den skal tolkes ordentlig og med gyldighet. Bland disse forutsetningene, dataene må samples tilfeldig fra populasjonen av interesse, og at datavariablene følger en normal fordeling.
T-testen
T-testen ble utviklet av en kjemiker som jobber for Guinness bryggeriselskap som en enkel måte å måle den jevn kvaliteten på stout. Den ble videreutviklet og tilpasset, og viser nå til enhver test av en statistisk hypotese der statistikken som testes for forventes å tilsvare en t-distribusjon hvis nullhypotesen støttes.
En t-test er en analyse av to populasjonsmidler gjennom bruk av statistisk undersøkelse; en t-test med to prøver blir ofte brukt med små prøvestørrelser, og tester forskjellen mellom prøvene når variansene til to normale fordelinger ikke er kjent.
T-distribusjon er i utgangspunktet enhver kontinuerlig sannsynlighetsfordeling som oppstår fra en estimering av gjennomsnittet av en normalt fordelt populasjon ved bruk av en liten prøvestørrelse og et ukjent standardavvik for befolkningen. Nullhypotesen er standard antagelsen om at det ikke eksisterer noen sammenheng mellom to forskjellige målte fenomener. (For relatert lesing, se: Hva betyr en sterk nullhypotese? )
T-test antagelser
- Den første antagelsen om t-tester gjelder målestokk. Forutsetningen for en t-test er at måleskalaen som brukes på dataene som samles, følger en kontinuerlig eller ordinær skala, for eksempel poengsummen for en IQ-test. Den andre antagelsen er at en enkel tilfeldig prøve, at dataene er samlet fra en representativ, tilfeldig valgt del av den totale befolkningen. Den tredje antakelsen er at dataene, når de er plottet, resulterer i en normal fordeling, bjelleformet distribusjonskurve. Når en normal fordeling antas, kan man spesifisere et sannsynlighetsnivå (alfa-nivå, nivå av betydning, p ) som kriterium for aksept. I de fleste tilfeller kan en 5% -verdi antas. Den fjerde antakelsen er en rimelig stor prøvestørrelse brukes. En større prøvestørrelse betyr at fordelingen av resultatene bør nærme seg en normal bjelleformet kurve. Den endelige forutsetningen er homogenitet av varians. Homogen eller lik varians eksisterer når standardavvikene for prøver er tilnærmet like.
