Hva er prøvetaking distribusjon?
En prøvetakingsfordeling er en sannsynlighetsfordeling av en statistikk oppnådd gjennom et stort antall prøver hentet fra en spesifikk populasjon. Samplingsfordelingen for en gitt populasjon er fordelingen av frekvenser for en rekke forskjellige utfall som muligens kan forekomme for en statistikk over en populasjon.
Forstå prøvedistribusjon
Mye data som er tegnet og brukt av akademikere, statistikere, forskere, markedsførere, analytikere osv. Er faktisk prøver, ikke populasjoner. En prøve er en delmengde av en befolkning. For eksempel kan en medisinsk forsker som ønsket å sammenligne gjennomsnittsvekten til alle babyer født i Nord-Amerika fra 1995 til 2005 med de som er født i Sør-Amerika innen samme tidsperiode ikke innen rimelig tid trekke dataene for hele befolkningen i over en million fødselsdager som skjedde i løpet av ti år. Han vil i stedet bare bruke vekten til 100 babyer på hvert kontinent for å komme til en konklusjon. Vekten til 200 babyer som er brukt er prøven og gjennomsnittsvekten beregnet er prøvenes gjennomsnitt.
Anta at i stedet for å ta bare en prøve på 100 nyfødte vekter fra hvert kontinent, tar den medisinske forskeren gjentatte tilfeldige prøver fra den generelle populasjonen, og beregner utvalgets gjennomsnitt for hver prøvegruppe. Så for Nord-Amerika henter han data for 100 nyfødte vekter registrert i USA, Canada og Mexico på følgende måte: fire 100 prøver fra utvalgte sykehus i USA, fem 70 prøver fra Canada og tre 150 poster fra Mexico, for totalt av 1200 vekter av nyfødte babyer gruppert i 12 sett. Han samler også en eksempeldata på 100 fødselsvekter fra hvert av de 12 landene i Sør-Amerika.
Hver prøve har sitt eget utvalgsmiddel, og fordelingen av prøveorganet er kjent som prøvefordelingen.
Gjennomsnittsvekten beregnet for hvert prøvesett er samplingsfordelingen for gjennomsnittet. Ikke bare middelverdien kan beregnes ut fra et utvalg. Andre statistikker, som standardavvik, varians, proporsjon og rekkevidde, kan beregnes ut fra eksempeldata. Standardavviket og variansen måler variasjonen i prøvetakingsfordelingen.
Antall observasjoner i en populasjon, antall observasjoner i en prøve og prosedyren som brukes for å trekke prøvesettene bestemmer variabiliteten til en prøvetakingsfordeling. Standardavviket for en samplingfordeling kalles standardfeilen. Mens gjennomsnittet av en prøvetakingsfordeling er lik gjennomsnittet av populasjonen, avhenger standardfeilen av standardavviket til populasjonen, størrelsen på populasjonen og størrelsen på utvalget.
Å vite hvor spredt gjennomsnittet av hvert prøvesett er fra hverandre og fra populasjonsgjennomsnittet vil gi en indikasjon på hvor nær utvalgsmengden er til populasjonsgjennomsnittet. Standardfeilen i prøvetakingsdistribusjonen avtar når prøvestørrelsen øker.
Spesielle hensyn
En populasjon eller ett utvalg sett med tall vil ha en normal fordeling. Fordi en prøvetakingsfordeling inkluderer flere sett med observasjoner, vil den ikke nødvendigvis ha en bjelleformet form.
Etter vårt eksempel har befolkningens gjennomsnittsvekt for babyer i Nord-Amerika og i Sør-Amerika en normal fordeling fordi noen babyer vil være undervektige (under gjennomsnittet) eller overvektige (over gjennomsnittet), med de fleste babyer som faller i mellom (rundt gjennomsnittet)). Hvis gjennomsnittsvekten av nyfødte i Nord-Amerika er sju kilo, vil gjennomsnittsvekten til prøven i hvert av de 12 settene med observasjonsobservasjoner registrert for Nord-Amerika også være nær sju kilo.
Hvis du imidlertid tegner hvert av gjennomsnittene beregnet i hver av de 1200 prøvegruppene, kan den resulterende formen føre til en jevn fordeling, men det er vanskelig å forutsi med sikkerhet hva den faktiske formen vil vise seg å være. Jo flere prøver forskeren bruker fra en populasjon på over en million vekttall, jo mer vil grafen begynne å danne en normal fordeling.
- En prøvetakingsfordeling er en sannsynlighetsfordeling av en statistikk oppnådd gjennom et stort antall prøver trukket fra en spesifikk populasjon. Samplingsfordelingen for en gitt populasjon er fordelingen av frekvenser for en rekke forskjellige utfall som muligens kan oppstå for en statistikk av en populasjon. Mange data som er tegnet og brukt av akademikere, statistikere, forskere, markedsførere og analytikere er faktisk prøver, ikke populasjoner.
