Hva er tillitsintervall?
Et konfidensintervall i statistikk refererer til sannsynligheten for at en populasjonsparameter vil falle mellom to angitte verdier for en viss andel ganger. Tillitsintervaller måler graden av usikkerhet eller sikkerhet i en prøvetakingsmetode. Et konfidensintervall kan ta et hvilket som helst antall sannsynligheter, med det vanligste et 95% eller 99% konfidensnivå.
Tillitsintervall og tillitsnivå henger sammen, men er ikke nøyaktig det samme.
Forstå tillitsintervall
Statistikere bruker tillitsintervaller for å måle usikkerhet. For eksempel velger en forsker forskjellige prøver tilfeldig fra samme populasjon og beregner et konfidensintervall for hver prøve. De resulterende datasettene er alle forskjellige; noen intervaller inkluderer den sanne populasjonsparameteren og andre ikke.
Et tillitsintervall er et område med verdier som sannsynligvis vil inneholde en ukjent populasjonsparameter. Tillitsnivå refererer til prosentandelen av sannsynlighet eller sikkerhet for at konfidensintervallet vil inneholde den sanne populasjonsparameteren når du tegner et tilfeldig utvalg mange ganger. Eller, i det sproglige, "Vi er 99% sikre ( konfidensnivå) at de fleste av disse datasettene (konfidensintervaller) inneholder den sanne populasjonsparameteren."
Viktige takeaways
- Et konfidensintervall beregner sannsynligheten for at en populasjonsparameter vil falle mellom to angitte verdier. Tillitsintervaller måler graden av usikkerhet eller sikkerhet i en prøvetakingsmetode. Ofte reflekterer konfidensintervall konfidensnivåer på 95% eller 99%.
Beregne et tillitsintervall
Anta at en gruppe forskere studerer høydene til basketballspillerne på videregående. Forskerne tar en tilfeldig prøve fra befolkningen og fastslår en gjennomsnittlig høyde på 74 tommer. Gjennomsnittet av 74 tommer er et poengestimat av befolkningsgjennomsnittet. Et poengestimat i seg selv er av begrenset nytteverdi fordi det ikke avslører usikkerheten knyttet til estimatet; du har ikke god sans for hvor langt dette 74-tommers utvalgsmengden kan være fra befolkningsgjennomsnittet. Det som mangler er graden av usikkerhet i denne ene prøven.
Tillitsintervaller gir mer informasjon enn poengestimater. Ved å etablere et 95% konfidensintervall ved å bruke prøvens gjennomsnitt og standardavvik, og anta en normalfordeling som representert av klokkekurven, ankommer forskerne en øvre og nedre grense som inneholder det sanne gjennomsnittet 95% av tiden. Anta at intervallet er mellom 72 tommer og 76 tommer. Hvis forskerne tar 100 tilfeldige prøver fra befolkningen av videregående basketballspillerne som helhet, bør gjennomsnittet falle mellom 72 og 76 tommer i 95 av disse prøvene.
Hvis forskerne ønsker enda større selvtillit, kan de utvide intervallet til 99% tillit. Å gjøre det skaper alltid et bredere spekter, da det gir rom for et større antall utvalgsmidler. Hvis de etablerer 99% konfidensintervall som mellom 70 tommer og 78 tommer, kan de forvente at 99 av 100 prøver evaluert skal inneholde en middelverdi mellom disse tallene. Et konfidensnivå på 90% betyr at vi forventer at 90% av intervallestimatene vil inkludere populasjonsparameteren. På samme måte betyr 99% konfidensnivå at 95% av intervallene vil inkludere parameteren.
Vanlige misoppfatninger om tillitsintervall
Den største misforståelsen angående konfidensintervaller er at de representerer prosentandelen av data fra et gitt utvalg som faller mellom øvre og nedre grense. For eksempel kan man feilaktig tolke de nevnte 99% konfidensintervall på 70 til 78 tommer som indikerer at 99% av dataene i en tilfeldig prøve faller mellom disse tallene. Dette er feil, selv om det eksisterer en egen metode for statistisk analyse for å gjøre en slik bestemmelse. Å gjøre det innebærer å identifisere prøvens middelverdi og standardavvik og plotte disse figurene på en klokkekurve.
