Hva er en prøveutdeling?

Statistisk prøvetaking brukes ganske ofte i statistikk. I denne prosessen har vi som mål å bestemme noe om en befolkning. Siden populasjoner typisk er store i størrelse, danner vi et statistisk utvalg ved å velge en undergruppe av befolkningen som har en forhåndsbestemt størrelse. Ved å studere utvalget kan vi bruke inferensiell statistikk for å bestemme noe om befolkningen.

Et statistisk utvalg av størrelse n involverer en enkelt gruppe av n individer eller personer som er tilfeldig valgt fra befolkningen. Nært beslektet med begrepet et statistisk utvalg er en samplingsfordeling.

Opprinnelsen til prøvetaking distribusjoner

En samplingsfordeling skjer når vi danner mer enn en enkel tilfeldig prøve av samme størrelse fra en gitt befolkning. Disse prøvene anses å være uavhengige av hverandre. Så hvis et individ er i en prøve, har det samme sannsynlighet for å være i den neste prøven som blir tatt.

Vi beregner en bestemt statistikk for hver prøve. Dette kan være en prøve mener, en prøvevarians eller en prøveandel. Siden en statistikk avhenger av utvalget vi har, vil hver prøve typisk gi en annen verdi for statistikken av interesse. Området for verdiene som er produsert er det som gir oss prøvetakingsdistribusjonen.

instagram viewer

Prøvefordeling for midler

For et eksempel vil vi vurdere samplingsfordelingen for gjennomsnittet. Gjennomsnittet av en populasjon er en parameter som er typisk ukjent. Hvis vi velger en prøve i størrelse 100, beregnes gjennomsnittet av denne prøven enkelt ved å legge til alle verdiene sammen og deretter dele med det totale antall datapunkter, i dette tilfellet 100. Én prøve på størrelse 100 kan gi oss et gjennomsnitt på 50. En annen slik prøve kan ha et gjennomsnitt på 49. Ytterligere 51 og en annen prøve kunne ha gjennomsnittet 50,5.

Distribusjonen av disse utvalgsmidlene gir oss en samplingsfordeling. Vi ønsker å vurdere mer enn bare fire eksempler på midler som vi har gjort ovenfor. Med flere eksempler betyr det at vi ville ha en god ide om formen på prøvetakingsfordelingen.

Hvorfor bryr vi oss?

Sampling Distribusjoner kan virke ganske abstrakte og teoretiske. Imidlertid er det noen veldig viktige konsekvenser av bruk av disse. En av hovedfordelene er at vi eliminerer variabiliteten som er til stede i statistikken.

Anta for eksempel at vi starter med en populasjon med et gjennomsnitt på μ og standardavvik for σ. Standardavviket gir oss en måling av hvor spredt distribusjonen er. Vi vil sammenligne dette med en samplingsfordeling oppnådd ved å danne enkle tilfeldige prøver av størrelse n. Samplingsfordelingen av middelet vil fortsatt ha et gjennomsnitt på μ, men standardavviket er annerledes. Standardavviket for en prøvetakingsfordeling blir σ / √ n.

Dermed har vi følgende

En prøvestørrelse på 4 tillater oss å ha en samplingsfordeling med standardavvik på σ / 2.
En prøvestørrelse på 9 tillater oss å ha en samplingsfordeling med et standardavvik på σ / 3.
En prøvestørrelse på 25 tillater oss å ha en samplingsfordeling med et standardavvik på σ / 5.
En prøvestørrelse på 100 tillater oss å ha en prøvetakingsfordeling med et standardavvik på σ / 10.

I praksis

I utøvelsen av statistikk danner vi sjelden distribusjoner av samplinger. I stedet behandler vi statistikk hentet fra et enkelt tilfeldig utvalg av størrelse n som om de er ett punkt langs en tilsvarende samplingfordeling. Dette understreker igjen hvorfor vi ønsker å ha relativt store prøvestørrelser. Jo større prøvestørrelse, jo mindre variasjon vil vi oppnå i statistikken vår.

Merk at annet enn sentrum og spredning, kan vi ikke si noe om formen på prøvetakingsdistribusjonen. Det viser seg at under noen ganske brede forhold Sentral begrensningsteorem kan brukes for å fortelle oss noe ganske utrolig om formen til en prøvetakingsfordeling.