Viktigheten av den sentrale begrensningsteorem

Den sentrale grense-setningen er et resultat fra sannsynlighetsteori. Dette teoremet vises på en rekke steder innen statistikkfeltet. Selv om den sentrale grense-teoremet kan virke abstrakt og blottet for noen anvendelse, er dette teoremet faktisk ganske viktig for utøvelse av statistikk.

Så hva er viktigheten av den sentrale grense-setningen? Det har alt å gjøre med fordeling av befolkningen vår. Dette teoremet lar deg forenkle problemer i statistikk ved å la deg jobbe med en distribusjon som er omtrent vanlig.

Uttalelse av teorem

Uttalelsen av den sentrale grense-teoremet kan virke ganske teknisk, men kan forstås hvis vi tenker gjennom følgende trinn. Vi begynner med en enkel tilfeldig prøve med n individer fra en populasjon av interesse. Fra dette prøve, kan vi enkelt danne et utvalgsmiddel som tilsvarer middelet av hvilken måling vi er nysgjerrige på i befolkningen vår.

EN prøvetaking distribusjon for eksempelmidlet produseres ved gjentatte ganger å velge enkle tilfeldige prøver fra samme populasjon og av samme størrelse, og deretter beregne eksempelmidlet for hver av disse prøvene. Disse prøvene er å anse som uavhengige av hverandre.

instagram viewer

Den sentrale grense-teoremet angår prøvetakingsfordelingen av prøveutstyret. Vi kan spørre om den generelle formen for prøvetakingsdistribusjonen. Den sentrale grense-teoremet sier at denne prøvetakingsfordelingen er tilnærmet normal — ofte kjent som en klokkekurve. Denne tilnærmingen forbedres når vi øker størrelsen på de enkle tilfeldige prøvene som brukes til å produsere prøvetakingsfordelingen.

Det er et veldig overraskende trekk angående den sentrale grense-setningen. Det forbløffende faktum er at dette teoremet sier at det oppstår en normal fordeling uavhengig av den innledende distribusjonen. Selv om befolkningen vår har en skjev distribusjon, som oppstår når vi undersøker ting som inntekter eller folks vekter, vil en samplingsfordeling for en prøve med en tilstrekkelig stor utvalgstørrelse være normal.

Sentral begrensningsteorem i praksis

Det uventede utseendet til en normalfordeling fra en populasjonsfordeling som er skjev (til og med ganske sterkt skjev) har noen veldig viktige bruksområder i statistisk praksis. Mange praksis i statistikk, for eksempel de som involverer hypotesetesting eller tillitsintervaller, gjør noen antagelser angående befolkningen som dataene ble hentet fra. En antagelse som i utgangspunktet er gjort i a statistikk kurset er at populasjonene som vi jobber med normalt distribueres.

Antagelsen om at data er fra a normal distribusjon forenkler saken, men virker litt urealistisk. Bare litt arbeid med data fra den virkelige verden viser at outliers, skjevhet, flere topper og asymmetri dukker opp ganske rutinemessig. Vi kan omgå problemet med data fra en populasjon som ikke er normal. Bruken av en passende prøvestørrelse og den sentrale begrensningssetningen hjelper oss å omgå problemet med data fra populasjoner som ikke er normale.

Selv om vi kanskje ikke vet formen på distribusjonen der dataene våre kommer fra, sier den sentrale grense-setningen at vi kan behandle samplingsfordelingen som om den var normal. For at konklusjonene fra teoremet skal holde, trenger vi selvfølgelig en prøvestørrelse som er stor nok. Undersøkende dataanalyse kan hjelpe oss med å bestemme hvor stor del av en prøve som er nødvendig for en gitt situasjon.