Eksempel på tillitsintervall for variasjon

Befolkningsvariansen gir en indikasjon på hvordan man spre et datasett er. Dessverre er det typisk umulig å vite nøyaktig hva denne populasjonsparameteren er. For å kompensere for vår mangel på kunnskap bruker vi et emne fra inferensiell statistikk som heter tillitsintervaller. Vi vil se et eksempel på hvordan du kan beregne et konfidensintervall for en populasjonsvarians.

Tillitsintervallformel

Formelen for (1 - α) tillitsintervall om populasjonsvariansen. Gis av følgende streng med ulikheter:

[ (n - 1)s2] / B < σ2 < [ (n - 1)s2] / EN.

Her n er prøvestørrelsen, s2 er utvalget varians. Antallet EN er poenget med chi-square distribusjonen med n -1 frihetsgrader hvor nøyaktig α / 2 av området under kurven er til venstre for EN. På en lignende måte tallet B er poenget med den samme chi-kvadratfordelingen med nøyaktig α / 2av området under kurven til høyre for B.

forutsetninger

Vi begynner med et datasett med 10 verdier. Dette settet med dataverdier ble oppnådd ved en enkel tilfeldig prøve:

97, 75, 124, 106, 120, 131, 94, 97,96, 102

instagram viewer

Noen undersøkende dataanalyser ville være nødvendig for å vise at det ikke er noen outliers. Ved å konstruere en stilk og bladplott vi ser at disse dataene sannsynligvis kommer fra en distribusjon som er omtrent normalt distribuert. Dette betyr at vi kan fortsette med å finne et 95% konfidensintervall for populasjonsvariansen.

Eksempelvarians

Vi må estimere populasjonsvariansen med utvalgsvariansen, angitt med s2. Så vi begynner med å beregne denne statistikken. I hovedsak beregner vi gjennomsnittet av summen av de kvadratiske avvikene fra gjennomsnittet. I stedet for å dele denne summen med n vi deler det etter n - 1.

Vi finner ut at gjennomsnittet av utvalget er 104,2. Ved å bruke dette har vi summen av kvadratiske avvik fra gjennomsnittet gitt av:

(97 – 104.2)2 + (75 – 104.3)2 +... + (96 – 104.2)2 + (102 – 104.2)2 = 2495.6

Vi deler denne summen med 10 - 1 = 9 for å oppnå en prøvevarians på 277.

Chi-Square Distribusjon

Vi henvender oss nå til vår chi-square distribusjon. Siden vi har 10 dataverdier, har vi 9 grader av frihet. Siden vi vil ha de midterste 95% av distribusjonen vår, trenger vi 2,5% i hvert av de to halene. Vi konsulterer et chi-square bord eller programvare og ser at tabellverdiene på 2.7004 og 19.023 omslutter 95% av distribusjonsområdet. Disse tallene er EN og Bhenholdsvis.

Vi har nå alt vi trenger, og vi er klare til å sette sammen tillitsintervallet. Formelen for venstre sluttpunkt er [(n - 1)s2] / B. Dette betyr at vårt venstre sluttpunkt er:

(9 x 277) /19.023 = 133

Det rette endepunktet blir funnet ved å erstatte B med EN:

(9 x 277) /2.7004 = 923

Og derfor er vi 95% sikre på at befolkningsvariansen ligger mellom 133 og 923.

Befolkningsstandardavvik

Siden standardavviket er kvadratroten til variansen, kan denne metoden selvfølgelig brukes til å konstruere et konfidensintervall for populasjonsstandardavviket. Alt vi trenger å gjøre er å ta firkantede røtter av endepunktene. Resultatet ville være 95% konfidensintervall for standardavvik.