En viktig del av inferensiell statistikk er hypotetesting. Som med å lære noe relatert til matematikk, er det nyttig å arbeide gjennom flere eksempler. Følgende undersøker et eksempel på en hypotestest, og beregner sannsynligheten for type I og type II feil.
Vi vil anta at de enkle forholdene holder. Mer spesifikt vil vi anta at vi har en enkel tilfeldig prøve fra en befolkning som heller normalt distribuert eller har en stor nok prøvestørrelse til at vi kan bruke sentral grense teorem. Vi vil også anta at vi kjenner populasjonsstandardavviket.
Uttalelse av problemet
En pose potetgull pakkes etter vekt. Totalt ni poser er kjøpt, veid, og middelvekten av disse ni posene er 10,5 gram. Anta at standardavviket for befolkningen for alle slike poser med flis er 0,6 gram. Den oppgitte vekten på alle pakker er 11 gram. Sett et nivå på betydning til 0,01.
Spørsmål 1
Støtter prøven hypotesen om at ekte populasjonsverdi er mindre enn 11 gram?
Vi har en nedre haletest. Dette sees av uttalelsen fra vår null og alternative hypoteser:
- H0: μ=11.
- Hen: μ < 11.
Teststatistikken beregnes med formelen
z = (x-bar - μ0)/(σ/√n) = (10.5 - 11)/(0.6/√ 9) = -0.5/0.2 = -2.5.
Vi må nå bestemme hvor sannsynlig denne verdien av z skyldes tilfeldighetene alene. Ved å bruke en tabell med z-poeng vi ser at sannsynligheten for at z er mindre enn eller lik -2,5 er 0,0062. Siden denne p-verdien er mindre enn Signifikansnivå, avviser vi nullhypotesen og godtar den alternative hypotesen. Gjennomsnittsvekten for alle poser med chips er mindre enn 11 gram.
Spørsmål 2
Hva er sannsynligheten for en type I-feil?
En type I-feil oppstår når vi avviser en nullhypotese som er sann. Sannsynligheten for en slik feil er lik signifikansnivået. I dette tilfellet har vi et signifikansnivå som tilsvarer 0,01, og dette er sannsynligheten for en type I-feil.
Spørsmål 3
Hvis befolkningsgjennomsnittet faktisk er 10,75 gram, hva er sannsynligheten for en type II-feil?
Vi begynner med å omformulere beslutningsregelen vår i forhold til utvalgsverdien. For et signifikansnivå på 0,01 avviser vi nullhypotesen når z < -2.33. Ved å koble denne verdien til formelen for teststatistikken, avviser vi nullhypotesen når
(x-bar - 11) / (0,6 / √ 9)
På samme måte avviser vi nullhypotesen når 11 - 2.33 (0.2)> x-bar, eller når x-linjen er mindre enn 10.534. Vi unnlater å avvise nullhypotesen for x-felt større enn eller lik 10.534. Hvis den sanne befolkningsgjennomsnittet er 10,75, er sannsynligheten for det x-baren er større enn eller lik 10.534 tilsvarer sannsynligheten for at z er større enn eller lik -0,22. Denne sannsynligheten, som er sannsynligheten for en type II-feil, er lik 0,587.