De chi-square godhet med fit test er en variant av den mer generelle chi-square testen. Innstillingen for denne testen er en enkelt kategorisk variabel som kan ha mange nivåer. Ofte i denne situasjonen vil vi ha en teoretisk modell i tankene for en kategorisk variabel. Gjennom denne modellen forventer vi at en del av befolkningen vil falle inn i hvert av disse nivåene. En god passformtest avgjør hvor godt de forventede proporsjonene i vår teoretiske modell samsvarer med virkeligheten.
Vi starter med en kategorisk variabel med n nivåer og la pJeg være andelen av befolkningen på nivå Jeg. Vår teoretiske modell har verdier av qJeg for hver av proporsjonene. Uttalelsen av null og alternative hypoteser er som følger:
For en god passformtest har vi en teoretisk modell for hvordan dataene våre skal proporsjoneres. Vi multipliserer ganske enkelt disse proporsjonene med prøvestørrelsen n for å oppnå våre forventede tellinger.
Chi-kvadratstatistikken for god passform test bestemmes ved å sammenligne de faktiske og forventede tellingene for hvert nivå i vår kategoriske variabel. Trinnene for å beregne chi-square-statistikken for en god passformtest er som følger:
Hvis vår teoretiske modell samsvarer med de observerte dataene perfekt, vil de forventede tellingene ikke vise noe avvik fra de observerte tellingene til variabelen vår. Dette vil bety at vi vil ha en chi-kvadrat-statistikk på null. I enhver annen situasjon vil chi-square-statistikken være et positivt tall.
Chi-kvadratstatistikken som vi beregnet tilsvarer et bestemt sted på en chi-kvadratfordeling med passende antall frihetsgrader. De p-verdien bestemmer sannsynligheten for å oppnå en teststatistikk dette ekstreme, forutsatt at nullhypotesen er sann. Vi kan bruke en verdistabell for en chi-kvadratfordeling for å bestemme p-verdien for hypotestesten vår. Hvis vi har statistisk programvare tilgjengelig, kan denne brukes til å få et bedre estimat av p-verdien.
Vi tar vår beslutning om å avvise nullhypotesen basert på et forhåndsbestemt nivå av betydning. Hvis p-verdien vår er mindre enn eller lik dette nivået av betydning, avviser vi nullhypotesen. Ellers vi unnlater å avvise nullhypotesen.