Bruk av statistiske tabeller er et vanlig tema i mange statistikkurs. Selv om programvare gjør beregninger, er det likevel viktig å lese tabeller. Vi vil se hvordan du bruker en tabell med verdier for en chi-square distribusjon for å bestemme en kritisk verdi. Tabellen som vi vil bruke er ligger hermen andre chi-kvadratiske bord er imidlertid lagt ut på måter som er veldig lik den.
Kritisk verdi
Bruken av et chi-kvadrat bord som vi vil undersøke er for å bestemme en kritisk verdi. Kritiske verdier er viktige i begge deler hypotetester og tillitsintervaller. For hypotesetester forteller en kritisk verdi grensen for hvor ekstrem en teststatistikk vi trenger for å avvise nullhypotesen. For konfidensintervaller er en kritisk verdi et av ingrediensene som går inn i beregningen av en feilmargin.
For å bestemme en kritisk verdi, må vi vite tre ting:
- Antall frihetsgrader
- Antall og type haler
- Betydningsnivået.
Grader av frihet
Det første elementet av betydning er antall grader av frihet. Dette tallet forteller oss hvilken av
utrulig uendelig mange chi-square distribusjoner vi skal bruke i vårt problem. Måten vi bestemmer dette tallet på, avhenger av det nøyaktige problemet vi bruker vårt chi-square distribusjon med. Tre vanlige eksempler følger.- Hvis vi gjør en godhet med fit test, er antallet frihetsgrader ett mindre enn antallet utfall for modellen vår.
- Hvis vi konstruerer en tillitsintervall for en populasjonsvarians, er antallet frihetsgrader en mindre enn antall verdier i vårt utvalg.
- For en chi-square test av uavhengighet av to kategoriske variabler, har vi en toveis beredskapstabell med r rader og c kolonner. Antallet frihetsgrader er (r - 1)(c - 1).
I denne tabellen tilsvarer antall frihetsgrader raden vi vil bruke.
Hvis tabellen vi jobber med ikke viser det nøyaktige antallet frihetsgrader vårt problem krever, er det en tommelfingerregel som vi bruker. Vi runder antall frihetsgrader ned til den høyeste tabellverdien. Anta for eksempel at vi har 59 frihetsgrader. Hvis vårt bord bare har linjer for 50 og 60 frihetsgrader, bruker vi linjen med 50 frihetsgrader.
Tails
Det neste vi må vurdere er antall og type haler som brukes. En chi-kvadrat distribusjon er skjev til høyre, og derfor brukes ofte ensidige tester som involverer høyre hale. Imidlertid, hvis vi beregner et tosidig konfidensintervall, må vi vurdere a to-tailed test med både høyre og venstre hale i vår chi-square distribusjon.
Nivå av tillit
Den siste informasjonen vi trenger å vite er nivået av selvtillit eller betydning. Dette er en sannsynlighet som vanligvis betegnes av alfa. Vi må da oversette denne sannsynligheten (sammen med informasjonen om halene våre) til riktig kolonne som skal brukes i tabellen vår. Mange ganger avhenger dette trinnet av hvordan bordet vårt er konstruert.
Eksempel
For eksempel vil vi vurdere en godkjent passform for en tolv-sidig die. Vår nullhypotese er at alle sider er like sannsynlige å bli rullet, og derfor har hver side sannsynligheten for at 1/12 blir rullet. Siden det er 12 utfall, er det 12 -1 = 11 frihetsgrader. Dette betyr at vi vil bruke raden merket 11 for våre beregninger.
En god passformtest er en en-tailed test. Halen som vi bruker til dette er den rette halen. Anta at signifikansnivået er 0,05 = 5%. Dette er sannsynligheten i høyre hale for distribusjonen. Bordet vårt er satt opp for sannsynlighet i venstre hale. Så den venstre delen av vår kritiske verdi skal være 1 - 0,05 = 0,95. Dette betyr at vi bruker kolonnen som tilsvarer 0,95 og rad 11 for å gi en kritisk verdi på 19,675.
Hvis chi-square-statistikken som vi beregner fra våre data er større enn eller lik19.675, avviser vi nullhypotesen med 5% betydning. Hvis vår chi-square statistikk er mindre enn 19.675, er vi det unnlater å avvise nullhypotesen.