Et av målene med statistikken er å ordne data på en meningsfull måte. Toveis tabeller er en viktig måte å organisere en bestemt type sammenkoblede data. Som med konstruksjonen av grafikker eller tabeller i statistikk, er det veldig viktig å vite hvilke typer variabler vi jobber med. Hvis vi har kvantitative data, så er en graf som f.eks histogram eller stilk og bladplott burde bli brukt. Hvis vi har kategoriske data, så er et søylediagram eller Kake diagram er passende.
Når vi jobber med sammenkoblede data, må vi være forsiktige. Det finnes en spredningsdiagram for sammenkoblede kvantitative data, men hva slags graf er det for sammenkoblede kategorisk data? Når vi har to kategoriske variabler, bør vi bruke en toveis tabell.
Beskrivelse av en toveis tabell
Først husker vi at kategoriske data forholder seg til egenskaper eller kategorier. Den er ikke kvantitativ og har ikke tallverdier.
En toveis tabell innebærer en liste over alle verdiene eller nivåene for to kategoriske variabler. Alle verdiene for en av variablene er listet i en vertikal kolonne. Verdiene for den andre variabelen er listet langs en horisontal rad. Hvis den første variabelen har
m verdier og den andre variabelen har n verdier, da blir det totalt mn oppføringer i tabellen. Hver av disse oppføringene tilsvarer en bestemt verdi for hver av de to variablene.Langs hver rad og langs hver kolonne blir oppføringene totalt. Disse totalene er viktige når du bestemmer marginale og betingede fordelinger. Disse totalen er også viktige når vi gjennomfører en chi-square test for uavhengighet.
Eksempel på en toveis tabell
For eksempel vil vi vurdere en situasjon der vi ser på flere deler av et statistikkurs ved et universitet. Vi ønsker å konstruere en toveis tabell for å bestemme hvilke forskjeller, om noen, mellom menn og kvinner i løpet. For å oppnå dette, teller vi antall hver bokstavkarakter som ble tjent av medlemmer av hvert kjønn.
Vi gjør oppmerksom på at den første kategoriske variabelen er kjønn, og det er to mulige verdier i studien av mannlige og kvinnelige. Den andre kategoriske variabelen er bokstavkarakteren, og det er fem verdier som er gitt av A, B, C, D og F. Dette betyr at vi vil ha en toveis tabell med 2 x 5 = 10 oppføringer, pluss en ekstra rad og en ekstra kolonne som vil være nødvendig for å tabulere rad- og kolonnetotalene.
Vår undersøkelse viser at:
- 50 hanner fikk A, mens 60 kvinner fikk A.
- 60 hanner tjente en B, og 80 kvinner fikk en B.
- 100 menn tjente en C, og 50 kvinner tjente C.
- 40 hanner tjente D, og 50 kvinner tjente D.
- 30 hanner tjente en F, og 20 kvinner tjente en F.
Denne informasjonen legges inn i toveis tabellen nedenfor. Summen av hver rad forteller oss hvor mange av hver type karakter som ble tjent. Kolonnetotalene forteller oss antall menn og antall kvinner.
Betydningen av toveis tabeller
Toveis tabeller er med på å organisere dataene våre når vi har to kategoriske variabler. Denne tabellen kan brukes til å hjelpe oss med å sammenligne mellom to forskjellige grupper i våre data. Vi kan for eksempel vurdere den relative ytelsen til menn i statistikkurset mot resultatene til kvinner i løpet.
Neste skritt
Etter å ha dannet en toveis tabell, kan det neste trinnet være å analysere dataene statistisk. Vi kan spørre om variablene som er i studien er uavhengige av hverandre eller ikke. For å svare på dette spørsmålet kan vi bruke en chi-kvadrat-test på toveisbordet.
To-veis tabell for karakterer og kjønn
mann | Hunn | Total | |
EN | 50 | 60 | 110 |
B | 60 | 80 | 140 |
C | 100 | 50 | 150 |
D | 40 | 50 | 90 |
F | 30 | 20 | 50 |
Total | 280 | 260 | 540 |