Hypotetestest for sammenligning av to proporsjoner

I denne artikkelen vil vi gå gjennom trinnene som er nødvendige for å utføre en hypotese test, eller test av betydning, for forskjellen mellom to populasjonsforhold. Dette gjør det mulig for oss å sammenligne to ukjente proporsjoner og utlede om de ikke er lik hverandre eller om en er større enn en annen.

Oversikt over hypotesetester og bakgrunn

Før vi går inn på detaljene i hypotestesten vår, vil vi se på rammene for hypotetester. I en test av betydning prøver vi å vise at en uttalelse angående verdien av en befolkning parameter (eller noen ganger arten av befolkningen selv) vil sannsynligvis være sant.

Vi samler bevis for denne uttalelsen ved å utføre en statistisk utvalg. Vi beregner en statistikk fra dette utvalget. Verdien av denne statistikken er hva vi bruker for å bestemme sannheten i den opprinnelige uttalelsen. Denne prosessen inneholder usikkerhet, men vi er i stand til å tallfeste denne usikkerheten

Den totale prosessen for en hypotesetest er gitt av listen nedenfor:

  1. Forsikre deg om at betingelsene som er nødvendige for vår test er oppfylt.
  2. instagram viewer
  3. Oppgi tydelig null og alternative hypoteser. Den alternative hypotesen kan innebære en ensidig eller en tosidig test. Vi bør også bestemme betydningsnivået, som vil bli betegnet med den greske bokstaven alfa.
  4. Beregn teststatistikken. Hvilken statistikk vi bruker, avhenger av den testen vi gjennomfører. Beregningen er avhengig av vårt statistiske utvalg.
  5. Beregn p-verdien. Teststatistikken kan oversettes til en p-verdi. En p-verdi er sannsynligheten for at sjansen alene produserer verdien av vår teststatistikk under forutsetning av at nullhypotesen er sann. Den overordnede regelen er at jo mindre p-verdien er, jo større er bevisene mot nullhypotesen.
  6. Trekke en konklusjon. Til slutt bruker vi verdien av alfa som allerede var valgt som terskelverdi. Avgjørelsesregelen er at Hvis p-verdien er mindre enn eller lik alfa, så avviser vi nullhypotesen. Ellers vi unnlater å avvise nullhypotesen.

Nå som vi har sett rammen for en hypotetest, vil vi se detaljene for en hypotetest for forskjellen mellom to populasjonsforhold.

Forholdene

En hypotesetest for forskjellen mellom to populasjonsforhold krever at følgende betingelser er oppfylt:

  • Vi har to enkle tilfeldige prøver fra store bestander. Her betyr "stor" at bestanden er minst 20 ganger større enn størrelsen på utvalget. Eksempelstørrelsene vil bli betegnet med n1 og n2.
  • Individene i prøvene våre er valgt uavhengig av hverandre. Befolkningen selv må også være uavhengige.
  • Det er minst 10 suksesser og 10 feil i begge prøvene våre.

Så lenge disse forholdene er oppfylt, kan vi fortsette med hypotestesten vår.

Null og alternative hypoteser

Nå må vi vurdere hypotesene for vår test av betydning. Nullhypotesen er vår uttalelse om ingen effekt. I denne spesielle typen hypotetestester er vår nullhypotese at det ikke er noen forskjell mellom de to populasjonsforholdene. Vi kan skrive dette som H0: p1 = p2.

Den alternative hypotesen er en av tre muligheter, avhengig av detaljene i det vi tester for:

  • Hen: p1 er større enn p2. Dette er en ensidig eller ensidig test.
  • Hen: p1 er mindre enn p2. Dette er også ensidig test.
  • Hen: p1 er ikke lik p2. Dette er en to-tailed eller tosidig test.

For å være forsiktige, bør vi som alltid bruke den tosidige alternative hypotesen hvis vi ikke har en retning i tankene før vi får prøve. Årsaken til å gjøre dette er at det er vanskeligere å avvise nullhypotesen med en tosidig test.

De tre hypotesene kan skrives om ved å angi hvordan p1 - p2 er relatert til verdien null. For å være mer spesifikk, vil nullhypotesen bli H0:p1 - p2 = 0. De potensielle alternative hypotesene vil bli skrevet som:

  • Hen: p1 - p2 > 0 tilsvarer utsagnet "p1 er større enn p2."
  • Hen: p1 - p2 <0 tilsvarer utsagnet "p1 er mindre enn p2."
  • Hen: p1 - p2 ≠ 0 tilsvarer utsagnet "p1 er ikke lik p2."

Denne ekvivalente formuleringen viser oss faktisk litt mer av hva som skjer bak kulissene. Det vi gjør i denne hypotesetesten, er å snu de to parameterne p1 og p2 inn i den ene parameteren p1 - p2. Vi tester deretter denne nye parameteren mot verdien null.

Teststatistikken

Formelen for teststatistikken er gitt på bildet over. En forklaring på hvert av begrepene følger:

  • Utvalget fra den første populasjonen har størrelse n1. Antall suksesser fra denne prøven (som ikke direkte sees i formelen ovenfor) er k1.
  • Utvalget fra den andre populasjonen har størrelse n2. Antall suksesser fra denne prøven er k2.
  • Prøveforholdene er p1-hatt = k1 / n1 og s2-hat = k2 / n2 .
  • Vi kombinerer eller samler deretter suksessene fra begge disse prøvene og oppnår: p-hatt = (k1 + k2) / (n1 + n2).

Vær alltid forsiktig med rekkefølgen på operasjoner når du beregner. Alt under radikalet må beregnes før du tar firkantroten.

P-verdien

Neste trinn er å beregne p-verdien som tilsvarer vår teststatistikk. Vi bruker en standard normalfordeling for statistikken og konsulterer en verdistabell eller bruker statistisk programvare.

Detaljene i vår p-verdi beregning avhenger av den alternative hypotesen vi bruker:

  • For Hen: p1 - p2 > 0, beregner vi andelen av normalfordelingen som er større enn Z.
  • For Hen: p1 - p2 <0, beregner vi andelen av normalfordelingen som er mindre enn Z.
  • For Hen: p1 - p2 ≠ 0, beregner vi andelen av normalfordelingen som er større enn |Z|, den absolutte verdien av Z. For å gjøre rede for det faktum at vi har en to-tailed test, dobler vi andelen.

Avgjørelsesregel

Nå tar vi en beslutning om å avvise nullhypotesen (og derved akseptere alternativet), eller å unnlate å avvise nullhypotesen. Vi tar denne avgjørelsen ved å sammenligne vår p-verdi med nivået av betydning alfa.

  • Hvis p-verdien er mindre enn eller lik alfa, avviser vi nullhypotesen. Dette betyr at vi har et statistisk signifikant resultat og at vi kommer til å godta den alternative hypotesen.
  • Hvis p-verdien er større enn alfa, unnlater vi å avvise nullhypotesen. Dette viser ikke at nullhypotesen er sann. I stedet betyr det at vi ikke fikk overbevisende nok bevis til å avvise nullhypotesen.

Spesiell merknad

De tillitsintervall for forskjellen mellom to befolkningsforhold kombinerer ikke suksessene, mens hypotestesten gjør det. Årsaken til dette er at nullhypotesen vår antar det p1 - p2 = 0. Tillitsintervallet antar ikke dette. Noen statistikere samler ikke suksessene for denne hypotetesten, og bruker i stedet en litt modifisert versjon av ovennevnte teststatistikk.