Ved gjennomføring av en test av betydning eller hypotese test, det er to tall som er enkle å forveksle. Disse tallene kan lett forveksles fordi de begge er tall mellom null og en, og begge sannsynligheter. Ett tall kalles teststatistikkens p-verdi. Det andre antallet av interesse er nivået på betydning eller alfa. Vi vil undersøke disse to sannsynlighetene og bestemme forskjellen mellom dem.
Alfaverdier
Tallet alfa er terskelverdien som vi måler p-verdiene imot. Den forteller oss hvor ekstreme observerte resultater må være for å avvise nullhypotesen om en signifikansetest.
Verdien av alfa er assosiert med konfidensnivået til testen vår. Følgende viser noen nivåer av tillit med de relaterte verdiene til alfa:
- For resultater med 90 prosent konfidensnivå er verdien av alfa 1 - 0,90 = 0,10.
- For resultater med 95 prosent nivå av selvtillit, verdien av alfa er 1 - 0,95 = 0,05.
- For resultater med 99 prosent konfidensnivå er verdien av alfa 1 - 0,99 = 0,01.
- Og generelt, for resultater med et C-prosentnivå av tillit, er verdien av alfa 1 - C / 100.
Selv om det i teori og praksis kan brukes mange tall for alfa, er det mest brukte 0,05. Årsaken til dette er både fordi konsensus viser at dette nivået er passende i mange tilfeller, og historisk sett har det blitt akseptert som standarden. Imidlertid er det mange situasjoner der en mindre verdi av alfa bør brukes. Det er ikke en eneste verdi av alfa som alltid bestemmer statistisk betydning.
Alfaverdien gir oss sannsynligheten for a type I-feil. Type I-feil oppstår når vi avviser en nullhypotese som faktisk er sann. Dermed på sikt for en test med en nivå av betydning på 0,05 = 1/20, vil en sann nullhypotese bli avvist en av hver 20. gang.
P-verdier
Det andre tallet som er en del av en test av betydning er en p-verdi. En p-verdi er også en sannsynlighet, men den kommer fra en annen kilde enn alfa. Hver teststatistikk har en tilsvarende sannsynlighet eller p-verdi. Denne verdien er sannsynligheten for at den observerte statistikken skjedde ved en tilfeldighet alene, forutsatt at nullhypotesen er sann.
Siden det er en rekke forskjellige teststatistikker, er det en rekke forskjellige måter å finne en p-verdi på. I noen tilfeller må vi kjenne til sannsynlighetsfordeling av befolkningen.
P-verdien til teststatistikken er en måte å si hvor ekstrem denne statistikken er for eksempeldataene våre. Jo mindre p-verdi, desto mer usannsynlig er den observerte prøven.
Forskjellen mellom P-verdi og Alpha
For å bestemme om et observert utfall er statistisk signifikant, sammenligner vi verdiene for alfa og p-verdien. Det er to muligheter som dukker opp:
- P-verdien er mindre enn eller lik alfa. I dette tilfellet avviser vi nullhypotesen. Når dette skjer, sier vi at resultatet er statistisk signifikant. Vi er med andre ord rimelig sikre på at det er noe utenom sjansen alene som ga oss en observert prøve.
- P-verdien er større enn alfa. I dette tilfellet unnlater vi å avvise nullhypotesen. Når dette skjer, sier vi at resultatet ikke er statistisk signifikant. Med andre ord, vi er rimelig sikre på at våre observerte data kan forklares ved en tilfeldighet.
Betydningen av det ovennevnte er at jo mindre verdien av alfa er, desto vanskeligere er det å hevde at et resultat er statistisk signifikant. På den annen side, jo større verdi på alfa er, jo lettere er det å hevde at et resultat er statistisk signifikant. Kombinert med dette er det imidlertid større sannsynlighet for at det vi observerte kan tilskrives tilfeldigheter.