Hypotetesting er et tema i hjertet av statistikk. Denne teknikken tilhører et rike kjent som inferensiell statistikk. Forskere fra alle slags forskjellige områder, som psykologi, markedsføring og medisin, formulerer hypoteser eller påstander om en befolkning som studeres. Det endelige målet med forskningen er å bestemme gyldigheten av disse påstandene. Nøye designet statistiske eksperimenter oppnå prøve data fra befolkningen. Dataene brukes igjen for å teste nøyaktigheten til en hypotese om en populasjon.
The Rare Event Rule
Hypotestester er basert på matematikkfeltet kjent som sannsynlighet. Sannsynlighet gir oss en måte å kvantifisere hvor sannsynlig det er for at en hendelse skal inntreffe. Den underliggende antagelsen for all inferensiell statistikk omhandler sjeldne hendelser, og det er derfor sannsynligheten brukes så mye. Den sjeldne hendelsesregelen sier at hvis en antakelse gjøres og sannsynligheten for en viss observert hendelse er veldig liten, er antagelsen sannsynligvis feil.
Den grunnleggende ideen her er at vi tester et krav ved å skille mellom to forskjellige ting:
- En hendelse som lett oppstår ved en tilfeldighet.
- En hendelse som svært usannsynlig vil skje ved en tilfeldighet.
Hvis det oppstår en høyst usannsynlig hendelse, forklarer vi dette ved å oppgi at en sjelden hendelse virkelig fant sted, eller at antakelsen vi startet med ikke var sann.
Prognostikatorer og sannsynlighet
Som et eksempel for intuitivt å forstå ideene bak hypotesetesting, vurderer vi følgende historie.
Det er en vakker dag utenfor, så du bestemte deg for å dra på tur. Mens du går blir du konfrontert av en mystisk fremmed. "Ikke bli skremt," sier han, "dette er din heldige dag. Jeg er en seer av seere og en prognosticator av prognosticators. Jeg kan forutsi fremtiden, og gjøre det med større nøyaktighet enn noen andre. Faktisk har 95% av tiden rett. For bare $ 1000 vil jeg gi deg de vinnende loddnumrene i de neste ti ukene. Du vil være nesten sikker på å vinne en gang, og sannsynligvis flere ganger. ”
Dette høres for godt ut til å være sant, men du er fascinert. "Bevis det," svarer du. "Vis meg at du virkelig kan forutsi fremtiden, så vil jeg vurdere tilbudet ditt."
"Selvfølgelig. Jeg kan ikke gi deg noe vinnende loddtall gratis skjønt. Men jeg vil vise dere mine krefter som følger. I denne forseglede konvolutten er et ark nummerert 1 til 100, med 'hoder' eller 'haler' skrevet etter hver av dem. Når du går hjem, vipp en mynt 100 ganger og registrer resultatene i den rekkefølgen du får dem. Åpne deretter konvolutten og sammenlign de to listene. Min liste vil samsvare nøyaktig med minst 95 av myntkastene dine. ”
Du tar konvolutten med et skeptisk blikk. "Jeg vil være her i morgen på samme tid hvis du bestemmer deg for å ta meg med på tilbudet mitt."
Når du går hjem igjen, antar du at den fremmede har tenkt på en kreativ måte å lure folk ut av pengene sine på. Likevel, når du kommer hjem, vipper du en mynt og skriver ned hvilke kaster som gir deg hoder, og hvilke som er haler. Så åpner du konvolutten og sammenligner de to listene.
Hvis listene bare samsvarer på 49 steder, vil du konkludere med at den fremmede i beste fall er villet og i verre grad gjennomføre en slags svindel. Når alt kommer til alt, ville sjansen alene resultere i å være riktig omtrent halvparten av tiden. Hvis dette er tilfelle, vil du sannsynligvis endre gangveien i noen uker.
Hva på den annen side, hvis listene stemte 96 ganger? Sannsynligheten for at dette skjer ved en tilfeldighet er ekstremt liten. På grunn av det faktum at å forutsi 96 av 100 myntkast er usedvanlig usannsynlig, konkluderer du med at antakelsen din om den fremmede var feil, og at han faktisk kan forutsi fremtiden.
Den formelle prosedyren
Dette eksemplet illustrerer ideen bak hypotesetesting og er en god introduksjon til videre studier. Den nøyaktige prosedyren krever spesialisert terminologi og en trinnvis prosedyre, men tenkningen er den samme. Den sjeldne hendelsesregelen gir ammunisjon til å avvise en hypotese og godta en alternativ.