Klokkekurver dukke opp i hele statistikken. Ulike målinger som frødiametere, lengder med fisker, score på SAT og vekter av individuelle ark med papirrammer, danner alle klokkekurver når de er graferte. Den generelle formen på alle disse kurvene er den samme. Men alle disse kurvene er forskjellige fordi det er svært usannsynlig at noen av dem har samme gjennomsnitt eller standardavvik. Klokkekurver med store standardavvik er brede, og klokkekurver med små standardavvik er tynne. Klokkekurver med større midler forskyves mer mot høyre enn de med mindre midler.
Et eksempel
For å gjøre dette litt mer konkret, la oss late som om vi måler diametrene til 500 kornkorn. Deretter registrerer vi, analyserer og grafer vi disse dataene. Det er funnet at datasettet er formet som en bjellekurve og har et gjennomsnitt på 1,2 cm med et standardavvik på .4 cm. Anta nå at vi gjør det samme med 500 bønner, og vi finner ut at de har en gjennomsnittlig diameter på 0,8 cm med et standardavvik på 0,04 cm.
Klokkekurvene fra begge disse datasettene er plottet ovenfor. Den røde kurven tilsvarer korndataene og den grønne kurven tilsvarer bønnedataene. Som vi kan se, er sentrene og oppslagene for disse to kurvene forskjellige.
Dette er helt klart to forskjellige klokkekurver. De er forskjellige fordi deres midler og standardavvik stemmer ikke. Siden alle interessante datasett vi kommer over kan ha et hvilket som helst positivt tall som et standardavvik, og hvilket som helst tall for en middelvei, skraper vi egentlig bare overflaten til en uendelig antall klokkekurver. Det er mange kurver og altfor mange å takle. Hva er løsningen?
En veldig spesiell klokkekurve
Et mål med matematikk er å generalisere ting når det er mulig. Noen ganger er flere individuelle problemer spesielle tilfeller av et enkelt problem. Denne situasjonen med klokkekurver er en flott illustrasjon av det. I stedet for å håndtere et uendelig antall klokkekurver, kan vi relatere dem alle til en enkelt kurve. Denne spesielle klokkekurven kalles standard klokkekurve eller standard normalfordeling.
Standard klokkekurve har et gjennomsnitt på null og et standardavvik på en. Enhver annen klokkekurve kan sammenlignes med denne standarden ved hjelp av en grei beregning.
Funksjoner ved standard normal distribusjon
Alle egenskapene til en hvilken som helst klokkekurve holder for normal normalfordeling.
- Standard normalfordeling har ikke bare et gjennomsnitt på null, men også en median og modus på null. Dette er midten av kurven.
- Standard normalfordeling viser speilsymmetri på null. Halvparten av kurven er til venstre for null, og halvparten av kurven er til høyre. Hvis kurven ble brettet langs en vertikal linje på null, ville begge halvdeler samsvare perfekt.
- Standard normalfordeling følger 68-95-99.7-regelen, som gir oss en enkel måte å estimere følgende:
- Omtrent 68% av alle dataene er mellom -1 og 1.
- Omtrent 95% av alle dataene er mellom -2 og 2.
- Omtrent 99,7% av alle dataene er mellom -3 og 3.
Hvorfor vi bryr oss
På dette tidspunktet spør vi kanskje: "Hvorfor bry deg med en standard klokkekurve?" Det kan virke som en unødvendig komplikasjon, men standard klokkekurve vil være fordelaktig når vi fortsetter i statistikken.
Vi vil finne at en type problem i statistikk krever at vi finner områder under deler av en hvilken som helst klokkekurve som vi møter. Klokkekurven er ikke en fin form for områder. Det er ikke som et rektangel eller høyre trekant som har lett arealformler. Å finne områder av deler av en bjellekurve kan være vanskelig, så vanskelig, faktisk, at vi trenger å bruke en viss kalkulus. Hvis vi ikke standardiserer klokkekurvene våre, må vi gjøre en kalkulus hver gang vi ønsker å finne et område. Hvis vi standardiserer kurvene våre, har alt arbeidet med å beregne områder blitt gjort for oss.