Klokkekurve og definisjon av normal distribusjon

Begrepet klokkekurve brukes til å beskrive det matematiske konseptet kalt normalfordeling, noen ganger referert til som Gaussisk distribusjon. "Klokkekurve" refererer til klokkeformen som opprettes når en linje plottes ved hjelp av datapunktene for et element som oppfyller kriteriene for normalfordeling.

I en klokkekurve inneholder sentrum det største antallet av en verdi, og derfor er det det høyeste punktet på linjen. Dette punktet henvises til mener, men i enkle ord er det det høyeste antallet forekomster av et element (i statistiske termer, modus).

Normal distribusjon

Det viktige å merke seg om a normal distribusjon er at kurven er konsentrert i sentrum og avtar på hver side. Dette er betydelig ved at dataene har mindre en tendens til å produsere uvanlig ekstreme verdier, kalt outliers, sammenlignet med andre distribusjoner. Klokkekurven betyr også at dataene er symmetriske. Dette betyr at du kan skape rimelige forventninger til muligheten for at et utfall vil ligge innenfor et området til venstre eller høyre for midten, når du først har målt mengden avvik som finnes i dataene. Dette måles i form av

instagram viewer
standardavvik.

En ringekurvegraf avhenger av to faktorer: middelverdien og standardavviket. Gjennomsnittet identifiserer senterets plassering og standardavviket bestemmer høyden og bredden på klokken. For eksempel skaper et stort standardavvik en bjelle som er kort og bred, mens et lite standardavvik skaper en høy og smal kurve.

Klokkekurve-sannsynlighet og standardavvik

For å forstå sannsynlighetsfaktorene for en normal fordeling, må du forstå følgende regler:

  1. Det totale arealet under kurven er lik 1 (100%)
  2. Omtrent 68% av arealet under kurven faller innenfor ett standardavvik.
  3. Omtrent 95% av arealet under kurven faller innenfor to standardavvik.
  4. Omtrent 99,7% av arealet under kurven faller innenfor tre standardavvik.

Element 2, 3 og 4 ovenfor blir noen ganger referert til som den empiriske regelen eller 68–95–99.7-regelen. Når du har bestemt at dataene normalt er distribuert (bjelle buet) og beregne middelverdien og standardavvik, kan du bestemme sannsynlighet at et enkelt datapunkt vil falle innenfor et gitt spekter av muligheter.

Bell Curve-eksempel

Et godt eksempel på en klokkekurve eller normalfordeling er rull med to terninger. Distribusjonen er sentrert rundt tallet syv og sannsynligheten avtar når du beveger deg bort fra sentrum.

Her er den prosentvise sjansen for de forskjellige utfallene når du triller to terninger.

  • To: (1/36) 2.78%
  • Tre: (2/36) 5.56%
  • fire: (3/36) 8.33%
  • Fem: (4/36) 11.11%
  • Seks: (5/36) 13.89%
  • Seven: (6/36) 16,67% = mest sannsynlig utfall
  • Åtte: (5/36) 13.89%
  • Ni: (4/36) 11.11%
  • Ti: (3/36) 8.33%
  • Elleve: (2/36) 5.56%
  • Tolv: (1/36) 2.78%

Normale fordelinger har mange praktiske egenskaper, så i mange tilfeller, spesielt i fysikk og astronomitilfeldige variasjoner med ukjente fordelinger antas ofte å være normale for å tillate sannsynlighetsberegninger. Selv om dette kan være en farlig antagelse, er det ofte en god tilnærming på grunn av et overraskende resultat kjent som sentral grense teorem.

Dette teoremet sier at gjennomsnittet av ethvert sett med varianter med en hvilken som helst distribusjon som har et begrenset middel og varians, har en tendens til å skje i en normal fordeling. Mange vanlige attributter som testresultater eller høyde følger omtrent normale fordelinger, med få medlemmer i høye og lave ender og mange i midten.

Når du ikke burde bruke klokkekurven

Det er noen typer data som ikke følger et normalt distribusjonsmønster. Disse datasettene bør ikke tvinges til å prøve å passe en bjellekurve. Et klassisk eksempel vil være studentkarakterer, som ofte har to modus. Andre typer data som ikke følger kurven inkluderer inntekt, befolkningsvekst og mekaniske feil.

instagram story viewer