Hva er kurtose i statistikk?

Distribusjoner av data og sannsynlighetsfordelinger er ikke alle i samme form. Noen er asymmetriske og skjev til venstre eller til høyre. Andre distribusjoner er bimodal og har to topper. En annen funksjon å tenke på når du snakker om en fordeling er formen på halene til fordelingen helt til venstre og helt til høyre. Kurtosis er målet på tykkelsen eller tyngden av halene i en distribusjon. Kurtosen til en distribusjon er i en av tre kategorier av klassifisering:

  • Mesokurtic
  • Leptokurtic
  • Platykurtic

Vi vil vurdere hver av disse klassifiseringene etter tur. Vår undersøkelse av disse kategoriene vil ikke være så presis som vi kunne være hvis vi brukte den tekniske matematiske definisjonen av kurtosis.

Mesokurtic

Kurtose måles vanligvis med hensyn til normal distribusjon. En fordeling som har haler formet på omtrent samme måte som all normal distribusjon, ikke bare standard normalfordeling, sies å være mesokurtisk. Kurtosen ved en mesokurtisk distribusjon er verken høy eller lav, snarere anses den å være en grunnlinje for de to andre klassifiseringene.

instagram viewer

I tillegg normale fordelinger, binomiale fordelinger som p er nær 1/2 regnes for å være mesokurtisk.

Leptokurtic

En leptokurtisk distribusjon er en som har kurtose større enn en mesokurtisk distribusjon. Leptokurtiske fordelinger blir noen ganger identifisert av topper som er tynne og høye. Halene til disse distribusjonene, både til høyre og venstre, er tykke og tunge. Leptokurtiske distribusjoner er navngitt av prefikset "lepto" som betyr "mager."

Det er mange eksempler på leptokurtiske fordelinger. En av de mest kjente leptokurtiske fordelingene er Studentens t-distribusjon.

Platykurtic

Den tredje klassifiseringen for kurtose er platykurtisk. Platykurtiske fordelinger er de som har smale haler. Mange ganger har de en topp som er lavere enn en mesokurtisk distribusjon. Navnet på disse typer distribusjoner kommer fra betydningen av prefikset "platy" som betyr "bredt."

Alle uniform distribusjoner er platykurtiske. I tillegg til dette diskrete sannsynlighetsfordeling fra en enkelt flip av en mynt er platykurtisk.

Beregning av Kurtosis

Disse klassifiseringene av kurtose er fremdeles noe subjektive og kvalitative. Selv om vi kanskje kan se at en distribusjon har tykkere haler enn en normalfordeling, hva om vi ikke har grafen for en normalfordeling å sammenligne med? Hva om vi vil si at en distribusjon er mer leptokurtisk enn en annen?

For å svare på slike spørsmål trenger vi ikke bare en kvalitativ beskrivelse av kurtose, men et kvantitativt mål. Formelen som brukes er μ44 hvor μ4 er Pearsons fjerde øyeblikk om middelværet og sigma er standardavviket.

Overflødig kurtose

Nå som vi har en måte å beregne kurtose på, kan vi sammenligne de oppnådde verdiene i stedet for former. Den normale fordelingen er funnet å ha en kurtose på tre. Dette blir nå vårt grunnlag for mesokurtiske distribusjoner. En fordeling med kurtose større enn tre er leptokurtisk og en distribusjon med kurtose mindre enn tre er platykurtisk.

Siden vi behandler en mesokurtisk distribusjon som en grunnlinje for våre andre distribusjoner, kan vi trekke tre fra vår standardberegning for kurtose. Formelen μ44 - 3 er formelen for overflødig kurtose. Vi kunne deretter klassifisere en distribusjon fra overflødig kurtose:

  • Mesokurtiske fordelinger har overflødig kurtose på null.
  • Platykurtiske fordelinger har negativ overflødig kurtose.
  • Leptokurtiske fordelinger har positiv overflødig kurtose.

En merknad om navnet

Ordet "kurtosis" virker underlig ved første eller andre lesning. Det er faktisk fornuftig, men vi trenger å vite gresk for å gjenkjenne dette. Kurtosis er avledet fra en translitterasjon av det greske ordet kurtos. Dette greske ordet har betydningen "buet" eller "svulmende", noe som gjør det til en passende beskrivelse av konseptet kjent som kurtosis.