Empirisk regel for middel, median og modus

Før vi går videre er det viktig å forstå hva vi snakker om når vi viser til et empirisk forhold og kontrasterer dette med teoretiske studier. Noen resultater i statistikk og andre kunnskapsfelt kan avledes fra noen tidligere uttalelser på en teoretisk måte. Vi begynner med det vi vet, og bruker deretter logikk, matematikk og deduktiv resonnering og se hvor dette fører oss. Resultatet er en direkte konsekvens av andre kjente fakta.

I kontrast til det teoretiske er den empiriske måten å tilegne seg kunnskap. I stedet for å resonnere fra allerede etablerte prinsipper, kan vi observere verden rundt oss. Fra disse observasjonene kan vi deretter formulere en forklaring på hva vi har sett. Mye av vitenskapen gjøres på denne måten. Eksperimenter gir oss empiriske data. Målet blir da å formulere en forklaring som passer til alle dataene.

I statistikk er det et forhold mellom middel, median og modus som er empirisk basert. Observasjoner av utallige datasett har vist at det meste av tiden er forskjellen mellom middel og modus tre ganger forskjellen mellom middel og median. Dette forholdet i ligningsform er:

instagram viewer

For å se forholdet ovenfor med data fra den virkelige verden, la oss se på de amerikanske statspopulasjonene i 2010. I millioner var befolkningen: California - 36,4, Texas - 23,5, New York - 19,3, Florida - 18,1, Illinois - 12,8, Pennsylvania - 12,4, Ohio - 11,5, Michigan - 10,1, Georgia - 9.4, North Carolina - 8.9, New Jersey - 8.7, Virginia - 7.6, Massachusetts - 6.4, Washington - 6.4, Indiana - 6.3, Arizona - 6.2, Tennessee - 6.0, Missouri - 5.8, Maryland - 5.6, Wisconsin - 5.6, Minnesota - 5.2, Colorado - 4.8, Alabama - 4.6, South Carolina - 4.3, Louisiana - 4.3, Kentucky - 4.2, Oregon - 3.7, Oklahoma - 3.6, Connecticut - 3.5, Iowa - 3.0, Mississippi - 2.9, Arkansas - 2.8, Kansas - 2.8, Utah - 2.6, Nevada - 2.5, New Mexico - 2.0, West Virginia - 1.8, Nebraska - 1.8, Idaho - 1.5, Maine - 1.3, New Hampshire - 1.3, Hawaii - 1.3, Rhode Island - 1.1, Montana - .9, Delaware - .9, South Dakota - .8, Alaska - .7, North Dakota - .6, Vermont -. 6, Wyoming - .5

Hvis vi for eksempel vet at vi har gjennomsnittet 10, en modus 4, hva er medianen til datasettet vårt? Siden middel - modus = 3 (gjennomsnitt - median), kan vi si at 10 - 4 = 3 (10 - median). Av en viss algebra ser vi at 2 = (10 - median), og medianen til dataene våre er 8.

Som vi har sett ovenfor, er ovennevnte ikke et eksakt forhold. I stedet er det en god tommelfingerregel, lik den for rekkevidde regel, som etablerer en omtrentlig forbindelse mellom standardavvik og rekkevidde. Midlet, medianen og modus passer kanskje ikke nøyaktig i det empiriske forholdet ovenfor, men det er en god sjanse for at det vil være rimelig nært.