Slik lager du en boksplott

Boxplots får navnet sitt fra det de ligner på. De blir noen ganger referert til som rute- og vispeplott. Disse typene grafer brukes til å vise området, median, og kvartiler. Når de er fullført, inneholder en boks første og tredje kvartil. Whiskers strekker seg fra boksen til minimums- og maksimumsverdiene for dataene.

De følgende sidene viser hvordan du lager en boksdiagram for et sett med data med minimum 20, første kvartil 25, median 32, tredje kvartil 35 og maksimalt 43.

Tegn fem vertikale linjer over tallinjen, en for hver av verdiene på minimum, første kvartil, median, tredje kvartil og maksimum. Normalt er linjene for minimum og maksimum kortere enn linjene for kvartilene og medianen.

For våre data er minimum 20, første kvartil er 25, median er 32, tredje kvartil er 35 og maksimum 43. Linjene som tilsvarer disse verdiene er tegnet over.

Deretter tegner vi en boks og bruker noen av linjene for å veilede oss. Den første kvartilen er venstre side av boksen vår. Den tredje kvartilen er høyre side av boksen vår. Median faller hvor som helst inne i boksen.

instagram viewer

Ved definisjonen av det første og tredje kvartil, er halvparten av alle dataverdiene inneholdt i boksen.

Nå ser vi hvordan en boks og vispegraf får den andre delen av navnet. Vispere trekkes for å demonstrere omfanget av dataene. Tegn en horisontal linje fra linjen for minimum til venstre side av boksen ved første kvartil. Dette er en av whiskersene våre. Tegn en andre horisontale linje fra høyre side av boksen ved tredje kvartil til linjen som representerer maksimalt data. Dette er vår andre whisker.

Box-og-visp-grafen vår, eller boksplott, er nå komplett. På et øyeblikk kan vi bestemme omfanget av verdiene til dataene, og i hvor stor grad det er samlet. Neste trinn viser hvordan vi kan sammenligne og kontrastere to boksplott.

Rute- og whisker-grafer viser sammendraget av fem tall for et sett med data. To forskjellige datasett kan dermed sammenlignes ved å undersøke boksplatene deres sammen. Over en andre boksplott er tegnet over den vi har konstruert.

Det er et par funksjoner som fortjener omtale. Den første er at medianene til begge datasettene er identiske. Den vertikale linjen inne i begge boksene er på samme sted på tallinjen. Den andre tingen å merke seg om de to boksene og vispegrafene er at toppplottet ikke er like spredt nederst. Toppboksen er mindre og værhårene strekker seg ikke så langt.

Å tegne to bokseplasser over den samme tallinjen antar at dataene bak hver fortjener å bli sammenlignet. Det ville ikke være fornuftig å sammenligne en eskehøyde på tredje klassinger med hundervekt på et lokalt ly. Selv om begge inneholder data i forholdet målingsnivå, er det ingen grunn til å sammenligne dataene.

På den annen side vil det være fornuftig å sammenligne kasseplott med tredje klassingers høyde hvis man plottet representerte dataene fra guttene på en skole, og den andre plottet representerte dataene fra jentene på skolen.