I statistikk og matematikk er området forskjellen mellom maksimums- og minimumsverdiene for et datasett og fungerer som en av to viktige funksjoner i et datasett. Formelen for et område er den maksimale verdien minus den minste verdien i datasettet, som gir statistikere en bedre forståelse av hvor variert datasettet er.
To viktige funksjoner i et datasett inkluderer sentrum av dataene og spredningen av dataene, og senteret kan væremålt på en rekke måter: de mest populære av disse er gjennomsnittet, median, modus og mellomtone, men på lignende måte er det forskjellige måter å beregne hvor spredt datasettet er, og det enkleste og råeste målet for spredning kalles området.
Beregningen av rekkevidden er veldig grei. Alt vi trenger å gjøre er å finne forskjellen mellom den største dataverdien i vårt sett og den minste dataverdien. Oppsummert angitt har vi følgende formel: Område = Maksimal verdi – Minimumsverdi. For eksempel har datasettet 4,6,10, 15, 18 maksimalt 18, minimum 4 og et område på 18-4 = 14.
Området er en veldig grov måling av spredningen av data fordi den er ekstremt følsom for outliers, og som et resultat er det visse begrensninger i bruken av et ekte utvalg av et datasett til statistikere fordi en enkelt dataverdi kan påvirke verdien av område.
Tenk for eksempel settet med data 1, 2, 3, 4, 6, 7, 7, 8. Maksimal verdi er 8, minimum er 1 og området er 7. Så vurder det samme datasettet, bare med verdien 100 inkludert. Utvalget blir nå 100-1 = 99 hvor tilsetningen av et enkelt ekstra datapunkt påvirket verdien av området i stor grad. Standardavviket er et annet mål på spredning som er mindre utsatt for utliggere, men ulempen er at beregning av standardavviket er mye mer komplisert.
Utvalget forteller oss heller ingenting om de interne funksjonene i datasettet. For eksempel vurderer vi datasettet 1, 1, 2, 3, 4, 5, 5, 6, 7, 8, 8, 10 der området for dette datasettet er 10-1 = 9. Hvis vi da sammenligner dette med datasettet til 1, 1, 1, 2, 9, 9, 9, 10. Her er imidlertid rekkevidden ni, men for dette andre settet, og i motsetning til det første settet, blir dataene samlet rundt minimum og maksimum. Andre statistikker, som den første og tredje kvartilen, må brukes til å oppdage noe av denne interne strukturen.
Utvalget er en god måte å få en veldig grunnleggende forståelse av hvor spredte tall i datasettet egentlig er fordi det er enkelt å gjøre det beregne ettersom det bare krever en grunnleggende aritmetisk operasjon, men det er også noen få andre applikasjoner for et datasett i statistikk.
Området kan også brukes til å estimere et annet mål på spredning, standardavviket. I stedet for å gå gjennom en ganske komplisert formel for å finne standardavviket, kan vi i stedet bruke det som kalles rekkevidde regel. Området er grunnleggende i denne beregningen.
Området forekommer også i en boxplot, eller boks og vispeplaner. Maksimums- og minimumsverdiene er begge tegnet på slutten av vispene i grafen, og den totale lengden på vispene og boksen er lik området.