Det er mange målinger av spredning eller spredning i statistikk. Selv om område og standardavvik brukes ofte, det er andre måter å kvantifisere spredning på. Vi vil se på hvordan du beregner det gjennomsnittlige absolutte avviket for et datasett.
Definisjon
Vi begynner med definisjonen av gjennomsnittlig absolutt avvik, som også omtales som gjennomsnittlig absolutt avvik. Formelen som vises med denne artikkelen er den formelle definisjonen av det gjennomsnittlige absolutte avviket. Det kan være mer fornuftig å betrakte denne formelen som en prosess, eller serie trinn, som vi kan bruke for å få vår statistikk.
- Vi starter med en gjennomsnitt, eller måling av sentrum, av et datasett, som vi vil betegne med m.
- Neste, finner vi hvor mye hver av dataverdiene avviker fra m. Dette betyr at vi tar forskjellen mellom hver av dataverdiene og m.
- Etter dette tar vi absolutt verdi av hver av forskjellen fra forrige trinn. Med andre ord slipper vi negative tegn for noen av forskjellene. Årsaken til å gjøre dette er at det er positive og negative avvik fra m. Hvis vi ikke finner ut en måte å eliminere de negative tegnene på, vil alle avvikene avbryte hverandre hvis vi legger dem sammen.
- Nå legger vi sammen alle disse absolutte verdiene.
- Til slutt deler vi denne summen med n, som er det totale antall dataverdier. Resultatet er det gjennomsnittlige absolutte avviket.
variasjoner
Det er flere varianter for prosessen ovenfor. Merk at vi ikke spesifiserte nøyaktig hva m er. Årsaken til dette er at vi kunne bruke en rekke statistikker for m. Typisk er dette sentrum for datasettet vårt, og så kan alle målinger av sentral tendens brukes.
De vanligste statistiske målingene av midten av et datasett er gjennomsnittet, median og modus. Således kan noen av disse brukes som m i beregningen av gjennomsnittet absolutt avvik. Dette er grunnen til at det er vanlig å referere til det gjennomsnittlige absolutte avviket om middelverdien eller det gjennomsnittlige absolutte avviket om medianen. Vi vil se flere eksempler på dette.
Eksempel: Gjennomsnittlig absolutt avvik om gjennomsnittet
Anta at vi starter med følgende datasett:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Gjennomsnittet av dette datasettet er 5. Tabellen nedenfor organiserer vårt arbeid med å beregne det gjennomsnittlige absolutte avviket for gjennomsnittet.
Dataverdi | Avvik fra gjennomsnitt | Absolutt verdi av avvik |
1 | 1 - 5 = -4 | |-4| = 4 |
2 | 2 - 5 = -3 | |-3| = 3 |
2 | 2 - 5 = -3 | |-3| = 3 |
3 | 3 - 5 = -2 | |-2| = 2 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
9 | 9 - 5 = 4 | |4| = 4 |
Totalt absolutte avvik: | 24 |
Vi deler nå denne summen med 10, siden det er totalt ti dataverdier. Det gjennomsnittlige absolutte avviket for gjennomsnittet er 24/10 = 2,4.
Eksempel: Gjennomsnittlig absolutt avvik om gjennomsnittet
Nå starter vi med et annet datasett:
1, 1, 4, 5, 5, 5, 5, 7, 7, 10.
Akkurat som forrige datasett er gjennomsnittet for dette datasettet 5.
Dataverdi | Avvik fra gjennomsnitt | Absolutt verdi av avvik |
1 | 1 - 5 = -4 | |-4| = 4 |
1 | 1 - 5 = -4 | |-4| = 4 |
4 | 4 - 5 = -1 | |-1| = 1 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
5 | 5 - 5 = 0 | |0| = 0 |
7 | 7 - 5 = 2 | |2| = 2 |
7 | 7 - 5 = 2 | |2| = 2 |
10 | 10 - 5 = 5 | |5| = 5 |
Totalt absolutte avvik: | 18 |
Dermed er det absolutte avviket om gjennomsnittet 18/10 = 1,8. Vi sammenligner dette resultatet med det første eksemplet. Selv om gjennomsnittet var identisk for hvert av disse eksemplene, var dataene i det første eksemplet mer spredt. Vi ser fra disse to eksemplene at det gjennomsnittlige absolutte avviket fra det første eksemplet er større enn det gjennomsnittlige absolutte avviket fra det andre eksemplet. Jo større gjennomsnittlig avvik, jo større spredning av dataene våre.
Eksempel: Gjennomsnittlig absolutt avvik om medianen
Begynn med samme datasett som det første eksemplet:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Median for datasettet er 6. I tabellen nedenfor viser vi detaljene for beregningen av det gjennomsnittlige absolutte avviket om medianen.
Dataverdi | Avvik fra median | Absolutt verdi av avvik |
1 | 1 - 6 = -5 | |-5| = 5 |
2 | 2 - 6 = -4 | |-4| = 4 |
2 | 2 - 6 = -4 | |-4| = 4 |
3 | 3 - 6 = -3 | |-3| = 3 |
5 | 5 - 6 = -1 | |-1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
7 | 7 - 6 = 1 | |1| = 1 |
9 | 9 - 6 = 3 | |3| = 3 |
Totalt absolutte avvik: | 24 |
Igjen deler vi totalen med 10 og oppnår et gjennomsnittlig gjennomsnittlig avvik om median som 24/10 = 2,4.
Eksempel: Gjennomsnittlig absolutt avvik om medianen
Begynn med det samme datasettet som før:
1, 2, 2, 3, 5, 7, 7, 7, 7, 9.
Denne gangen finner vi modusen for dette datasettet til å være 7. I tabellen nedenfor viser vi detaljene for beregningen av det gjennomsnittlige absolutte avviket for modus.
Data | Avvik fra modus | Absolutt verdi av avvik |
1 | 1 - 7 = -6 | |-5| = 6 |
2 | 2 - 7 = -5 | |-5| = 5 |
2 | 2 - 7 = -5 | |-5| = 5 |
3 | 3 - 7 = -4 | |-4| = 4 |
5 | 5 - 7 = -2 | |-2| = 2 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
7 | 7 - 7 = 0 | |0| = 0 |
9 | 9 - 7 = 2 | |2| = 2 |
Totalt absolutte avvik: | 22 |
Vi deler summen av de absolutte avvikene og ser at vi har et gjennomsnittlig absolutt avvik om modusen 22/10 = 2.2.
Raske fakta
Det er noen få grunnleggende egenskaper for gjennomsnittlige absolutte avvik
- Det gjennomsnittlige absolutte avviket om medianen er alltid mindre enn eller lik det gjennomsnittlige absolutte avviket om middelverdien.
- Standardavviket er større enn eller lik det gjennomsnittlige absolutte avviket for middelverdien.
- Det gjennomsnittlige absolutte avviket er noen ganger forkortet av MAD. Dessverre kan dette være tvetydig ettersom MAD vekselvis kan referere til medianens absolutte avvik.
- Det gjennomsnittlige absolutte avviket for en normalfordeling er omtrent 0,8 ganger størrelsen på standardavviket.
Vanlige bruksområder
Det gjennomsnittlige absolutte avviket har noen få bruksområder. Den første bruken er at denne statistikken kan brukes til å lære noen av ideene bak standardavvik. Det gjennomsnittlige absolutte avviket om gjennomsnittet er mye lettere å beregne enn standardavviket. Det krever ikke at vi kvadraterer avvikene, og vi trenger ikke å finne en firkantrot på slutten av beregningen. Videre er det gjennomsnittlige absolutte avviket mer intuitivt koblet til spredningen av datasettet enn hva standardavviket er. Dette er grunnen til at det gjennomsnittlige absolutte avviket noen ganger læres først, før du innfører standardavviket.
Noen har gått så langt som å hevde at standardavviket bør erstattes av det gjennomsnittlige absolutte avviket. Selv om standardavviket er viktig for vitenskapelige og matematiske anvendelser, er det ikke så intuitivt som det gjennomsnittlige absolutte avviket. For daglige applikasjoner er gjennomsnittet absolutt avvik en mer håndgripelig måte å måle hvor spredt data er.