Variasjon og standardavvik er to nært beslektede mål av variasjon som du vil høre om mye i studier, tidsskrifter eller statistikklasse. Det er to grunnleggende og grunnleggende begreper i statistikk som må forstås for å forstå de fleste andre statistiske konsepter eller prosedyrer. Nedenfor gjennomgår vi hva de er og hvordan vi finner variansen og standardavviket.
Key Takeaways: Variance and Standard Deviation
- Variansen og standardavviket viser oss hvor mye score i en fordeling varierer fra gjennomsnittet.
- Standardavviket er kvadratroten til variansen.
- For små datasett kan variansen beregnes for hånd, men statistiske programmer kan brukes til større datasett.
Definisjon
Per definisjon er varians og standardavvik begge mål for variasjon for intervall-forhold variabler. De beskriver hvor mye variasjon eller mangfold det er i en fordeling. Begge varians og standardavvik øke eller redusere basert på hvor tett score gruppene rundt gjennomsnittet.
Varians er definert som gjennomsnittet av de kvadratiske avvikene fra gjennomsnittet. For å beregne variansen trekker du først gjennomsnittet fra hvert tall og firkanter resultatene for å finne de kvadratiske forskjellene. Du finner da gjennomsnittet av de kvadratiske forskjellene. Resultatet er variansen.
Standardavviket er et mål på hvor spredte tallene i en fordeling er. Den indikerer hvor mye, i gjennomsnitt, hver av verdiene i fordelingen avviker fra gjennomsnittet, eller sentrum, for fordelingen. Det beregnes ved å ta kvadratroten av variansen.
Et konseptuelt eksempel
Variansen og standardavviket er viktig fordi de forteller oss ting om datasettet som vi ikke kan lære bare ved å se på gjennomsnitt, eller gjennomsnitt. Tenk deg som et eksempel at du har tre yngre søsken: en søsken som er 13 år og tvillinger som er 10 år. I dette tilfellet vil gjennomsnittsalderen til søsknene dine være 11. Se for deg at du har tre søsken, 17, 12 og 4 år. I dette tilfellet ville gjennomsnittsalderen til søsknene dine fortsatt være 11, men variansen og standardavviket ville være større.
Et kvantitativt eksempel
La oss si at vi vil finne variansen og standardavviket i alderen blant din gruppe på 5 nære venner. Aldrene til deg og vennene dine er 25, 26, 27, 30 og 32.
Først må vi finne middelalderen: (25 + 26 + 27 + 30 + 32) / 5 = 28.
Deretter må vi beregne forskjellene fra middelverdien for hver av de 5 vennene.
25 – 28 = -3
26 – 28 = -2
27 – 28 = -1
30 – 28 = 2
32 – 28 = 4
Neste, for å beregne variansen, tar vi hver forskjell fra gjennomsnittet, kvadraterer det, og deretter gjennomsnittet resultatet.
Varians = ((-3)2 + (-2)2 + (-1)2 + 22 + 42)/ 5
= (9 + 4 + 1 + 4 + 16 ) / 5 = 6.8
Så variansen er 6,8. Og standardavviket er kvadratroten til variansen, som er 2,61. Hva dette betyr er at du og vennene dine i gjennomsnitt er 2,61 år fra hverandre i alder.
Selv om det er mulig å beregne variansen for hånd for mindre datasett som dette, statistiske programmer kan også brukes til å beregne variansen og standardavviket.
Eksempel versus befolkning
Når du utfører statistiske tester, er det viktig å være klar over forskjellen mellom a befolkning og prøve. For å beregne standardavviket (eller variansen) til en populasjon, må du samle målinger for alle i gruppen du studerer; for en prøve, ville du bare samle inn målinger fra en delmengde av befolkningen.
I eksemplet over antok vi at gruppen av fem venner var en befolkning; hvis vi i stedet hadde behandlet det som en prøve, beregning av standardavviket og prøvevariansen ville være litt annerledes (i stedet for å dele med prøvestørrelsen for å finne varians, ville vi først ha trukket en fra prøvestørrelsen og deretter delt på denne mindre Nummer).
Betydningen av variasjonen og standardavviket
Variansen og standardavviket er viktig i statistikken, fordi de tjener som grunnlag for andre typer statistiske beregninger. For eksempel er standardavviket nødvendig for å konvertere testresultater til Z-score. Variansen og standardavviket spiller også en viktig rolle når du gjennomfører statistiske tester som f.eks t-tester.
referanser
Frankfort-Nachmias, C. & Leon-Guerrero, A. (2006). Sosialstatistikk for et mangfoldig samfunn. Thousand Oaks, CA: Pine Forge Press.