Beskrivende vs. Inferensiell statistikk

Statistikkfeltet er delt inn i to hovedinndelinger: beskrivende og inferensielle. Hvert av disse segmentene er viktig, og tilbyr forskjellige teknikker som oppnår forskjellige mål. Beskrivende statistikk beskriver hva som foregår i et befolkning eller datasett. Inferensiell statistikk, derimot, lar forskere ta funn fra en utvalgsgruppe og generalisere dem til en større befolkning. De to typene statistikker har noen viktige forskjeller.

Beskrivende statistikk

Beskrivende statistikk er den typen statistikk som sannsynligvis sprer seg til de fleste når de hører ordet "statistikk." I denne grenen av statistikk er målet å beskrive. Numeriske mål brukes for å fortelle om funksjoner i et sett med data. Det er en rekke elementer som hører hjemme i denne delen av statistikken, for eksempel:

  • De gjennomsnitt, eller måling av sentrum av et datasett, bestående av middelverdien, medianen, modus eller mellomtone
  • Spredningen av et datasett, som kan måles med område eller standardavvik
  • Overordnede beskrivelser av data som fem nummer sammendrag
  • instagram viewer
  • Målinger som skjevhet og kurtose
  • Utforskingen av forhold og sammenheng mellom sammenkoblede data
  • Presentasjonen av statistiske resultater i grafisk skjema

Disse tiltakene er viktige og nyttige fordi de lar forskere se mønstre blant data, og dermed gjøre seg gjeldende av disse dataene. Beskrivende statistikk kan bare brukes til å beskrive populasjonen eller datasettet som er undersøkt: Resultatene kan ikke generaliseres til noen annen gruppe eller populasjon.

Typer beskrivende statistikk

Det er to typer beskrivende statistikk som samfunnsforskere bruker:

Tiltak av sentral tendens fange generelle trender i dataene og blir beregnet og uttrykt som gjennomsnitt, median og modus. Et middel forteller forskere det matematiske gjennomsnittet av alt datasettet, for eksempel gjennomsnittsalderen ved første ekteskap; medianen representerer midten av datadistribusjonen, som alderen som ligger i midten av aldersområdet hvor folk først gifter seg; og modus kan være den vanligste alderen hvor folk først gifter seg.

Spredningstiltak beskriver hvordan dataene distribueres og forholder seg til hverandre, inkludert:

  • Området, hele verdiene som finnes i et datasett
  • Frekvensfordelingen, som definerer hvor mange ganger en bestemt verdi skal oppstå i et datasett
  • Kvartiler, undergrupper dannet i et datasett når alle verdiene er delt inn i fire like deler over hele området
  • Bety absolutt avvik, gjennomsnittet av hvor mye hver verdi avviker fra gjennomsnittet
  • Forskjell, som illustrerer hvor mye av en spredning som finnes i dataene
  • Standardavvik, som illustrerer spredning av data i forhold til gjennomsnittet

Målinger av spredning er ofte visuelt representert i tabeller, kakediagram og stolpediagrammer og histogrammer for å hjelpe deg med å forstå trender i dataene.

Inferensiell statistikk

Inferensjonsstatistikk produseres gjennom komplekse matematiske beregninger som lar forskere utlede trender om en større populasjon basert på en studie av et utvalg tatt fra den. Forskere bruker inferensiell statistikk for å undersøke forholdet mellom variabler i et utvalg og lag deretter generaliseringer eller spådommer om hvordan disse variablene vil forholde seg til en større befolkning.

Det er vanligvis umulig å undersøke hvert enkelt medlem av befolkningen individuelt. Så forskere velger et representativt undergruppe av befolkningen, kalt et statistisk utvalg, og fra denne analysen kan de si noe om befolkningen som utvalget kom fra. Det er to hovedinndelinger av inferensiell statistikk:

  • Et konfidensintervall gir et utvalg av verdier for en ukjent parameter for populasjonen ved å måle et statistisk utvalg. Dette kommer til uttrykk i form av et intervall og graden av tillit til at parameteren er innenfor intervallet.
  • Tester av betydning eller hypotesetesting der forskere fremsetter krav på befolkningen ved å analysere et statistisk utvalg. Ved design er det en viss usikkerhet i denne prosessen. Dette kan komme til uttrykk i betydningsnivå.

Teknikker som samfunnsforskere bruker for å undersøke forholdene mellom variabler, og derved lage statistiske statistikker, inkluderer lineære regresjonsanalyser, logistiske regresjonsanalyser, ANOVA, korrelasjonsanalyser, strukturell ligningsmodellering, og overlevelsesanalyse. Når forskere utfører bruk av inferensiell statistikk, gjennomfører forskere en test av betydning for å avgjøre om de kan generalisere resultatene sine til en større befolkning. Vanlige tester av betydning inkluderer chi-kvadrat og t-test. Disse forteller forskerne sannsynligheten for at resultatene fra deres analyse av prøven er representative for befolkningen som helhet.

Beskrivende vs. Inferensiell statistikk

Selv om beskrivende statistikk er nyttig i å lære ting som spredning og sentrum av dataene, kan ingenting i beskrivende statistikk brukes til å gjøre noen generaliseringer. I beskrivende statistikk er målinger som gjennomsnitt og standardavvik oppgitt som eksakte tall.

Selv om inferential statistikk bruker noen lignende beregninger - som gjennomsnitt og standardavvik, er fokuset annerledes for inferential statistikk. Inferensiell statistikk starter med et utvalg og generaliseres deretter til en befolkning. Denne informasjonen om en befolkning er ikke oppgitt som et tall. I stedet uttrykker forskere disse parametrene som en rekke potensielle tall, sammen med en grad av selvtillit.