Hvordan tillitsintervaller brukes til å beregne forskjellige parametere

Inferensiell statistikk får navnet fra det som skjer i denne grenen av statistikk. I stedet for bare å beskrive et sett med data, søker inferensiell statistikk å utlede noe om en befolkning på grunnlag av statistisk utvalg. Et spesifikt mål i inferensiell statistikk innebærer bestemmelse av verdien av en ukjent befolkning parameter. Verdiene som vi bruker for å estimere denne parameteren kalles et konfidensintervall.

Formen for et tillitsintervall

Et konfidensintervall består av to deler. Den første delen er estimatet av populasjonsparameteren. Vi får dette estimatet ved å bruke en enkel tilfeldig prøve. Fra denne prøven beregner vi statistikken som tilsvarer parameteren vi ønsker å estimere. Hvis vi for eksempel var interessert i middelhøyden for alle førsteklassestudenter i USA, ville vi gjort det bruk en enkel tilfeldig prøve av amerikanske førsteklassinger, måle dem alle og beregne deretter middelhøyden på vår prøve.

Den andre delen av et konfidensintervall er feilmarginen. Dette er nødvendig fordi vårt estimat alene kan være forskjellig fra den sanne verdien av populasjonsparameteren. For å gi rom for andre potensielle verdier av parameteren, må vi produsere et antall tall. Feilmarginen gjør dette, og hvert konfidensintervall er av følgende form:

instagram viewer

Anslå ± feilmargin

Anslaget er i midten av intervallet, og deretter trekker vi fra og legger til feilmarginen fra dette estimatet for å få et verdiområde for parameteren.

Selvtillitsnivå

Tilkoblet hvert tillitsintervall er et nivå av selvtillit. Dette er en sannsynlighet eller prosent som indikerer hvor stor sikkerhet vi bør tilskrives tillitsintervallet. Hvis alle andre aspekter av en situasjon er identiske, jo høyere konfidensnivå, jo større er konfidensintervallet.

Dette tillitsnivået kan føre til litt forvirring. Det er ikke et utsagn om prøvetakingsprosedyre eller populasjon. I stedet gir den en indikasjon på suksessen med prosessen med konstruksjon av et tillitsintervall. For eksempel vil tillitsintervaller med tillit på 80 prosent på lang sikt gå glipp av den sanne populasjonsparameteren en av hver femte gang.

Ethvert tall fra null til en kunne i teorien brukes til et konfidensnivå. I praksis er 90 prosent, 95 prosent og 99 prosent alle vanlige tillitsnivåer.

Feilmargin

Feilmarginen til et konfidensnivå bestemmes av et par faktorer. Vi kan se dette ved å undersøke formelen for feilmargin. En feilmargin er av formen:

Feilmargin = (Statistikk for tillitsnivå) * (Standardavvik / feil)

Statistikken for tillitsnivået avhenger av hva sannsynlighetsfordeling blir brukt og hvilket selvtillit vi har valgt. For eksempel, hvis Cer tillitsnivået vårt, og vi jobber med a normal distribusjon, deretter C er området under kurven mellom -z* til z*. Dette tallet z* er tallet i vår formel for feilmargin.

Standardavvik eller standardfeil

Det andre begrepet som er nødvendig i vår feilmargin, er standardavviket eller standardfeilen. Standardavviket for distribusjonen som vi jobber med er å foretrekke her. Parametere fra populasjonen er imidlertid ukjente. Dette tallet er vanligvis ikke tilgjengelig når du danner tillitsintervaller i praksis.

For å håndtere denne usikkerheten når vi kjenner standardavviket bruker vi i stedet standardfeilen. Standardfeilen som tilsvarer et standardavvik er et estimat for dette standardavviket. Det som gjør standardfeilen så kraftig, er at den beregnes ut fra den enkle tilfeldige prøven som brukes til å beregne estimatet vårt. Ingen ekstra informasjon er nødvendig, siden prøven gjør alle estimatene for oss.

Ulike tillitsintervaller

Det er en rekke forskjellige situasjoner som krever tillitsintervaller. Disse konfidensintervallene brukes til å estimere en rekke forskjellige parametere. Selv om disse aspektene er forskjellige, forenes alle disse tillitsintervallene med det samme generelle formatet. Noen vanlige konfidensintervaller er de for et populasjonsgjennomsnitt, befolkningsvarians, befolkningsandel, forskjellen mellom to populasjonsmidler og forskjellen på to befolkningsforhold.