Binomialfordelingen innebærer a diskrete tilfeldig variabel. Sannsynligheter i binomial setting kan beregnes på en enkel måte ved å bruke formelen for en binomial koeffisient. Selv om det i teorien er en enkel beregning, kan det i praksis bli ganske kjedelig eller til og med beregningsmessig umulig å gjøre beregne binomiale sannsynligheter. Disse problemene kan omgås ved å bruke en normal distribusjonfor å tilnærme en binomial fordeling. Vi får se hvordan vi gjør dette ved å gå gjennom trinnene i en beregning.
Trinn for å bruke normal tilnærming
Først må vi avgjøre om det er aktuelt å bruke den normale tilnærmingen. Ikke alle binomial fordeling er lik. Noen stiller ut nok skjevhet at vi ikke kan bruke en normal tilnærming. For å sjekke om den normale tilnærmingen skal brukes, må vi se på verdien av p, som er sannsynligheten for suksess, og n, som er antall observasjoner av våre binomial variabel.
For å bruke den normale tilnærmingen, vurderer vi begge np og n( 1 - p ). Hvis begge disse tallene er større enn eller lik 10, er vi berettiget til å bruke den normale tilnærmingen. Dette er en generell tommelfingerregel, og typisk jo større verdiene er
np og n( 1 - p ), jo bedre er tilnærmingen.Sammenligning mellom binomial og normal
Vi vil sammenligne en nøyaktig binomial sannsynlighet med den oppnådd ved en normal tilnærming. Vi vurderer å kaste 20 mynter og vil vite sannsynligheten for at fem mynter eller mindre var hoder. Hvis X er antall hoder, så ønsker vi å finne verdien:
P (X = 0) + P (X = 1) + P (X = 2) + P (X = 3) + P (X = 4) + P (X = 5).
De bruk av binomialformelen for hver av disse seks sannsynlighetene viser oss at sannsynligheten er 2.0695%. Vi vil nå se hvor nær vår normale tilnærming vil være denne verdien.
Når vi sjekker forholdene, ser vi at begge deler np og np(1 - p) er lik 10. Dette viser at vi kan bruke den normale tilnærmingen i dette tilfellet. Vi vil bruke en normalfordeling med gjennomsnitt av np = 20 (0,5) = 10 og et standardavvik på (20 (0,5) (0,5))0.5 = 2.236.
For å bestemme sannsynligheten for at X er mindre enn eller lik 5 vi trenger å finne z-Score for 5 i normalfordelingen som vi bruker. Dermed z = (5 – 10)/2.236 = -2.236. Ved å konsultere et bord av z-poeng vi ser at sannsynligheten for at z er mindre enn eller lik -2.236 er 1.267%. Dette skiller seg fra den faktiske sannsynligheten, men er innenfor 0,8%.
Kontinuitetskorrigeringsfaktor
For å forbedre estimatet vårt, er det riktig å innføre en kontinuitetskorrigeringsfaktor. Dette brukes fordi a normal distribusjon er kontinuerlige mens binomial fordeling er diskret. For en binomial tilfeldig variabel, et sannsynlighetshistogram for X = 5 vil inneholde en stolpe som går fra 4,5 til 5,5 og er sentrert til 5.
Dette betyr at for eksempelet ovenfor er sannsynligheten for at X er mindre enn eller lik 5 for en binomvariabel skal estimeres med sannsynligheten for at X er mindre enn eller lik 5,5 for en kontinuerlig normalvariabel. Dermed z = (5.5 – 10)/2.236 = -2.013. Sannsynligheten for at z