De median av et sett med data er midtveispunktet der nøyaktig halvparten av dataverdiene er mindre enn eller lik medianen. På lignende måte kan vi tenke på medianen til a kontinuerligesannsynlighetsfordeling, men heller enn å finne middelverdien i et sett med data, finner vi midten av distribusjonen på en annen måte.
Det totale arealet under en sannsynlighetstetthetsfunksjon er 1, som representerer 100%, og som et resultat kan halvparten av dette være representert med halvparten eller 50 prosent. En av de store ideene i matematisk statistikk er at sannsynligheten er representert av området under kurven til tetthetsfunksjon, som beregnes av et integral, og dermed er medianen for en kontinuerlig distribusjon poenget med de ekte nummer linje der nøyaktig halvparten av området ligger til venstre.
Dette kan oppgis mer kortfattet av følgende feil integral. Median for den kontinuerlige tilfeldige variabelen X med tetthetsfunksjon f( x) er verdien M slik at:
0.5=∫m−∞f(x)dx
Median for eksponentiell distribusjon
Vi beregner nå median for eksponentiell distribusjon Exp (A). En tilfeldig variabel med denne fordelingen har tetthetsfunksjon f(x) = e-x/EN/ A for x et hvilket som helst ikke-negativt reelt tall. Funksjonen inneholder også matematisk konstant e, omtrent lik 2.71828.
Siden sannsynlighetstetthetsfunksjonen er null for en negativ verdi av x, alt vi må gjøre er å integrere følgende og løse for M:
0,5 = ∫0M f (x) dx
Siden integralen ∫ e-x/EN/ A dx = -e-x/EN, resultatet er det
0,5 = -e-M / A + 1
Dette betyr at 0,5 = e-M / A og etter å ha tatt den naturlige logaritmen til begge sider av ligningen, har vi:
ln (1/2) = -M / A
Siden 1/2 = 2-1, etter egenskaper til logaritmer vi skriver:
- ln2 = -M / A
Å multiplisere begge sider med A gir oss resultatet at median M = A ln2.
Median-gemiddelde ulikhet i statistikk
En konsekvens av dette resultatet bør nevnes: gjennomsnittet av eksponentiell distribusjon Exp (A) er A, og siden ln2 er mindre enn 1, følger det at produktet Aln2 er mindre enn A. Dette betyr at medianen for eksponentiell fordeling er mindre enn gjennomsnittet.
Dette er fornuftig hvis vi tenker på grafen for sannsynlighetstetthetsfunksjonen. På grunn av den lange halen er denne fordelingen skjev til høyre. Mange ganger når en fordeling er skjev til høyre, er middelet til høyre for medianen.
Hva dette betyr når det gjelder statistisk analyse er at vi ofte kan forutsi at middelverdien og medianen ikke gjør det direkte korrelere gitt sannsynligheten for at data er skjev til høyre, som kan uttrykkes som median-middel ulikhetssikkerhet kjent som Chebysjevs ulikhet.
Ta som et eksempel et datasett som antyder at en person får totalt 30 besøkende på 10 timer, der gjennomsnittlig ventetid for en besøkende er 20 minutter, mens datasettet kan tyde på at median ventetid ville være et sted mellom 20 og 30 minutter hvis over halvparten av de besøkende kom i løpet av de første fem timer.