I statistikk brukes frihetsgrader til å definere antall uavhengige mengder som kan tilordnes en statistisk fordeling. Dette tallet refererer vanligvis til et positivt heltal som indikerer mangelen på begrensninger i en persons evne til å beregne manglende faktorer fra statistiske problemer.
Grad av frihet fungerer som variabler i den endelige beregningen av en statistikk og brukes til å bestemme utfallet av forskjellige scenarier i et system, og i matematiske frihetsgrader definerer antall dimensjoner i et domene som er nødvendig for å bestemme full vektor.
For å illustrere begrepet frihetsgrad, vil vi se på en grunnleggende beregning som angår utvalget gjennomsnitt, og for å finne gjennomsnittet av en liste over data, legger vi til alle dataene og deler med det totale antallet av verdier.
En illustrasjon med et eksempel
Anta et øyeblikk at vi kjenner mener av et datasett er 25 og at verdiene i dette settet er 20, 10, 50 og ett ukjent tall. Formelen for et eksempelmiddel gir oss ligningen
(20 + 10 + 50 + x) / 4 = 25, hvor x betegner det ukjente ved å bruke noen grunnleggende algebra, kan man da bestemme at det manglende tallet, x, er lik 20.La oss endre dette scenariet litt. Igjen antar vi at vi vet gjennomsnittet av et datasett er 25. Denne gangen er imidlertid verdiene i datasettet 20, 10 og to ukjente verdier. Disse ukjente kan være forskjellige, så vi bruker to forskjellige variabler, x, og y, å betegne dette. Den resulterende ligningen er (20 + 10 + x + y) / 4 = 25. Med litt algebra skaffer vi oss y = 70- x. Formelen er skrevet i denne formen for å vise at når vi først velger en verdi for x, verdien for y er helt bestemt. Vi har et valg å ta, og dette viser at det er et grad av frihet.
Nå skal vi se på en prøvestørrelse på hundre. Hvis vi vet at gjennomsnittet av disse eksempeldataene er 20, men ikke vet verdiene til noen av dataene, er det 99 frihetsgrader. Alle verdier må legge til totalt 20 x 100 = 2000. Når vi har verdiene til 99 elementer i datasettet, er den siste bestemt.
Student t-poengsum og Chi-Square Distribusjon
Grad av frihet spiller en viktig rolle når du bruker Student t-score tabell. Det er faktisk flere t-stillingen distribusjoner. Vi skiller mellom disse fordelingene ved bruk av frihetsgrader.
Her sannsynlighetsfordeling som vi bruker avhenger av størrelsen på prøven vår. Hvis vårt utvalg er n, da er antall frihetsgrader n-1. For eksempel vil en prøvestørrelse på 22 kreve at vi bruker raden til t-score tabell med 21 frihetsgrader.
Bruken av a chi-square distribusjon krever også bruk av grader av frihet. Her på en identisk måte som med t-stillingen distribusjon bestemmer prøvestørrelsen hvilken distribusjon som skal brukes. Hvis prøvestørrelsen er n, så er det n-1 grader av frihet.
Standardavvik og avanserte teknikker
Et annet sted hvor frihetsgrader dukker opp er i formelen for standardavviket. Denne forekomsten er ikke så åpen, men vi kan se den hvis vi vet hvor vi skal se. Til finne et standardavvik vi leter etter det "gjennomsnittlige" avviket fra gjennomsnittet. Etter å ha trukket fra gjennomsnittet fra hver dataverdi og kvadratet forskjellene, ender vi imidlertid med n-1 heller enn n som vi kan forvente.
Tilstedeværelsen av n-1 kommer fra antall frihetsgrader. Siden n dataverdier og prøveverdien brukes i formelen n-1 grader av frihet.
Mer avanserte statistiske teknikker bruker mer kompliserte måter å telle frihetsgrader på. Ved beregning av teststatistikken for to midler med uavhengige prøver av n1 og n2 elementer, har antall frihetsgrader en ganske komplisert formel. Det kan estimeres ved å bruke den mindre av n1-1 og n2-1
Et annet eksempel på en annen måte å telle frihetsgrader kommer med en F test. Ved gjennomføring av en F test vi har k prøver hver av størrelsen n—Graden av frihet i telleren er k-1 og i nevneren er k(n-1).