Microsofts Excel er nyttig for å utføre grunnleggende beregninger i statistikk. Noen ganger er det nyttig å kjenne til alle funksjonene som er tilgjengelige for å jobbe med et bestemt emne. Her vil vi vurdere funksjonene i Excel som er relatert til Studentens t-distribusjon. I tillegg til å gjøre direkte beregninger med t-distribusjonen, kan Excel også beregne tillitsintervaller og utføre hypotetester.
Funksjoner angående T-distribusjon
Det er flere funksjoner i Excel som fungerer direkte med t-distribusjonen. Gitt en verdi langs t-fordelingen, returnerer følgende funksjoner alle andelen av fordelingen som er i den spesifiserte halen.
En andel i halen kan også tolkes som en sannsynlighet. Disse halesannsynlighetene kan brukes til p-verdier i hypotesetester.
- T.DIST-funksjonen returnerer den venstre halen av studentens t-distribusjon. Denne funksjonen kan også brukes til å skaffe y-verdi for et hvilket som helst punkt langs tetthetskurven.
- T.DIST.RT-funksjonen returnerer den høyre halen til studentens t-distribusjon.
- T.DIST.2T-funksjonen returnerer begge halene til studentens t-distribusjon.
Disse funksjonene har alle lignende argumenter. Disse argumentene er i rekkefølge:
- Verdien x, som angir hvor langs x akse vi er langs fordelingen
- Antall grader av frihet.
- T.DIST-funksjonen har et tredje argument, som lar oss velge mellom en kumulativ fordeling (ved å angi en 1) eller ikke (ved å legge inn en 0). Hvis vi oppgir en 1, vil denne funksjonen returnere en p-verdi. Hvis vi oppgir en 0, vil denne funksjonen returnere y-verdi av tetthetskurven for den gitte x.
Inverse funksjoner
Alle funksjonene T.DIST, T.DIST.RT og T.DIST.2T deler en felles egenskap. Vi ser hvordan alle disse funksjonene starter med en verdi langs t-fordelingen og deretter returnerer en andel. Det er anledninger når vi ønsker å snu denne prosessen. Vi starter med en andel og ønsker å vite verdien av t som tilsvarer denne andelen. I dette tilfellet bruker vi passende invers funksjon i utmerke.
- Funksjonen T.INV returnerer invers til venstre for studentens T-distribusjon.
- Funksjonen T.INV.2T returnerer de to halet inverse av Studentens T-distribusjon.
Det er to argumenter for hver av disse funksjonene. Den første er sannsynligheten eller andelen av fordelingen. Det andre er antall frihetsgrader for den spesielle distribusjonen som vi er nysgjerrige på.
Eksempel på T.INV
Vi vil se et eksempel på både T.INV- og T.INV.2T-funksjonene. Anta at vi jobber med en t-fordeling med 12 frihetsgrader. Hvis vi vil vite punktet langs fordelingen som utgjør 10% av området under kurven til venstre for dette punktet, legger vi = T.INV (0.1,12) inn i en tom celle. Excel returnerer verdien -1.356.
Hvis vi i stedet bruker T.INV.2T-funksjonen, ser vi at å legge inn = T.INV.2T (0.1,12) vil returnere verdien 1.782. Dette betyr at 10% av området under diagrammet for fordelingsfunksjonen er til venstre for -1,782 og til høyre for 1,782.
Generelt ved symmetri av t-fordelingen, for en sannsynlighet P og frihetsgrader d vi har T.INV.2T (P, d) = ABS (T.INV (P/2,d), der ABS er den absolutte verdien funksjon i Excel.
Tillitsintervaller
Et av temaene i inferensiell statistikk innebærer estimering av en populasjonsparameter. Dette estimatet har form av et konfidensintervall. For eksempel er estimatet av et populasjonsmiddel gjennomsnitt et utvalg. Anslaget har også en feilmargin, som Excel vil beregne. For denne feilmarginen må vi bruke CONFIDENCE.T-funksjonen.
Excel's dokumentasjon sier at funksjonen BEKREFT.T sies å returnere konfidensintervallet ved bruk av studentens t-distribusjon. Denne funksjonen returnerer feilmarginen. Argumentene for denne funksjonen er i den rekkefølgen de må legges inn:
- Alpha - dette er den nivå av betydning. Alpha er også 1 - C, der C betegner tillitsnivået. For eksempel, hvis vi ønsker 95% tillit, må vi legge inn 0,05 for alfa.
- Standardavvik - dette er prøve standardavvik fra vårt datasett.
- Prøvestørrelse.
Formelen som Excel bruker for denne beregningen er:
M = t*s/ √n
Her er M for margin, t* er den kritiske verdien som tilsvarer tillitsnivået, s er prøven standardavvik og n er prøvestørrelsen.
Eksempel på tillitsintervall
Anta at vi har en enkel tilfeldig prøve på 16 informasjonskapsler, og vi veier dem. Vi finner ut at deres gjennomsnittlige vekt er 3 gram med et standardavvik på 0,25 gram. Hva er 90% konfidensintervall for gjennomsnittsvekten til alle informasjonskapsler fra dette merket?
Her skriver vi ganske enkelt følgende i en tom celle:
= CONFIDENCE.T (0.1,0.25,16)
Excel returnerer 0.109565647. Dette er feilmarginen. Vi trekker fra og legger også til dette i gjennomsnittet vårt, og derfor er konfidensintervallet 2,89 gram til 3,11 gram.
Tester av betydning
Excel vil også utføre hypotetester som er relatert til t-distribusjonen. Funksjonen T.TEST returnerer p-verdien for flere forskjellige tester av betydning. Argumentene for T.TEST-funksjonen er:
- Array 1, som gir det første settet med eksempeldata.
- Array 2, som gir det andre settet med eksempeldata
- Haler, der vi kan angi enten 1 eller 2.
- Type - 1 betegner en parret t-test, 2 en to-prøvetest med samme populasjonsvarians, og 3 en to-prøvetest med forskjellige populasjonsvarianser.