I byggingen av en histogram, det er flere trinn som vi må påta oss før vi faktisk tegner grafen vår. Etter å ha satt opp klasser som vi vil bruke, tildeler vi hver av våre dataverdier til en av disse klassene og teller deretter antall dataverdier som faller inn i hver klasse og tegner høydene på søylene. Disse høydene kan bestemmes på to forskjellige måter som henger sammen: frekvens eller relativ frekvens.
Frekvensen til en klasse er tellingen av hvor mange dataverdier som faller i en viss klasse der klasser med større frekvenser har høyere bjelker og klasser med mindre frekvenser har lavere bjelker. På den annen side krever relativ frekvens ett ekstra trinn, da det er målet for hvilken andel eller prosent av dataverdiene som faller i en bestemt klasse.
En enkel beregning bestemmer den relative frekvensen fra frekvensen ved å legge sammen alle klassens frekvenser og dele tellingen med hver klasse med summen av disse frekvensene.
Forskjellen mellom frekvens og relativ frekvens
For å se forskjellen mellom frekvens og relativ frekvens vil vi vurdere følgende eksempel. Anta at vi ser på historiekarakterene til elever i 10. klasse og har klassene som tilsvarer bokstavkarakterene: A, B, C, D, F. Antallet av hver av disse karakterene gir oss en frekvens for hver klasse:
- 7 elever med en F
- 9 studenter med en D
- 18 studenter med C
- 12 studenter med en B
- 4 studenter med en A
For å bestemme den relative frekvensen for hver klasse legger vi først til det totale antall datapunkter: 7 + 9 + 18 + 12 + 4 = 50. Neste vi, deler hver frekvens med denne summen 50.
- 0,14 = 14% studenter med en F
- 0,18 = 18% studenter med en D
- 0,36 = 36% studenter med en C
- 0,24 = 24% studenter med en B
- 0,08 = 8% studenter med A
De opprinnelige dataene ovenfor med antall elever som faller inn i hver klasse (bokstavkarakter) ville være som indikerer frekvensen mens prosentandelen i det andre datasettet representerer den relative frekvensen av disse karakterene.
En enkel måte å definere forskjellen mellom frekvens og relativ frekvens er at frekvensen er avhengig av de faktiske verdiene for hver klasse i et statistisk datasett mens relativ frekvens sammenligner disse individuelle verdiene med de totale totallene for alle berørte klasser i en data sett.
histogrammer
Enten frekvenser eller relative frekvenser kan brukes til et histogram. Selv om tallene langs den vertikale aksen vil være forskjellige, vil histogrammets generelle form forbli uendret. Dette er fordi høydene i forhold til hverandre er de samme enten vi bruker frekvenser eller relative frekvenser.
Relative frekvenshistogrammer er viktige fordi høydene kan tolkes som sannsynligheter. Disse sannsynlighetshistogrammer gir en grafisk visning av a sannsynlighetsfordeling, som kan brukes til å bestemme sannsynligheten for at visse resultater skal skje innenfor en gitt populasjon.
Histogrammer er nyttige verktøy for raskt å observere trender i populasjoner for statistikere, lovgivere og samfunnsarrangører for å kunne bestemme det beste handlingsforløpet for å påvirke flest mennesker i en gitt befolkning.