Ikke alle data opprettes likt. Det er nyttig å klassifisere datasett etter forskjellige kriterier. Noen er det kvantitativ, og noen er det kvalitativ. Noen datasett er kontinuerlige og andre er diskrete.
En annen måte å skille data på er å klassifisere dem i fire nivåer av måling: nominell, ordinal, intervall og forhold. Ulike målingsnivåer krever forskjellige statistiske teknikker. Vi vil se på hvert av disse målingsnivåene.
Nominelt målingsnivå
Det nominelle målingsnivået er det laveste av de fire måtene å karakterisere data. Nominell betyr "bare i navn", og det skal hjelpe deg å huske hva dette nivået handler om. Nominelle data omhandler navn, kategorier eller etiketter.
Data på nominelt nivå er kvalitative. Øyefarger, ja eller nei svar på en undersøkelse, og favoritt frokostblanding handler om det nominelle målingsnivået. Til og med noen ting med tall tilknyttet dem, for eksempel et nummer på baksiden av en fotballtrøye, er nominelle siden det brukes til å "navngi" en individuell spiller på banen.
Data på dette nivået kan ikke bestilles på en meningsfull måte, og det gir ingen mening å beregne ting som midler og standardavvik.
Ordinært målingsnivå
Neste nivå kalles ordinalt målingsnivå. Data på dette nivået kan bestilles, men det kan ikke tas noen forskjeller mellom dataene som er meningsfylte.
Her bør du tenke på ting som en liste over de ti største byene å bo. Dataene, her ti byer, er rangert fra en til ti, men forskjellene mellom byene gir ikke mye mening. Det er ingen måte å se på bare rangeringene for å vite hvor mye bedre livet er i by nummer 1 enn by nummer 2.
Et annet eksempel på dette er bokstavkarakterer. Du kan bestille ting slik at A er høyere enn en B, men uten annen informasjon er det ingen måte å vite hvor mye bedre en A er fra en B.
Som med nominelt nivå, data på ordinalt nivå skal ikke brukes i beregninger.
Målingsnivå
Målingsnivået handler om data som kan bestilles, og hvor forskjeller mellom dataene gir mening. Data på dette nivået har ikke et utgangspunkt.
De Fahrenheit og Celsius skalaer temperaturer er begge eksempler på data på intervallmål. Du kan snakke om at 30 grader er 60 grader mindre enn 90 grader, så forskjeller gir mening. Imidlertid representerer ikke 0 grader (i begge skalaer) kaldt som det kan være det totale fraværet av temperatur.
Data på intervallnivået kan brukes i beregninger. Data på dette nivået mangler imidlertid ikke en type sammenligning. Selv om 3 x 30 = 90, er det ikke riktig å si at 90 grader Celsius er tre ganger så varmt som 30 grader Celsius.
Målingsnivå
Det fjerde og høyeste målingsnivået er forholdsnivået. Data på forholdsnivået har alle funksjonene i intervallnivået, i tillegg til en nullverdi. På grunn av tilstedeværelsen av en null, er det nå fornuftig å sammenligne forholdene til målinger. Setninger som "fire ganger" og "to ganger" er meningsfulle på forholdsnivået.
Avstander, i ethvert målesystem, gir oss data på forholdsnivået. En måling som 0 fot gir mening, siden den ikke representerer lengde. Videre er 2 fot dobbelt så lang som en fot. Så det kan dannes forholdstall mellom dataene.
I forholdet til målingsnivået kan ikke bare summer og forskjeller beregnes, men også forholdstall. Én måling kan deles med en hvilken som helst ikke-nullmåling, og et meningsfylt antall vil resultere.
Tenk før du beregner
Gitt en liste over personnummer, er det mulig å gjøre alle slags beregninger med seg, men ingen av disse beregningene gir noe meningsfylt. Hva er ett personnummer delt på et annet? Fullstendig bortkastet tid, siden personnummer er på det nominelle målingsnivået.
Tenk når du får noen data før du beregner. Målingsnivået du jobber med vil avgjøre hva det er fornuftig å gjøre.