En introduksjon til Akaikes informasjonskriterium (AIC)

De Akaike informasjonskriterium (ofte referert til bare som AIC) er en kriterium for valg av nestede statistiske eller økonometriske modeller. AIC er i hovedsak et estimert mål på kvaliteten til hver av de tilgjengelige økonometriske modellene da de forholder seg til hverandre for et visst datasett, noe som gjør det til en ideell metode for modellvalg.

Bruke AIC for statistisk og økonometrisk modellvalg

Akaike informasjonskriterium (AIC) ble utviklet med et fundament i informasjonsteori. Informasjonsteori er en gren av anvendt matematikk angående kvantifisering (prosessen med å telle og måle) av informasjon. Ved å bruke AIC til å forsøke å måle den relative kvaliteten på økonometriske modeller for et gitt datasett, gir AIC forskeren et estimat av informasjonen som ville gå tapt hvis en bestemt modell skulle brukes for å vise prosessen som produserte data. Som sådan jobber AIC for å balansere avveiningene mellom kompleksiteten til en gitt modell og dens godhet med passform, som er det statistiske uttrykket for å beskrive hvor godt modellen "passer" til dataene eller settet med observasjoner.

instagram viewer

Hva AIC ikke vil gjøre

På grunn av hva Akaike informasjonskriterium (AIC) kan gjøre med et sett med statistiske og økonometriske modeller og et gitt datasett, er det et nyttig verktøy i modellvalg. Men selv som et modellvalgverktøy har AIC sine begrensninger. For eksempel kan AIC bare gi en relativ test av modellkvalitet. Det vil si at AIC ikke og ikke kan gi en test av en modell som resulterer i informasjon om modellens kvalitet i absolutt forstand. Så hvis hver av de testede statistiske modellene er like utilfredsstillende eller dårlig egnet for dataene, ville AIC ikke gi noen indikasjon fra begynnelsen.

AIC i økonometriske vilkår

AIC er et nummer tilknyttet hver modell:

AIC = ln (sm2) + 2m / T

Hvor m er antall parametere i modellen, og sm2 (i et AR (m) -eksempel) er den estimerte restvariansen: sm2 = (summen av kvadratet rest for modell m) / T. Det er gjennomsnittlig kvadratrest for modellen m.

Kriteriet kan minimeres over valg av m å danne en avveining mellom passformen til modellen (som senker summen av kvadratet) rest) og modellens kompleksitet, som måles med m. Dermed kan en AR (m) -modell kontra en AR (m + 1) sammenlignes med dette kriteriet for en gitt batch med data.

En ekvivalent formulering er denne: AIC = T ln (RSS) + 2K hvor K er antall regressorer, T antall observasjoner, og RSS den resterende summen av kvadrater; minimere over K for å velge K.

Som sådan ga et sett med økonometri modeller, den foretrukne modellen i forhold til relativ kvalitet vil være modellen med minimum AIC-verdi.

instagram story viewer