Indici di valutazione del modello:

Come comprendere se un modello è valido

R2

Il coefficiente di determinazione (R quadro) è un indice che misura il legame tra la variabilità dei dati e la correttezza del modello statistico utilizzato. Esso è legato alla frazione della varianza non spiegata dal modello. Tale indice varia da 0 a 1, più si avvicina ad 1 più il modello riesce a spiegare i dati. Tale indice è solitamente utilizzato nei modelli di regressione lineare. R2 tende a sovrastimare la bontà del modello nel caso in cui il modello sia in overfitting, ovvero quando il modello a troppe variabili X. Per correggere tale problematica solitamente si fa riferimento ad una correzione di tale indice chiamato “R2 corretto” che penalizza i modelli eccessivamente complessi.

Esempio:

Il seguente esempio analizza la relazione, tramite un modello lineare, tra peso e altezza.
Modello lineare

Dal coefficiente di determinazione (R quadro) osserviamo come il modello si adatti correttamente ai dati. L’altezza può essere spiegata al 95,55% dal peso.

Pseudo R2

Tale indice rappresenta una sottostima del R2, viene utilizzato quando non è possibile calcolare R2. Anch’esso ha una versione corretta che penalizza i modelli eccessivamente complessi. Solitamente viene calcolato nei modelli logit e probit o nelle loro trasformazioni (multinomial, conditional, mixed, ecc.).

AIC

Il criterio d’informazione di Akaike, è un metodo per la valutazione e il confronto tra modelli statistici. Fornisce una misura della qualità della stima di un modello statistico tenendo conto sia della bontà di adattamento che della complessità del modello. È basato sul concetto di entropia come misura di informazione, tramite cui valuta la quantità di informazione persa quando un dato modello è usato per descrivere la realtà. La regola è quella di preferire i modelli con l’AIC più basso. È un criterio di valutazione molto utile perché permette di confrontare tra loro anche modelli non annidati.

BIC

Il criterio è simile all’AIC ed è utilizzato per la valutazione e il confronto tra modelli, ma a differenza dell’AIC penalizza maggiormente i modelli eccessivamente complessi.