Cos’è la devianza ?
In statistica, la devianza è una misura utilizzata per valutare la variabilità o la dispersione dei dati rispetto ad un valore di riferimento (solitamente la media). Tale indice è una misura di dispersione.
La devianza si calcola come la somma dei quadrati degli scarti di ciascun valore osservato rispetto alla media dei dati:
Con X che rappresenta ciascun valore osservato, che rappresenta la media dei valori ed n il numero di osservazioni.
Esempio
Per comprendere facilmente il significato della devianza prendiamo in considerazione cinque ragazzi con rispettive altezze di 170 cm, 160cm, 150cm, 180, 190 cm e andiamo a calcolare la devianza usando come valore di riferimento la media aritmetica (170cm in questo caso).
Successivamente vediamo quanto ogni altezza si discosti dalla media:
- Studente 1: 170 – 170 = 0;
- Studente 2: 160 – 170 = -10;
- Studente 3: 150 – 170 = -20;
- Studente 4: 180 – 170 = 10;
- Studente 5: 190 – 170 = 20.
Si ottengono così gli scarti, che vanno ora elevati al quadrato (0, 100, 400, 100, 400) e poi sommati tra di loro per ottenere una devianza di 1000.
Questo valore indica quindi quanto le altezze dei 5 studenti si discostino dalla media di 170 cm.
Una devianza alta, come in questo caso, indica che i dati sono molto dispersi attorno alla media ed hanno quindi alta variabilità. Al contrario una devianza bassa indica dati vicini alla media e scarsa variabilità
Può risultare utile specificare come la devianza sia 0 in caso di valori tutti uguali alla media.
La devianza risulta essere un indice instabile per via del suo aumentare con la numerosità del campione, viene spesso quindi “stabilizzata” andando a dividere per il numero di osservazioni n, azione che porta ad ottenere la varianza, che è infatti strettamente collegata alla devianza stessa.
Per via di questa sua instabilità la devianza viene raramente usata come indicatore, mentre viene spesso usata come indice propedeutico a calcoli ulteriori . Risulta essere inoltre fondamentale in concetti quali l’analisi della varianza e i modelli di regressione.
Articolo scritto in collaborazione con Samuele De Marzo