Si utilizza quando i dati non hanno tutti la stessa importanza, ovvero vi sono dei pesi. Per pesi si intende un informazione aggiuntiva che modifica l’importanza. Ad esempio i voti all’università sono pesati dai CFU, un esame in cui abbiamo lo studente ha preso 30 ma vale 2 CFU e un esame in cui lo studente ha preso 20 che vale 10 CFU non fa in media 25 come nella media aritmetica non ponderata:
Campo di variazione (Range)
Indici di dispersione
Il campo di variazione, noto anche come range, è una delle misure di dispersione più semplici e immediate utilizzate in statistica per descrivere la variabilità di un insieme di dati. Esso rappresenta la differenza tra il valore massimo e il valore minimo all’interno di un campione o di una popolazione.
Scarto interquartile
Indice di dispersione
Lo scarto interquartile è un indice di dispersione utilizzato in statistica per descrivere la variabilità di un insieme di dati. A differenza del campo di variazione, lo scarto interquartile si concentra sulla parte centrale della distribuzione, ignorando i valori estremi, rendendolo una misura più affidabile.
MEDIANA
Cosa è la mediana?
La mediana, che indicheremo con il simbolo, è un indice di posizione delle medie lasche che rappresenta il valore centrale di una successione ordinata, in senso crescente o decrescente, di valori. In altre parole, è il valore tale per cui prima e dopo ci siano il 50% delle osservazioni.
Quando la si utilizza?
La mediana, a differenza della media o altri indici di posizione analitiche, può essere utilizzata sia per variabili qualitative ordinabili sia per variabili quantitative, mentre non può essere calcolata per variabili qualitative sconnesse. Inoltre, non si distorce in presenza di outlier a differenza degli indici di posizione analitiche (medie).
MEDIA QUADRATICA
Perché è utile?
La media quadratica fornisce una misura della dispersione dei dati rispetto alla media aritmetica. In particolare, essa indica quanto la deviazione dei singoli dati dalla media aritmetica è influenzata dalla loro grandezza. In altre parole, valori molto grandi o molto piccoli, essendo elevati al quadrato, avranno un’incidenza maggiore nella media quadratica rispetto ai valori intermedi. Questo la rende particolarmente utile in ambiti come la fisica o l’ingegneria, dove spesso si lavora con dati che possono assumere valori sia positivi che negativi. La media analitica di ordine 2 corrisponde alla media quadratica.
MEDIA GEOMETRICA
Quando si utilizza ?
La media geometrica si usa quando si ha a che fare con fenomeni in progressione (come l’aumento del peso di un bambino man mano che cresce), per variazioni relative osservate nel tempo (ad esempio in giorni, mesi…) ed è utile anche per calcolare le medie in situazioni in cui le fluttuazioni dei dati sono esponenziali. La media analitica di ordine 0 corrisponde alla media geometrica.
MEDIA ARMONICA
Cos’è e quando è necessario utilizzarla?
La media armonica di una successione di valori tutti diversi da 0. Corrisponde alla media analitica di ordine p = -1. La si utilizza quando si necessita di una media che ripartisca l’intensità globale del fenomeno, rispetto al tempo, allo spazio e così via. Ad esempio, viene spesso usata quando si ha a che fare con dei rapporti, per studiare grandezze inversamente proporzionali come tempo e velocità o prezzo di un bene e potere d’acquisto di una moneta.
MEDIA ARITMETICA
Com’è definita?
La media aritmetica è certamente quella più nota e utilizzata nella statistica. È la media analitica di ordine p = 1 e potremmo definirla come il valor medio di una successione di valori .
Come si calcola?
Calcolare la media aritmetica, solitamente indicata con μ o , equivale a sommare tutti i valori della distribuzione (xi) e poi dividerli per la numerosità del campione N:

Indici di posizione (medie)
Perché abbiamo bisogno di calcolare le medie? A cosa servono?
Le medie consentono di sintetizzare in un solo valore rappresentativo l’intera distribuzione di dati.
Esempio:
Ad esempio, se volessimo avere un’idea di quanto guadagnano gli impiegati di un’azienda con 20mila addetti, invece di riportare i singoli stipendi è molto più comodo ed efficace calcolarne la media, in modo da ottenere un unico valore che sintetizza lo stipendio di un addetto.
Le medie possono essere di due tipi:
- Analitiche
- Lasche
3 passi fondamentali per la preparazione dei dati
Chi ben comincia è già a metà dell’opera
Se hai raccolto i tuoi dati ricordati che la qualità dei dati è importantissima per la tua analisi.
Prima di eseguire qualsiasi test o modello è necessario:
- Effettuare le statistiche descrittive
- Controllare gli outlier
- Comprendere dalle statistiche descrittive se vi sono problemi, come ad esempio degli NA (dati mancanti).
Se tutti questi 3 passi sono stati eseguiti correttamente, avrai dei dati che, statisticamente parlando, sono buoni per la analisi e avrai un idea, grazie alle statistiche descrittive, di come sia composto il tuo campione. Da ciò potrai formulare ipotesi da testare con i modelli o test.
Leggi tutto “3 passi fondamentali per la preparazione dei dati”