Statistica: corso on line

Ecco il nostro corso on line gratuito di Statistica per principianti

Indici di variabilità o dispersione

In genere si riassumono le osservazioni di un fenomeno facendo la loro media (in particolare quella aritmetica). Tuttavia pochi sanno che la media, da sola, è poco espressiva del fenomeno, perché in due popolazioni rilevate, a parità di media, possono corrispondere osservazioni completamente diverse, come distanza dalla media stessa. In questi casi, pur in presenza della stessa media, la popolazione che ha osservazioni più distanti è scarsamente rappresentabile dalla sola media, come indice sintetico di dimensione.

Esemplificando, una popolazione composta da due sole grandezze, 4 e 6, ha media aritmetica 5, ma anche una popolazione composta da 1 e 9 ha media 5. Tuttavia mentre la media 5 costituisce una discreta approssimazione di 4 e 6, essa non rappresenta allo stesso modo le grandezze 1 e 9, perché queste sono eccessivamente lontane dalla loro media.

Sarebbe quindi sempre opportuno, in tutte le rilevazioni, accompagnare la media da un altro indice, detto di variabilità, che esprime appunto quanto il fenomeno è variabile rispetto alla media, così da dare maggiori informazioni a chi intende leggere le caratteristiche dell’intera popolazione partendo dalla sua rappresentazione sintetica.

 

In altre parole se rappresentiamo un fenomeno, oltre che dalla sua media, anche dalla misura della sua variabilità, mitighiamo il difetto comunicativo insito nella media del “pollo di Trilussa”, il quale sosteneva – giustamente – che la statistica per cui un italiano mangia un pollo ogni anno è formata da chi ne mangia due e da chi non ne mangia nessuno!

Anche per gli indici di variabilità vale la distinzione tra variabili nominali, ordinali e cardinali, essendo diversi, per ciascun tipo di variabile, gli indici che ne rappresentano il grado di dispersione.


Per le variabili nominali abbiamo i seguenti indici di variabilità o di dispersione.

Indice di omogeneità

pi = proporzioni relativizzate ad 1

k = numero di modalità della variabile

La statistica in questione varia da un minimo di 1/k ad un max di 1

 

Indice di eterogeneità

O = indice di omogeneità

Non è altro che il complemento ad 1 dell’indice O

 

Indice di omogeneità relativa

O = indice di omogeneità

k = numero di modalità della variabile

La statistica in questione varia da un minimo di 0 ad un max di 1

 

Indice di eterogeneità relativa

Orel = indice di omogeneità relativa

E = indice di eterogeneità

Non è altro che il complemento ad 1 di Orel


Per le variabili ordinali abbiamo il seguente indice di variabilità o di dispersione.

Differenza interquartile

Si faccia riferimento alla pagina di questo Corso dedicata agli indici di dimensione ed in particolare ai “Quantili” nella loro versione di “Quartili”.


Ma veniamo adesso agli indicatori di variabilità più importanti, quelli cioè riguardanti le variabili cardinali, che ritroveremo spesso nelle pagine seguenti del nostro Corso di Statistica.

Campo di variazione

Il valore di ω altro non è che la mera differenza tra il valore più grande e quello più piccolo rilevati. Formula quindi molto semplice ma scarsamente utilizzata.

 

Scarto Semplice Medio

N = numero dei casi osservati

La formula indicata può essere descritta in questo modo: la media (perché c’è il diviso N) della somma degli scarti di ciascun valore osservato dalla media del fenomeno in valore assoluto (cioè senza considerare il segno dei valori). È importante calcolare gli scarti delle osservazioni dalla loro media in valore assoluto (espresso questo dai segni verticali che rappresentano l’operatore “modulo”), anziché in modo algebrico, perché se si considerassero i segni la somma degli scarti sarebbe sempre zero, per una caratteristica della media aritmetica.

 

Devianza

È la somma dei quadrati degli scarti tra i valori osservati e la loro media. Trattasi di una grandezza grezza e come tale poco usata come indice di variabilità, ma importante perché rappresenta il numeratore dell’indice più utilizzato di tutti: la varianza, appresso illustrata insieme alle misure da questa derivate.

 

Varianza

Eccola qui la misura più importante di variabilità. La varianza è la media della somma dei quadrati degli scarti tra i valori osservati e la loro media. Trattasi anche del rapporto tra devianza e N (numero dei casi osservati). La incontreremo spesso nel nostro Corso di Statistica, insieme alla sua radice quadrata che prende il nome di Scarto Quadratico Medio (SQM) o, con linguaggio anglosassone, Deviazione Standard.

 

Scarto Quadratico Medio (SQM) o Deviazione Standard

La Deviazione Standard non è altro che la radice quadrata della Varianza.

 

Coefficiente di Variazione

Dividendo (o meglio “relativizzando”) la Deviazione Standard per la Media si possono fare confronti tra diversi fenomeni osservati.

In generale si può relativizzare qualsiasi indice di variabilità.

Autore: Steve Round

Condividi questo articolo su

Invia commento

Il tuo indirizzo email non sarà pubblicato.