Nozioni di statistica

Un articolo sulle nozioni fondamentali di statistica
Share on FacebookTweet about this on TwitterShare on Google+Share on LinkedInEmail this to someonePrint this page

INDICI DI DIMENSIONE

Gli indici di dimensione forniscono l’espressione sintetica di un fenomeno quando questi è rappresentato da un certo numero di osservazioni quantitative. In altre parole essi permettono di sostituire un unico significativo valore ad una serie di dati statistici.

Gli indici di dimensione sono numerosi e ciascuno può essere utilizzato per applicazioni particolari. Daremo una breve descrizione dei principali:

1) Media aritmetica

2) Media geometrica

3) Media armonica

4) Medie ponderate

5) Media quadratica

6) Mediana

7) Moda

1) La media aritmetica

E’ sicuramente l’indice più utilizzato e si ottiene sommando i dati e dividendo la somma ottenuta per il numero di osservazioni.

M   =   (x1 + x2 + . + xn) / n   =   i=1n xi / n

Esempio: 7, 8, 12, 15, 18   Ma = 60 / 5 = 12

Un grosso difetto di questa media, di cui spesso ci dimentichiamo quando la usiamo, è che diventa poco significativa quando ci sono valori eccezionali, cioè valori fortemente diversi dagli altri della distribuzione.

Esempio: 7, 8, 12, 15, 276   Ma = 318 / 5 = 63,6

2) La media geometrica

E’ la radice ennesima del prodotto di n termini.

Mg   =   n√(x1 * x2 * . * xn)   =   ni=1n xi

Esempio: 7, 8, 12, 15, 18   Mg = 5√181.440 = 11,265399757109.

La media geometrica è utilizzata quando le osservazioni raccolte sono in progressione geometrica, anche approssimata, come succede spesso nei fenomeni economici.

3) La media armonica

Si ottiene calcolando il reciproco della media aritmetica dei reciproci dei dati. Ricordiamo che il reciproco di un numero x1 è 1/x1, per esempio il reciproco di 2 è 0,5 (= 1/2).

Ma   =   1 / [(1/x1 + 1/x2 + . + 1/xn) / n]   =   n / i=1n 1/xi

Esempio: 7, 8, 12, 15, 18 Ma = 5 / 0,473412698412698… = 10,56160938809723386…

Questa media è usata quando il fenomeno da indagare è misurato dai reciproci dei dati statistici rilevati.

4) Le medie ponderate

Tutte le medie viste sopra sono medie semplici. Possono trasformarsi in medie ponderate quando i valori osservati sono utilizzati più volte nel calcolo dell’indice, a seconda del peso (importanza) che viene loro attribuito.

Per esempio la media aritmetica diventa:   M   =   i=1n (xi * pi) / i=1n pi

Esempio:

xi (dato statistico) 7 6 12 15 18
pi (peso) 3 2 1 1 2

M = (7*3)+(6*2)+(12*1)+(15*1)+(18*2) / 9 = 96 / 9 = 10,6666666…

5) La media quadratica

E’ l’indice che in statistica ha maggiori possibilità d’utilizzo. E’ dato dalla radice quadrata della media aritmetica dei quadrati dei valori.

Mq   =   2√[(x12 + x22 + . + xn2) / n]   =   2√[(i=1n xi2) / n]

Esempio: 7, 8, 12, 15, 18   Mq = 2√806 / 5 = 12,69645619848.

In particolare la media quadratica ha in statistica diversi utilizzi legati al calcolo della dispersione (vedi sotto) ed alla correzione degli errori.

6) La mediana

La mediana è il valore centrale di una successione numerica disposta in ordine crescente.

Esempio: 7, 8, 12, 15, 18   Mediana = 12 (terzo numero di una successione di cinque numeri)

Precisazioni:

  1. i valori che eventualmente si ripetono vanno ignorati (p. es. se i valori osservati sono7, 8, 8, 12, 15, 15, 15, 18, i numeri 8 e 15 vanno considerati una sola volta)
  2. se la successione è costituita da un numero dispari di termini la mediana è l’unicovalore centrale
  3. se la successione è costituita da un numero pari di termini la mediana è la mediaaritmetica dei due termini centrali (p.es. se i valori osservati sono 7, 8, 12, 15, 18, 22,la mediana è (12+15) / 2 = 13,5

La mediana è un indice che può essere espressivo del fenomeno quando i dati statistici rilevati sono caratterizzati da scarsa variabilità.

7) La moda

La moda è il valore che, in un insieme di dati, si presenta più frequentemente.

Esempio: 7, 8, 8, 12, 15, 15, 15, 18   Moda = 15 (è il termine più frequente, perché si ripete 3 volte)

La moda è significativa quando si vuole conoscere la grandezza prevalente di una distribuzione statistica.

INDICI DI DISPERSIONE

Così come gli indici di dimensione danno un’espressione sintetica del fenomeno osservato, gli indici di dispersione danno una misura della sua variabilità, cioè della più o meno lontananza dei dati statistici dal loro valore medio. Entrambi gli indici sono perciò essenziali per una migliore conoscenza dell’evento da indagare.

Andiamo ad analizzare gli indici di dispersione più significativi:

1) Campo di variazione

2) Scarto semplice medio

3) Scarto quadratico medio

4) Scostamento probabile

5) Indici di variabilità relativa

6) Varianza

7) Scarto quadratico medio

1) Il campo di variazione

E’ l’indice più semplice. Si ottiene come differenza tra il valore massimo e quello minimo manifestati dal fenomeno in osservazione.

Campo di variazione   =   (xn – x1)   (dopo aver messo in ordine crescente i termini xi)

Esempio: 7, 8, 12, 15, 18   Campo di variazione = 18 – 7 = 11

2) Lo scarto semplice medio

E’ la media aritmetica degli scostamenti in valore assoluto (cioè senza segno) dei dati dal valore medio.

S.s.m.= [│x1 – M│ + │x2 – M│ + . + │xn – M│]/n = (i=1n │xi – M│)/n

Esempio: 7, 8, 12, 15, 18   S.s.m. = 5+4+0+3+6 = 18 / 5 = 3,6

3) Lo scostamento probabile

E’ semplicemente la mediana degli scostamenti in valore assoluto dalla media aritmetica.

Esempio: 7, 8, 12, 15, 18 (scostamenti in ordine crescente 0 3 4 5 6)   Scostamento probabile = 4

4) Gli indici di variabilità relativa

Tutti gli indici di variabilità visti sopra sono in termini assoluti, cioè sono espressi nella stessa unità di misura dei dati statistici originari dai quali sono tratti. E’ interessante però avere anche degli indici di dispersione relativi, cioè in forma di percentuale.

Per ottenere questi indici in forma relativa è sufficiente mettere a rapporto gli indici assoluti con la media aritmetica.

S.s.m. relativo   =   [(i=1n │xi – M│) / n] / M

Esempio: 7, 8, 12, 15, 18   S.s.m. relativo = 3,6 / 12 = 0,3 (in percentuale 30%)

5) La varianza

Quest’indice di dispersione ed il successivo (S.q.m.) sono quelli che hanno maggiori applicazioni in statistica. La varianza è la media aritmetica dei quadrati degli scostamenti dei dati rilevati dalla media aritmetica.

Varianza   =   [(x1 – M)2 + (x2 – M)2 + . + (xn – M)2] / n   =   [i=1n (xi – M)2] / n

Esempio: 7, 8, 12, 15, 18   Varianza = (52+42+02+32+62) / 5 = 17,2

6) Lo scarto quadratico medio

Lo scarto quadratico medio non è altro che la radice quadrata della varianza.

S.q.m.= 2√{[(x1 – M)2 + (x2 – M)2 + . + (xn – M)2] / n} = 2√{[i=1n (xi – M)2] / n}

Esempio: 7, 8, 12, 15, 18   S.q.m. = 2√[(52+42+02+32+62) / 5] = 4,1472882706655.

Tags:

Autore: Steve Round

Condividi questo articolo su

Invia commento

Il tuo indirizzo email non sarà pubblicato.