Analisi bivariata - relazione tra 2 variabili (cardinali)
Indice
Passando alle variabili cardinali abbiamo i seguenti indici di relazione (correlazione), iniziando da quelli relativi al rapporto tra una variabile (X) nominale ed una (Y) cardinale.
I seguenti temi riguardano la correlazione tra una variabile nominale X ed una variabile Y cardinale.
Analisi delle varianza (Anova)
L’analisi della varianza (in breve: Anova) fornisce informazioni sulla relazione (correlazione) tra due variabili mediante lo studio della varianza di ciascuna di esse. Prima di passare agli indici veri e propri è però opportuno precisare alcune nozioni di base circa l’Anova..
Devianza totale = Devianza non spiegata + Devianza spiegata
con:
Devianza totale = ![]()
Devianza non spiegata = ![]()
Devianza spiegata = ![]()
quindi:
![]()
La Devianza non spiegata (o Interna) è la parte di Devianza totale non determinata dalla variabile nominale (essa è uguale a 0 se la relazione è perfetta).
La Devianza spiegata (o Esterna) è la parte di Devianza totale determinata dalla variabile nominale (essa è uguale a 0 se non c’è relazione).
I gradi di libertà (g.l.) sono i seguenti (k = numero di modalità della variabile nominale):
Devianza totale = (N – 1)
Devianza Interna o non spiegata = (N – k)
Devianza esterna o spiegata = (k – 1)
Pertanto:
g.l. totali = g.l. interni + g.l. esterni
e quindi:
N – 1 = (N – k) + (k – 1)
Rapporto F (tabulato)
con:
Stima esterna = 
cioè: ![]()
Stima interna = 
cioè: ![]()
quindi:

Se F calcolato è maggiore di F tabulato si respinge l’ipotesi nulla H0 e si accetta H1di esistenza di una relazione.
Rapporto di Correlazione (forza dell’Anova: Eta quadrato)
![]()
con:
Devianza spiegata = ![]()
Devianza totale = ![]()
quindi:

L’Eta quadrato varia da un minimo di 0 ad un max di 1 e si considera rilevante quando η2 > 0,10
Ecco ora metodi e indicatori nei casi in cui la correlazione da analizzare è tra 2 variabili cardinali.
Diagramma di Dispersione
Il diagramma di Dispersione è un classico grafico cartesiano in cui sopra gli assi sono riportati i valori assunti dalle variabili X e Y di cui si vuole analizzare la correlazione. Riportando le osservazioni delle 2 variabili si forma così un grafico a “nuvola”, formato da punti (ciascuno dei quali ottenuto dalla combinazione di due valori rilevati), la cui immagine fornisce una prima idea – visiva – circa la presenza o meno di una relazione tra Xe Y.
Di seguito un esempio di grafico a Dispersione (da Wikipedia).

Dal diagramma si possono ricavare 4 casi:
- relazione lineare positiva
- relazione lineare negativa
- nessuna relazione
- relazione non lineare (quando la relazione ha una forma diversa da quella lineare)
Coefficiente di Regressione

Cioè: ![]()
Trattasi delle retta di regressione (o interpolante) con il metodo dei minimi quadrati:
y = ![]()
dove:
b = Coefficiente di regressione
a = ![]()
Se si invertono le variabili x ed y si ottengono valori diversi di a e b.
Coefficiente di Correlazione di Pearson (forza della Correlazione)

Cioè: ![]()
Il coefficiente r varia da un min di -1 (relazione perfettamente negativa) ad un max di +1 (relazione perfettamente positiva), assumendo il valore 0 (zero) quando non c’è nessuna relazione.
Si considera rilevante un valore di r > 0,30 (r2 > 10%).
E’ possibile anche costruire una “Matrice di Correlazione”, ovvero una matrice dei coefficienti di correlazione per tutte le coppie di variabili.
Coefficiente di Determinazione
r2 = quadrato di r (coefficiente di Pearson)
Non è altro che il quadrato del Coefficiente di Correlazione.
Rapporto: ![]()
in particolare: ![]()
con b = Coefficiente di Regressione
r2 non misura la forza della correlazione, ma indica la parte di variazione della variabile dipendente y determinata dalla variazione della variabile indipendente x .


0 commenti