Statistica: corso on line

Ecco il nostro corso on line gratuito di Statistica per principianti

Analisi bivariata - relazione tra 2 variabili (cardinali)

Passando alle variabili cardinali abbiamo i seguenti indici di relazione (correlazione), iniziando da quelli relativi al rapporto tra una variabile (X) nominale ed una (Y) cardinale.


I seguenti temi riguardano la correlazione tra una variabile nominale X ed una variabile Y cardinale.

 

Analisi delle varianza (Anova)

L’analisi della varianza (in breve: Anova) fornisce informazioni sulla relazione (correlazione) tra due variabili mediante lo studio della varianza di ciascuna di esse. Prima di passare agli indici veri e propri è però opportuno precisare alcune nozioni di base circa l’Anova..

Devianza totale = Devianza non spiegata + Devianza spiegata

con:

Devianza totale =

Devianza non spiegata =

Devianza spiegata =

quindi:

La Devianza non spiegata (o Interna) è la parte di Devianza totale non determinata dalla variabile nominale (essa è uguale a 0 se la relazione è perfetta).

La Devianza spiegata (o Esterna) è la parte di Devianza totale determinata dalla variabile nominale (essa è uguale a 0 se non c’è relazione).

I gradi di libertà (g.l.) sono i seguenti (k = numero di modalità della variabile nominale):

Devianza totale = (N – 1)

Devianza Interna o non spiegata = (N – k)

Devianza esterna o spiegata = (k – 1)

Pertanto:

g.l. totali = g.l. interni + g.l. esterni

e quindi:

N – 1 = (N – k) + (k – 1)

 

Rapporto F (tabulato)

con:

Stima esterna =

cioè:

Stima interna =

cioè:

quindi:

Se F calcolato è maggiore di F tabulato si respinge l’ipotesi nulla H0 e si accetta H1di esistenza di una relazione.

 

Rapporto di Correlazione (forza dell’Anova: Eta quadrato)

con:

Devianza spiegata =

Devianza totale =

quindi:

L’Eta quadrato varia da un minimo di 0 ad un max di 1 e si considera rilevante quando η2 > 0,10


Ecco ora metodi e indicatori nei casi in cui la correlazione da analizzare è tra 2 variabili cardinali.

Diagramma di Dispersione

Il diagramma di Dispersione è un classico grafico cartesiano in cui sopra gli assi sono riportati i valori assunti dalle variabili X e Y di cui si vuole analizzare la correlazione. Riportando le osservazioni delle 2 variabili si forma così un grafico a “nuvola”, formato da punti (ciascuno dei quali ottenuto dalla combinazione di due valori rilevati), la cui immagine fornisce una prima idea – visiva – circa la presenza o meno di una relazione tra Xe Y.

Di seguito un esempio di grafico a Dispersione (da Wikipedia).

Dal diagramma si possono ricavare 4 casi:

  1. relazione lineare positiva
  2. relazione lineare negativa
  3. nessuna relazione
  4. relazione non lineare (quando la relazione ha una forma diversa da quella lineare)

Coefficiente di Regressione

 

Cioè:

Trattasi delle retta di regressione (o interpolante) con il metodo dei minimi quadrati:

y =

dove:

b = Coefficiente di regressione

a =

Se si invertono le variabili x ed y si ottengono valori diversi di a e b.

 

Coefficiente di Correlazione di Pearson (forza della Correlazione)

 

Cioè:

Il coefficiente r varia da un min di -1 (relazione perfettamente negativa) ad un max di +1 (relazione perfettamente positiva), assumendo il valore 0 (zero) quando  non c’è nessuna relazione.

Si considera rilevante un valore di r > 0,30 (r2 > 10%).

E’ possibile anche costruire una “Matrice di Correlazione”, ovvero una matrice dei coefficienti di correlazione per tutte le coppie di variabili.

 

Coefficiente di Determinazione

r2 = quadrato di r (coefficiente di Pearson)

Non è altro che il quadrato del Coefficiente di Correlazion.

Rapport:

in particolare:

con b = Coefficiente di Regressione

r2 non misura la forza della correlazione, ma indica la parte di variazione della variabile dipendente y determinata dalla variazione della variabile indipendente x .

 

Autore: Steve Round

Condividi questo articolo su

Invia commento

Il tuo indirizzo email non sarà pubblicato.