Statistica multivariata e cluster analisys applicata alla gestione dei dati archeologici

Una tesi di laurea sulla statistica multivariata e cluster analisys applicata alla gestione dei dati archeologici

Analisi fattoriale

L’insieme delle tecniche che vanno sotto il nome di analisi fattoriale hanno lo scopo di sintetizzare e visualizzare il complesso delle informazioni analizzate. Tali tecniche risultano appropriate quando si affronta un problema di natura multidimensionale, cioè quando si ha la necessità di rappresentare sotto forma geometrica l’osservazione di tre o più misure.

Il procedimento tende alla trasformazione della serie di variabili in una nuova serie di fattori ortogonali, cioè indipendenti tra loro, che sono pari al numero delle variabili iniziali e sono delle combinazioni lineari tra esse.

I tre concetti fondamentali collegati alla comprensione di questi esami sono:

  • Lo “spazio” e la “distanza” : le unità prese in esame, nel nostro caso di natura archeologica, vengono considerate e rappresentate come punti in uno spazio e le loro rispettive distanze ne indicano l’associazione più o meno positiva.
  • Le “coordinate”, le quali permettono di ottenere, nello spazio, una rappresentazione grafica delle relazioni tra le diverse entità o tra le diverse variabili, dando la possibilità di evidenziarne alcuni raggruppamenti.
  • La “semplificazione”, perchè le tecniche di Analisi Fattoriale danno il risultato pratico di ridurre il numero di variabili iniziali, operazione questa di notevole importanza specie nei casi in cui il numero di variabili è abbastanza elevato.

Tra i metodi di Analisi Fattoriale si possono indicare in particolare l’Analisi dei Componenti Principali e l’Analisi delle Corrispondenze.

Queste due tecniche si differenziano tra loro per il tipo e per la struttura dei dati a cui esse vengono applicate. Mentre l’Analisi dei Componenti Principali è utilizzata generalmente dove le variabili di partenza da esaminare sono costituite da misure continue, l’Analisi delle Corrispondenze risulta invece adatta all’esame ed alla descrizione di variabili qualitative.

L’Analisi dei Componenti Principali

Se si vuole definire lo scopo di questa analisi si può dire che essa tende a riassumere i dati attraverso l’enucleazione di una serie di assi principali di riferimento. L’analisi (che opera su una matrice

costituita dai coefficienti di correlazione tra le variabili prese in esame) si propone di riassumere e quantizzare, qualora esista una stretta interrelazione, le eventuali associazioni.

L’Analisi delle Corrispondenze

A differenza dell’ Analisi dei Componenti Principali, questo tipo di analisi risulta un metodo di riduzione multidimensionale particolarmente adatto per l’esame e la descrizione di informazioni di tipo qualitativo, specie se si ha la necessità di analizzare un ampia matrice di dati. Inoltre data la possibilità di esaminare più variabili simultaneamente permette di evidenziarne le relazioni interne e di ricavare le principali componenti associative del fenomeno oggetto di studio.

Esistono due tipi di Analisi delle Corrispondenze: Semplice e Multipla. La prima analizza ampie matrici di dati costituite dall’incrocio di due variabili, la seconda permette invece un analisi di matrici a più variabili.

Dato l’enorme numero di calcoli da effettuare, è praticamente impossibile applicare i metodi di statistica multivariata manualmente, perciò l’impiego del computer e di un pacchetto informatico di gestione statistica dei dati risulta necessario al fine della nostra trattazione.

L’Analisi Discriminante

Un’altro tipo di analisi di statistica multivariata da applicare ai dati è quello Discriminante. L’obiettivo di questa analisi è molto diverso rispetto a quello perseguito dalle tecniche fin qui descritte, perchè, mentre quest’ultime tendono ad evidenziare alcuni raggruppamenti all’interno di un complesso di oggetti inizialmente privo di suddivisioni, nel caso dell’Analisi Discriminante invece, i gruppi di oggetti devono essere noti perchè il suo scopo è quello di rilevare le differenze esistenti tra gli oggetti relativi a ciascun gruppo.

L’uso di questa analisi risulta importante quando si vuol verificare, all’interno di una classificazione tipologica esistente, il ruolo svolto dalle diverse variabili ed il peso da esse avuto nella determinazione

dell’appartenenza degli oggetti ai vari gruppi. Inoltre permette, con un basso margine di errore, di stabilire l’appartenenza ad un determinato gruppo di oggetti che non risultano inseriti nei gruppi e che quindi richiedano ancora una classificazione.

Riportando questi concetti generali a problematiche più strettamente connesse con l’archeologia, si capisce che l’ Analisi Discriminante è adatta in situazioni in cui gli oggetti da esaminare, descritti mediante il medesimo complesso di variabili, siano precedentemente suddivisi in gruppi. Tale suddivisione può essere determinata, ad esempio, sulla base di diverse località o vari insediamenti, o sulla base degli aspetti funzionali e morfologici. In questa situazione può risultare utile, ai fini della ricerca, conoscere con quale peso e quali sono gli attributi che hanno contribuito alla discriminazione tra i diversi gruppi, ed inoltre se in presenza di nuovi oggetti, non contemplati nell’ambito della classificazione realizzata, si ha la possibilità di poterli assegnare a tali gruppi; l’Analisi Discriminante può effettuare queste operazioni, le quali risultano molto complesse nel caso in cui i gruppi di oggetti siano numerosi ed appaiano caratterizzati da un alto numero di variabili.

Autore: Gero Marsala

Condividi questo articolo su

1 Commento

Invia commento

Il tuo indirizzo email non sarà pubblicato.