Statistica multivariata e cluster analisys applicata alla gestione dei dati archeologici

Una tesi di laurea sulla statistica multivariata e cluster analisys applicata alla gestione dei dati archeologici

Classificazione automatica

Lo scopo dei diversi metodi di Classificazione Automatica dei dati è di trasformare un numeroso complesso di unità di rilevazione in una serie coerente di informazioni restituite sotto forma di classi o gruppi.

Attraverso tale classificazione si tende a sintetizzare le caratteristiche primarie di ciascun raggruppamento ed è anche possibile stabilire una tipologia all’interno del campione preso in esame. Nel linguaggio specialistico le classi a cui le entità vengono assegnate sono definite Cluster. Nell’ ambito delle diverse procedure esistenti per la realizzazione di una classificazione automatica, le tecniche di classificazione gerarchica hanno trovato un ampio riscontro e risultano le più utilizzate. All’interno di tali tecniche esistono numerosi metodi, tra questi si possono citare:

  • Metodo Agglomerativo: costruzione ascendente delle gerarchie arrow_join. Si procede attraverso una serie di successive fusioni dei singoli individui in gruppi sempre più ampi, finchè tutti risultano inseriti in un unico gruppo.Se consideriamo, ad esempio, di voler creare una tipologia all’interno di un ampio gruppo di oggetti ceramici possiamo riunire, sulla base dell’osservazione e del rilievo degli elementi che li caratterizzano (decorazione, dimensione,…), i due oggetti tra loro più simili. Si vengono a creare in questo modo uno o più paia di oggetti e procedendo con l’analisi di tutti gli oggetti si ottengono un numero di classi ( Tipi ) omogenee tra di loro e distinte le une dalle altre.
  • Metodo Diviso: costruzione discendente delle gerarchie arrow_divide. Si suddivide il complesso in sottoinsiemi sempre più ristretti finchè si giunge ad ottenere i singoli individui. Più semplicemente si effettua una suddivisione dell’intero complesso in due gruppi differenziati fra loro in base alla presenza o meno di una variabile che viene definita fondamentale ai fini della distinzione tipologica.Ognuno di questi due gruppi può essere ulteriormente suddiviso, sempre in base all’attestazione o meno di una variabile che risulti diagnostica ai fini della classificazione, in modo tale che per ogni tappa successiva del procedimento si conosca la variabile responsabile della dicotomia.

Mentre i metodi divisi appaiono più adatti all’esame di oggetti descritti da un numero ridotto di variabili in cui le modalità che indicano la presenza o l’assenza di un elemento devono avere lo stesso peso all’interno del collettivo , i metodi agglomerativi si dimostrano, invece, più utili perchè permettono di creare raggruppamenti di individui tra loro simili e di indicarne una possibile tipologia; quest’ultima basata sull’analisi globale delle variabili che più significativamente contribuiscono alla distinzione delle classi ottenute.

La restituzione grafica di questi metodi avviene mediante il Dendrogramma ( tipologia ad albero ), tale grafico illustra le fusioni o le suddivisioni che sono state effettuate ad ogni stadio successivo dell’analisi, visualizzandone i diversi raggruppamenti. Va evidenziato che i “rami” di questo albero gerarchico non rappresentano una discendenza di tipo genetico, bensì una simiglianza tra i diversi individui o le diverse classi.

Autore: Gero Marsala

Condividi questo articolo su

1 Commento

Invia commento

Il tuo indirizzo email non sarà pubblicato.