Falda alluvionale nell’Alta valle del Tevere

Una tesi di laurea sulla ricostruzione tramite GIS della superficie piezometrica della falda alluvionale nell’Alta valle del Tevere

Analisi dei livelli di falda con approccio stocastico

Ricostruzione tramite GIS della superficie piezometrica della falda alluvionale nell’Alta valle del Tevere

6. Analisi dei livelli di falda con approccio stocastico

6.1 Introduzione alla statistica univariata

La rappresentazione quantitativa di fenomeni naturali richiede spesso un approccio sperimentale dato che generalmente la complessità di un evento viene espressa tramite una piccola quantità di dati. L’analisi statistica, sia grafica che numerica, diviene fondamentale ogni qualvolta che da un set di dati misurati (i campioni), si ha la necessità di avere indicazioni sul comportamento della popolazione. L’analisi statistica in generale va quindi considerata come un’analisi esplorativa per la miglior conoscenza del fenomeno fisico da cui provengono i dati che si stanno trattando.

Alla base di tutte le teorie statistiche, si trova il concetto di variabile. Una variabile è un’entità quantificabile che può assumere un qualsiasi valore numerico a partire da un determinato insieme. Molti fenomeni fisici, naturali e antropici hanno un intrinseca caratteristica casuale. Quando una variabile appartenente ad un dato insieme presenta questa caratteristica di casualità, viene definita variabile casuale o aleatoria

6.1.1 Distribuzione di frequenza

Molto spesso è utile classificare le grandi quantità di dati grezzi a disposizione (presi così come sono) in classi, e determinare il numero di individui che appartengono ad ogni specifica classe; tali classi vengono definite classi di frequenza. Una sistemazione dei dati in tabella per classi, insieme alle corrispondenti classi di frequenza è detta distribuzione di frequenza.

I passi da seguire per costruire una distribuzione di frequenza sono:

  1. Determinare il massimo e il minimo valore dei dati e quindi individuare il range statistico (dato dalla differenza tra il massimo e il minimo valore)
  2. Dividere il range in un giusto numero di intervalli di classi (di solito tra 5 e 20)
  3. Determinare il numero di valori che ricadono all’interno di ogni classe

6.1.2 Istogrammi

Un istogramma è un utile strumento grafico di sintesi statistica, che serve a rappresentare graficamente la distribuzione di frequenza. Si ottiene semplicemente plottando il numero dei valori in ogni intervallo di classe contro l’intervallo di classe stesso.

Ogni classe di frequenza è rappresentata da un rettangolo, la cui altezza è proporzionale alla corrispondente frequenza di classe (Figura 6.1).

figura61

Gli istogrammi però non forniscono tutte le informazioni necessarie per una buona analisi dei dati, sono necessarie infatti anche altre misure numeriche di sintesi che verranno qui brevemente descritte.

6.1.3 Quartile e percentile

Il quartile e il percentile individuano il valore corrispondente ad una data posizione relativa, per il dataset in esame

Dopo aver ordinato i dati in ordine crescente possiamo definire i quartili come quei valori che dividono in 4 parti tutto il set di dati e i percentili come quei valori che dividono il set di dati in 100 parti.

In particolare il 25° percentile corrisponde al 1° quartile, il 50° al 2° quartile e il 75° al 3°quartile.

6.1.4 Media, mediana e moda

Altri parametri rappresentativi di un set di dati sono le misure di tendenza centrale (tendono a cadere centralmente all’interno della distribuzione ordinata), quali media, mediana e moda. La centralità dipende quindi dalla forma della distribuzione.

  • La media rappresenta la media aritmetica del campione di dati
  • La mediana è il valore che divide in due parti uguali la distribuzione ordinata dei valori
  • La moda è il massimo della distribuzione di frequenza, individua cioè il valore più ricorrente di un dataset

Questi tre parametri coincidono tra loro per una distribuzione normale o gaussiana del dato (vedi Paragrafo 6.1.6).

6.1.5 Varianza e deviazione standard

Questi sono i valori che misurano in un dataset la dispersione dei valori rispetto alla media.

La deviazione standard è data da:

formula3

dove xi è il valore misurato, simbolo3 è la media dei valori ed n è il numero dei valori.

La varianza è data invece da simbolo4 , più precisamente da:

formula4

Questi due valori misurano quindi la deviazione dei valori dalla media. Valori elevati di deviazione standard, e quindi di varianza, indicano una notevole dispersione attorno alla media, viceversa valori bassi indicano bassa dispersione dei dati attorno alla media.

6.1.6 Distribuzione normale o standard

Dopo aver calcolato gli istogrammi, le medie e le varianze per i dati e dedotto la densità e la distribuzione per la popolazione, è spesso utile dedurre il modello per la distribuzione stessa. Il modello è praticamente la funzione matematica che descrive la curva di frequenza. Il modello più largamente usato è noto come modello di distribuzione normale o gaussiano, facilmente identificabile per la sua forma a campana (campana di Gauss). Per definire una distribuzione di Gauss sono necessari due parametri, la media e la varianza. Come è possibile vedere dalla Figura 6.2 circa due terzi dei valori, per questo tipo di distribuzione, sono compresi nell’intervallo simbolo5 . Questa è una caratteristica intrinseca della distribuzione normale, la quale prende il nome normale, proprio perché la maggior parte dei fenomeni ambientali (naturali) hanno distribuzioni di questo tipo.

figura62

Autore: Penco100

Condividi questo articolo su

Invia commento

Il tuo indirizzo email non sarà pubblicato.