Un tutorial sul variogramma amichevole per i Data Scientist per quantificare la continuità spaziale

A friendly variogram tutorial for Data Scientists to quantify spatial continuity.

Applicato su un Dataset Minerario Sintetico utilizzando il software open source GSLib e Python

Foto di Sebastian Pichler su Unsplash

Introduzione

I variogrammi vengono utilizzati per dimostrare la variabilità basata sulla distanza dei dati spaziali. Comprendere e modellare la continuità spaziale con i variogrammi è importante in quanto vengono utilizzati per stimare le misurazioni puntuali in blocchi pratici in una vasta gamma di applicazioni come la valutazione delle fasce di minerali, la concentrazione di petrolio o l’inquinamento ambientale.

Nonostante siano disponibili opzioni open source per generare variogrammi, a causa della loro complessità, la maggior parte degli utenti si affida a costosi pacchetti software che astraggono molti dei dettagli. Questo tutorial mira a fornire una breve introduzione ai variogrammi e a come utilizzare la libreria di geostatistica open source (GSLib), che può essere utilizzata in modo indipendente o con Python per sviluppare variogrammi.

In questo caso viene sviluppato un modello di variogramma su un dataset minerario sintetico, ma il flusso di lavoro potrebbe essere utilizzato per qualsiasi tipo di dati spaziali per applicazioni meteorologiche come la temperatura o applicazioni ambientali come il monitoraggio degli inquinanti.

Requisiti del Tutorial

Avere bisogno di GSLib, disponibile qui per il download gratuito e di alcune delle librerie Python più semplici e comunemente utilizzate che sono anche nel codice completo caricato su GitHub:

import pandas as pdimport numpy as npimport matplotlib.pyplot as plt

Concetti di Base del Variogramma

L’idea generale dei variogrammi è che i punti dati più distanti l’uno dall’altro sono più suscettibili di essere più distinti rispetto ai punti dati vicini l’uno all’altro. La varianza dei punti dati sempre più distanti raggiunge infine un punto in cui è uguale alla varianza globale dei dati.

Iniziamo con un dataset spaziale e possiamo generalizzare il flusso di lavoro di modellazione del variogramma in pochi passaggi come mostrato di seguito. Prima di tutto dobbiamo determinare i parametri di ricerca adeguati per il variogramma. Quindi identifichiamo gli assi di continuità principali e minori. Infine, i variogrammi possono essere modellati e successivamente utilizzati per scopi di stima o simulazione. Ogni passaggio sarà spiegato ulteriormente nelle sezioni seguenti…