INGVvulcani

Il portale data.ingv.it per la condivisione dei dati dell’INGV

di Mario Locati, Salvatore Mazza, Placido Montalto, Vincenzo Romano, Valentino Lauciani, Roberto Vallone, Stefano Cacciaguerra, Giulia Dotta

Per un ente di ricerca, un importante patrimonio è certamente il personale che lavora giorno e notte, con la sua professionalità, esperienza ed entusiasmo. Un fattore di altrettanta ricchezza è costituito dai dati che i ricercatori, tecnologi e tecnici raccolgono, elaborano, conservano e mettono a disposizione del pubblico, esperto e non.

L’INGV rende liberamente disponibili e utilizzabili una grande quantità di dati scientifici attraverso i propri siti web, in continuo aggiornamento. Al fine di supportare al meglio la produzione dinamica di tale mole di dati e di permetterne la consultazione e un utilizzo più organico e semplice, nel novembre 2020 è stato inaugurato il portale dei dati aperti https://data.ingv.it (Figura 1).

Figura 1. Homepage del portale Open Data dell’INGV, https://data.ingv.it
Figura 1 – Homepage del portale Open Data dell’INGV, https://data.ingv.it

I dati dell’INGV consultabili dal portale

Il portale permette la facile fruizione dei dati da parte di diversi tipi di utenti appartenenti sia al mondo scientifico che alla comunità civile tutta.

Il portale è gestito dall’Ufficio Gestione Dati e mira a semplificare il reperimento di dati tramite un unico punto di accesso. data.ingv.it è il “metadata catalogue” istituzionale, ovvero lo strumento che ha il compito di elencare, descrivere e facilitare l’accessibilità ai dati indirizzando gli utenti verso i siti che li ospitano.

La mappatura dei dati pubblicati sin dall’istituzione dell’INGV nel 1999 è tuttora in corso (Figura 2) e si tratta di un’attività che accompagnerà le attività dei ricercatori per i prossimi anni.

Figura 2 – Andamento dell’inserimento di schede di metadati nel Registro Dati dal momento della sua istituzione.

La copertura geografica dei dati consultabili tramite il Registro Dati (Figura 3 ) riflette le attività di Ricerca condotte alll’INGV concentrandosi soprattutto sul territorio nazionale. Sono disponibili molti dati che coprono l’intero continente europeo, soprattutto relativamente all’area euro-mediterranea. Sono anche consultabili alcuni dataset a copertura globale, alle zone artiche e Antartiche oltre a piccole aree oggetto di indagini sparse in varie parti del globo.

Figura 3 – Copertura geografica (in rosso) dei singoli dataset consultabili da https://data.ingv.it. Alcuni dataset hanno una copertura mondiale, molti sono a scala europea, e la stragrande maggioranza sono riferiti al territorio nazionale o locale.

Le schede di metadati sono associate a uno o più Dipartimenti scientifici in cui è diviso l’INGV: Terremoti, Vulcani e Ambiente. Alla data odierna oltre la metà dei dati (54%) consultabili sul portale sono riconducibili al Dipartimento Terremoti, circa un terzo (32%) sono riconducibili al Dipartimento Ambiente e per circa il 8% sono riconducibili al Dipartimento Vulcani, seguono dati riconducibili a dati a cavallo tra più Dipartimenti (Figura 4).

Figura 4 – Distribuzione per Dipartimento Scientifico dei dati consultabili sul portale data.ingv.it

Vediamone in dettaglio alcuni esempi di dati consultabili:

La politica dei dati

Il mondo scientifico, specialmente quello europeo, ha adottato il paradigma dell’Open Science che si basa su una condivisione efficiente e tempestiva dei risultati scientifici e i dati sono un elemento cardine in questo scenario. Per contribuire a questa visione, l’INGV si è dotato di una Politica dei Dati che fornisce chiare indicazioni al proprio personale su come realizzare il paradigma dell’Open Science (Figura 5) e il portale data.ingv.it, chiamato anche “Registro Dati”, ne è parte integrante e fondante sin dal 2018.

La Politica dei Dati dell’INGV vuole così contribuire all’applicazione ed al rispetto dei principi FAIR, acronimo derivante da Findability, Accessibility, Interoperability, Reusability.

Figura 5 – Concetto alla base della Politica dei Dati dell’INGV in cui si propone un percorso parallelo tra la pubblicazione di articoli e i relativi dati scientifici per una più efficiente condivisione dei risultati.

Per l’INGV è fondamentale che i propri dati siano utilizzati in modo corretto e consapevole cercando di fornire agli utenti garanzie di qualità, affidabilità e tracciabilità. Una volta pubblicati online, i dati scientifici possono essere utilizzati liberamente come stabilito dalle licenze Creative Commons adottate da INGV e compatibili con i principi degli Open Data. Queste licenze obbligano l’utilizzatore a citare sempre la fonte di provenienza dei dati così come già avviene per gli articoli scientifici, questo affinché la libertà di circolazione dei dati non infici la loro qualità, garantita da chi il dato lo ha prodotto e validato. A tale scopo il portale data.ingv.it presenta una citazione bibliografica dei dati pronta all’uso che include il codice DOI (Digital Object Identifier), un prezioso strumento che ne permette univocamente riconoscimento e individuazione.

Come consultare il portale

Cercare dati nel portale data.ingv.it è semplice: basta inserire nella barra di ricerca una parola chiave, il nome del dataset (o una sua parte), di un autore, il DOI o una parola che fa parte della sua descrizione. E’ inoltre possibile cercare i dati usando un criterio geografico che permette di tracciare su una mappa il riquadro di interesse per ottenere i dati disponibili in quell’area (Figura 6).

Figura 6 – Esempio di ricerca geografica di dati delimitando l’area etnea.

Per ogni dato vengono riportati in modo chiaro tutte le informazioni che lo caratterizzano (i metadati), come ad esempio:

Nella realizzazione del portale data.ingv.it non è mancata un’attenzione particolare a chi necessita di accedere ai metadati attraverso sistemi più avanzati. Sono infatti disponibili servizi web che consentono una consultazione dei metadati in modalità automatica e programmatica. Sono molteplici gli standard supportati per garantire l’interoperabilità tra sistemi online gestiti da soggetti diversi. Tali standard definiscono in modo dettagliato come formulare e inviare le richieste relative ai metadati e come il servizio deve fornire e codificare le risposte, definendo le Application Programming Interface (API).

I metadati pubblicati nel portale data.ingv.it sono accessibili sia con API gestite direttamente da INGV sia attraverso API gestite da altre istituzioni o enti. Il portale supporta direttamente due API: quelle fornite dal software Open Source CKAN su cui si basa il portale stesso e quelle fornite dal software PyCSW che implementano lo standard Catalogue Service (OGC CSW). I metadati possono altresì essere consultati tramite le API di altre istituzioni: quelle gestite da DataCite e, solo per una porzione dei dati, quelle gestite dal Repertorio Nazionale dei Dati Territoriali (RNDT) e dal portale dati.gov.it.

Per il prossimo futuro si sta progettando un nuovo portale complementare a data.ingv.it dedicato all’accesso diretto e specifico ai dati geospaziali tramite servizi in standard Open Geospatial Consortium (OGC) quali Web Feature Service (WFS), Web Map Service (WMS) e Web Coverage Service (WCS) che permetterà la federazione dei tanti servizi web sviluppati dai gestori delle banche dati. Questa nuova evoluzione costituirà un ulteriore e importante contributo alla missione istituzionale per la valorizzazione del vasto patrimonio scientifico prodotto dall’INGV.

Exit mobile version