Rendere aperti i dati della ricerca è un passo fondamentale verso la Open Science. I dati devono essere FAIR – Findable, Accessible, Interoperable, Reusable. Ovvero, l’apertura deve essere «intelligente»: i dati devono essere accessibili, ricercabili, utilizzabili, valutabili e comprensibili (Science as an open enterprise, Royal Society, 2012).
I vostri dati sono FAIR? Verificate con FAIR self assessment tool o con FAIR aware, che offre anche brevi spiegazioni relative alle singole domande. Se non lo sono, ecco come fare.
In generale, dati devono essere aperti
- tecnicamente, ovvero messi a disposizione in formato non proprietario e leggibili dal computer, per agevolare il data mining
- legalmente, ovvero devono avere associati diritti di riuso. Lo strumento ideale sono le Licenze Creative Commons. Per i dati aperti serve una Licenza CC0 (Pubblico Dominio) o CCBY (Attribuzione). Che i dati siano in pubblico dominio non significa che l’autore non debba essere citato, ovviamente. Il diritto d’autore non si applica ai dati grezzi: approfondite la questione dati e diritti .
La Direttiva 1024/2019 (Open data Directive) ha incluso i dati della ricerca fra i dati del settore pubblico, che devono essere aperti, secondo il principio “as open as possible, as closed as necessary”.
La pandemia da COVID-19 ha dimostrato chiaramente i benefici che derivano dalla condivisione aperta e rapida dei dati: si può leggere Open Science saves lives: lessons form COVID-19 pandemic (2020).
I dati FAIR, se possibile aperti, sono alla base di EOSC – European Open Science Cloud. EOSC è nata il 17 dicembre 2020, dopo un lungo percorso che ha coinvolto le comunità. Nel 2021 diventerà operativa, per cui occorre attrezzarsi.
I dati hanno un enorme potenziale:
- accelerano il passo della ricerca, perché spesso «the coolest thing to do with your data will be thought of by someone else»
- fanno crescere l’economia, in termini di creazione di valore e di risparmi di scala: il Rapporto di McKinsey sui Big Data calcola un valore di 300 miliardi di dollari derivante dall’uso creativo dei dati, e un risparmio solo nel settore sanitario dell’8% annuo
- permettono una ricerca a 360°, perché ciò che può essere “rumore” per un ricercatore è la base di una scoperta per un altro
- creano ponti fra le discipline, dissolvono le barriere, permettono approcci da differenti prospettive, utili a risolvere le sfide globali
- contribuiscono all’integrità della scienza, perché permettono di costruire su fondamenta più solide – meglio basarsi sui dati che sulla loro interpretazione contenuta in un articolo – e fanno crescere la fiducia nei risultati
- sono strettamente legati all’innovazione: «Open Science significa fare in modo che la scienza sia al servizio dell’innovazione e della crescita […]. Pensiamo all’industria e soprattutto alle Piccole e Medie imprese, che con l’accesso e il riuso di dati e inftrastrutture aperte possono accelerare l’implementazione di prodotti e servizi innovativi» (Carlos Moedas, Commissario EU all’Innovazione e Ricerca, 23 giugno 2015)
- sono alla base della trasparenza, nella scienza come nel settore pubblico. In Horizon 2020 tutti i progetti finanziati hanno l’obbligo di depositare anche i dati insieme alle pubblicazioni scientifiche.
Definizioni
Open Data sono «Dati che possono essere utilizzati, modificati e condivisi da chiunque per qualsiasi motivo, a patto che se ne preservino la provenienza e l’apertura» (Open Definition).
Di quali dati stiamo parlando?
- per Open Data si intendono tutti i dati, anche quelli del settore pubblico, spesso raccolti in portali a livello europeo (EU Open data) o nazionale (Dati.gov). Sui dati pubblici si possono costruire App, che tracciano per esempio i flussi di denaro pubblico (OpenSpending)
- per Open Research Data si intendono i dati derivanti dalla ricerca. Si possono depositare in archivi aperti legati alla propria disciplina o pubblicarli in Data Journals oppure ancora aggregarli in portali legati a progetti: le scienze della vita da anni condividono tutto in Elixir; il CERN di Ginevra mette a disposizione tutti i dati degli esperimenti in OpenDataCERN; gli astronomi condividono le loro osservazioni nel Virtual Observatory…
- ricordate che depositare un dataset in un archivio aperto è una garanzia, perché certifica la provenienza di un dataset a una data e la associa al nome del ricercatore che lo ha creato
Per saperne di più
- navigate sulla Open Science Guide della università di Delft (in inglese)
- seguite i corsi online gratuiti Essentials4data (Research Data Netherlands) o Open data essentials (Open Data Institute)
- seguite la sezione Open data su Open Science MOOC
- consultate Open research data su Wiki OA Italia
- leggete E.Giglia, Accesso aperto ai dati della ricerca come veicolo per la scienza aperta, che tenta di dare un’idea della complessità del panorama attuale e dell’importanza che il tema dei dati aperti rivestirà nell’immediato futuro.