Rendere aperti i dati della ricerca è un passo fondamentale verso la Open Science. I dati devono essere FAIR – Findable, Accessible, Interoperable, Reusable. Ovvero, l’apertura deve essere «intelligente»: i dati devono essere accessibili, ricercabili, utilizzabili, valutabili e comprensibili (Science as an open enterprise, Royal Society, 2012).

I vostri dati sono FAIR? Verificate con  FAIR self assessment tool o con FAIR aware, che offre anche brevi spiegazioni relative alle singole domande. Se non lo sono, ecco come fare.

In generale, dati devono essere aperti

  • tecnicamente, ovvero messi a disposizione in formato non proprietario e leggibili dal computer, per agevolare il data mining
  • legalmente, ovvero devono avere associati diritti di riuso. Lo strumento ideale sono le Licenze Creative Commons. Per i dati aperti serve una Licenza CC0 (Pubblico Dominio) o CCBY (Attribuzione). Che i dati siano in pubblico dominio non significa che l’autore non debba essere citato, ovviamente. Il diritto d’autore non si applica ai dati grezzi: approfondite la questione dati e diritti .

La Direttiva 1024/2019 (Open data Directive) ha incluso i dati della ricerca fra i dati del settore pubblico, che devono essere aperti, secondo il principio “as open as possible, as closed as necessary”.

La pandemia da COVID-19 ha dimostrato chiaramente i benefici che derivano dalla condivisione aperta e rapida dei dati: si può leggere Open Science saves lives: lessons form COVID-19 pandemic (2020).

I dati FAIR, se possibile aperti, sono alla base di EOSC – European Open Science Cloud. EOSC è nata il 17 dicembre 2020, dopo un lungo percorso che ha coinvolto le comunità. Nel 2021 diventerà operativa, per cui occorre attrezzarsi.

I dati hanno un enorme potenziale:

  • accelerano il passo della ricerca, perché spesso «the coolest thing to do with your data will be thought of by someone else»
  • fanno crescere l’economia, in termini di creazione di valore e di risparmi di scala: il Rapporto di McKinsey sui Big Data calcola un valore di 300 miliardi di dollari derivante dall’uso creativo dei dati, e un risparmio solo nel settore sanitario dell’8% annuo
  • permettono una ricerca a 360°, perché ciò che può essere “rumore” per un ricercatore è la base di una scoperta per un altro
  • creano ponti fra le discipline, dissolvono le barriere, permettono approcci da differenti prospettive, utili a risolvere le sfide globali
  • contribuiscono all’integrità della scienza, perché permettono di costruire su fondamenta più solide – meglio basarsi sui dati che sulla loro interpretazione contenuta in un articolo – e fanno crescere la fiducia nei risultati
  • sono strettamente legati all’innovazione: «Open Science significa fare in modo che la scienza sia al servizio dell’innovazione e della crescita […]. Pensiamo all’industria e soprattutto alle Piccole e Medie imprese, che con l’accesso e il riuso di dati e inftrastrutture aperte possono accelerare l’implementazione di prodotti e servizi innovativi» (Carlos Moedas, Commissario EU all’Innovazione e Ricerca, 23 giugno 2015)
  • sono alla base della trasparenza, nella scienza come nel settore pubblico. In Horizon 2020 tutti i progetti finanziati hanno l’obbligo di depositare anche i dati insieme alle pubblicazioni scientifiche.

Definizioni

Open Data sono «Dati che possono essere utilizzati, modificati e condivisi da chiunque per qualsiasi motivo, a patto che se ne preservino la provenienza e l’apertura» (Open Definition).

Di quali dati stiamo parlando?

  • per Open Data si intendono tutti i dati, anche quelli del settore pubblico, spesso raccolti in portali a livello europeo (EU Open data) o nazionale (Dati.gov). Sui dati pubblici si possono costruire App, che tracciano per esempio i flussi di denaro pubblico (OpenSpending)
  • per Open Research Data si intendono i dati derivanti dalla ricerca. Si possono depositare in archivi aperti legati alla propria disciplina  o pubblicarli in Data Journals oppure ancora aggregarli in portali legati a progetti: le scienze della vita da anni condividono tutto in Elixir; il CERN di Ginevra mette a disposizione tutti i dati degli esperimenti in OpenDataCERN; gli astronomi condividono le loro osservazioni nel Virtual Observatory
  • ricordate che depositare un dataset in un archivio aperto è una garanzia, perché certifica la provenienza di un dataset a una data e la associa al nome del ricercatore che lo ha creato

Per saperne di più