Rendere aperti i dati della ricerca è un passo fondamentale verso la Open Science. L’apertura deve essere «intelligente»: i dati devono essere accessibili, ricercabili, utilizzabili, valutabili e comprensibili (Science as an open enterprise, Royal Society, 2012). O, con un acronimo, FAIR – Findable, Accessible, Interoperable, Reusable.

Questo significa che i dati devono essere aperti

  • tecnicamente, ovvero messi a disposizione in formato non proprietario e leggibili dal computer, per agevolare il data mining
  • legalmente, ovvero devono avere associati diritti di riuso. Lo strumento ideale sono le Licenze Creative Commons. Per i dati aperti serve una Licenza CC0 (Pubblico Dominio) o CCBY (Attribuzione). Che i dati siano in pubblico dominio non significa che l’autore non debba essere citato, ovviamente.

I dati hanno un enorme potenziale:

  • accelerano il passo della ricerca, perché spesso «the coolest thing to do with your data will be thought of by someone else»
  • fanno crescere l’economia, in termini di creazione di valore e di risparmi di scala: il Rapporto di McKinsey sui Big Data calcola un valore di 300 miliardi di dollari derivante dall’uso creativo dei dati, e un risparmio solo nel settore sanitario dell’8% annuo
  • permettono una ricerca a 360°, perché ciò che può essere “rumore” per un ricercatore è la base di una scoperta per un altro
  • creano ponti fra le discipline, dissolvono le barriere, permettono approcci da differenti prospettive, utili a risolvere le sfide globali
  • contribuiscono all’integrità della scienza, perché permettono di costruire su fondamenta più solide – meglio basarsi sui dati che sulla loro interpretazione contenuta in un articolo – e fanno crescere la fiducia nei risultati
  • sono strettamente legati all’innovazione: «Open science significa fare in modo che la scienza sia al servizio dell’innovazione e della crescita […]. Pensiamo all’industria e soprattutto alle Piccole e Medie imprese, che con l’accesso e il riuso di dati e inftrastrutture aperte possono accelerare l’implementazione di prodotti e servizi innovativi» (Carlos Moedas, Commissario EU all’Innovazione e Ricerca, 23 giugno 2015)
  • sono alla base della trasparenza, nella scienza come nel settore pubblico. In Horizon 2020 tutti i progetti finanziati hanno l’obbligo di depositare anche i dati insieme alle pubblicazioni scientifiche.

Definizioni

Open Data sono «Dati che possono essere utilizzati, modificati e condivisi da chiunque per qualsiasi motivo, a patto che se ne preservino la provenienza e l’apertura» (Open Definition).

Di quali dati stiamo parlando?

per Open Data si intendono tutti i dati, anche quelli del settore pubblico, spesso raccolti in portali a livello europeo (EU Open data) o nazionale (Dati.gov). Sui dati pubblici si possono costruire App, che tracciano per esempio i flussi di denaro pubblico (OpenSpending)

per Open Research Data si intendono i dati derivanti dalla ricerca. Si possono depositare in archivi aperti legati alla propria disciplina – tutelando la paternità intellettuale – o pubblicarli in Data Journals oppure ancora aggregarli in portali legati a progetti: le scienze della vita da anni condividono tutto in Elixir; il CERN di Ginevra mette a disposizione tutti i dati degli esperimenti in OpenDataCERN; gli astronomi condividono le loro osservazioni nel Virtual Observatory

Cosa si può fare con i dati aperti

Nonostante Internet sia stato creato per scambiarsi dati, e nonostante il suo ideatore Tim Berners Lee chieda da anni di mettere i dati sul web, la condivisione dei dati non è ancora una pratica diffusa in tutte le discipline. Esistono però progetti interessanti:

  • Patiens like me mette insieme i dati forniti dai pazienti per cure più responsabili,
  • Open Source Malaria è un laboratorio aperto,
  • Culturomics segue le tracce delle idee in milioni di libri pubblicati nei secoli
  • Open Data UE dà accesso a dati su economia, finanza, cultura, educazione, scienza nell’unione Europea

Per saperne di più