Una buona gestione dei dati è la base per una buona ricerca scientifica. Con “dati” si intende «ogni informazione che è stata raccolta, osservata, generata o creata per validare un risultato scientifico» (Leeds Univ., 2018). Tutte le discipline sono quindi interessate, non solo le scienze esatte.
I dati devono essere
- gestiti e conservati correttamente (anche solo per mero interesse personale, per una ricerca più efficiente)
- resi FAIR
- se possibile, aperti (facendo attenzione alla complessa normativa sui dati)
Guardate questo brevissimo video, che mostra in modo divertente tutti i peggiori incubi derivanti da una gestione scorretta dei propri dati.
Questo corso elearning in tre brevi video spiega i fondamenti di una corretta gestione dei dati e della loro “FAIRificazione”.
1. Gestione dei dati
Conviene imparare a gestire correttamente i propri dati fin dall’inizio di una nuova ricerca.
Tecniche semplici quali nominare i file in modo corretto, gestire le diverse versioni, mantenere e aggiornare una documentazione (es. per gli acronimi utilizzati), conservarli in più copie, possono rendere la ricerca più fluida ed efficace. Il corso Essentials4data – libero e gratuito online – è ricchissimo di spunti e suggerimenti utili. La Data Management Expert Guide dell’infrasruttura CESSDA è un altro utilissimo strumento.
Lo strumento principale per una corretta gestione dei dati è il Data Management Plan (DMP). Il DMP è un documento strutturato, vivo – va aggiornato periodicamente nelle diverse fasi della ricerca – e obbliga a pensare in modo strategico ai propri dati, ponendosi domande sui formati, i metadati utili a descrivere il dataset, le licenze, la conservazione…
Chi fosse finanziato in Horizon2020 ricordi che il DMP è un deliverable del progetto e va consegnato entro i primi sei mesi.
2. Dati FAIR
Per poter essere riusabili, a maggior ragione quando la EOSC – European Open Science Cloud – sarà una realtà per la ricerca e l’innovazione in Europa, i dati devono essere strutturati secondo i principi FAIR: Findable, Accessible, Interoperable, Reusable.
In questo video Luiz Bonino (GoFAIR) spiega in dettaglio i principî e la loro attuazione pratica, e in questa Guida del progetto Parthenos trovate semplici regole per rendere FAIR i dati.
Verificate i vostri dati con questa breve checklist: sono già FAIR?
3. Dati aperti
I dati FAIR possono essere aperti: ricordiamo che “Accessibile” non è sinonimo di “Aperto”, possono esserci dati FAIR chiusi per ragioni di sicurezza o di privacy.
Il principio attualmente vigente in Europa nell’ambito dei progetti finanziati dalla Commissione è «as open as possible, as closed as necessary» (EU Competitiveness Council Conclusions 9029, 18 maggio 2018).
Il primo requisito per rendere aperti i dati è ovviamente aprirli anche dal punto di vista giuridico, rilasciandoli con una Licenza Open.
Tutti i progetti finanziati in Horizon2020 hanno l’obbligo di rendere aperti i dataset che supportano i risultati della ricerca.
Si possono rendere pubblici i dati:
- depositandoli in un archivio aperto, es. Zenodo, Dryad, Figshare [con il vantaggio che viene loro assegnato un identificativo univoco e divengono citabili]
- pubblicandoli come dataset in un Data Journal: sono riviste che pubblicano unicamente dataset con le relative schede di descrizione
- come Supplementary material degli articoli pubblicati su riviste scientifiche
Poiché i dati stanno diventando sempre più un oggetto a sé stante, esistono precise regole di citazione.
I vantaggi dei dati aperti sono descritti bene in questo video: maggiore trasparenza, limitazione delle frodi, accresciuta riproducibilità, possibilità di creare nuovi servizi…
Vantaggi
Una corretta gestione dei dati e un buon Data Management Plan
- rende la vostra ricerca più trasparente
- rende i vostri dati accessibili
- vi fa risparmiare tempo al momento della redazione di un articolo
- riduce il rischio di perdere i dati
- facilita la condivisione e il riuso (non dimentichiamo che si tratta di dati prodotti con fondi pubblici)
- aumenta le citazioni [Drachen, T.M. et al., (2016). Sharing data increases citations. LIBER Quarterly. 26(2), pp.67–82]
Per imparare di più:
Manage, improve and open up your data, corso libero Parthenos project
Essentials4data, corso libero e gratuito [a pagamento se si vuole certificato finale]
Research data management and sharing, MOOC su COURSERA [a pagamento solo se si vuoel il certificato finale]
Open Science Toolkit – FOSTER project: un modulo per ogni esigenza.
Open Science training handbook, un manuale per ogni aspetto della Open Science
Open Data essentials, corso gratuito
Open data handbook, per i dati del settore pubblico (oltre che quelli della ricerca)
A guide to formal ontologies, Parthenos project
Burrow, S. , Margoni, T. and McCutcheon, V. (2018) Introduction to Ownership of Rights in Research Data. CREATe, University of Glasgow, 2018
OpenAIRE, How do I know if my research data are protected? 2018