Data-archieven


For researchers, the move to open data means that they have to think about what data their research will produce, how these data will be described, and how they can be made available in such a way as to benefit science and society in general. This means that they have to draw up a data management plan and find suitable data depositories. | ERC, 2019




Waar kunnen onderzoekers het beste hun onderzoeksdata publiceren? In deze paragraaf komen de overwegingen aan bod en passeert een aantal mogelijke data-archieven de revue.

Een data-archief aanraden

Na de keuze voor datapublicatie, volgt de keuze voor een data-archief. Waar onderzoeksprojecten vaak een korte doorlooptijd hebben, richten data-archieven zich juist op continuïteit en lange termijn beschikbaarheid en herbruikbaarheid. Data-archieven spelen een onmiskenbare rol in faciliteren van een FAIRe data-infrastructuur.

Welk data-archief kun je aanraden aan onderzoekers? Soms wordt deze al voorgeschreven door een financier, uitgever of andere externe partij. Maar als een onderzoeker zelf de keuze moet maken, dan kun je bijvoorbeeld de aanbevelingen van OpenAIRE (n.d.) of die van ERC (2022) volgen.



Raad als eerste een domeinspecifiek data-archief aan. Het voordeel van een discipline-specifiek data-archief is dat de mogelijkheden veel meer toegespitst zijn op de betreffende onderzoekscommunity. De data kunnen op een rijkere manier worden beschreven door het gebruik van discipline-specifieke metadatastandaarden en dat maakt de mogelijkheid om relevante data te vinden ook groter. 

Voor voorbeelden van discipline-specifieke archieven kun je bijvoorbeeld eens een kijkje bij de recommended repositories van PLOS ONE (n.d.) of bij de lijst van ERC (2022).  

Vraag je bij de uiteindelijke keuze het volgende af:

  • Is het data-archief gecommitteerd aan langetermijntoegang?
  • Slaat het data-archief de data veilig op?
  • Zorgt het data-archief ervoor dat de data vindbaar blijven door het gebruik van persistent identifiers
  • Beschrijft het data-archief de data op een standaard manier, met geaccepteerde metadatastandaarden?

Als het data-archief een datakeurmerk zoals het CoreTrustSealheeft, kun je daar vanuit gaan. 

In Nederland kun je gebruik maken van de DANS Data stations (DANS, n.d.a.) of 4TU.ResearchData (n.d.). Voor grote datasets is er ook SURF data repository (SURF. n.d.). Zie hiervoor ook de infographic.



Als een domeinspecifiek data-archief niet beschikbaar is, kijk dan of er een instellingsrepository bestaat.


Als geen van bovenstaande beschikbaar is, raad dan een data repository voor algemene doeleinden aan:



Doorzoek Re3data.org (n.d.), een register van meer dan 1500 data-archieven en repositories, om andere data repositories te ontdekken. Je kunt zoeken op onderwerp, inhoudstype en land. Daarnaast kun je bijvoorbeeld zoeken naar data-archieven met een datakeurmerk, met datasets die beschikbaar zijn via open access of die over een persistent identifier (PID) beschikken.



There are hundreds of repositories worldwide. Some cater to a specific research domain, while others are general-purpose repositories. They may be called something other than a repository, for example, a data centre or an archive. | Whyte, 2015



In de spotlight

DARIAH heeft een zogeheten data deposit recommendation service ontwikkeld voor de humaniora. Je kunt 'm hier uitproberen (DARIAH-EU, 2017)  





Bronnen
Klik om te openen/sluiten

4TU.ResearchData (n.d.) Archiveer jouw onderzoeksdata. https://data.4tu.nl/info/about-your-data/publish-cite

DANS (n.d.a). DANS Data Stations. https://dans.knaw.nl/nl/data-stations/

DANS (n.d.b.). DataVerseNL. https://dans.knaw.nl/nl/over/diensten/DataverseNL/DataverseNL?set_language=nl

DARIAH-EU (2017). Data Deposit Recommendation Service for Humanities Researchers https://ddrs-dev.dariah.eu/ddrs/

Dryad (n.d.) http://www.datadryad.org

ERC (2022). Open Research Data and Data Management Plans. Information for ERC grantees by the ERC Scientific Council. https://erc.europa.eu/sites/default/files/document/file/ERC_info_document-Open_Research_Data_and_Data_Management_Plans.pdf

Figshare (n.d.) https://figshare.com/

Harvard University (n.d.) https://dataverse.harvard.edu/ 

OpenAIRE (n.d.). How to find a trutstworthy repository for your data. https://www.openaire.eu/find-trustworthy-data-repository

Open Science Framework (n.d.) https://osf.io/

PLOS ONE (n.d.). Data Availability. https://journals.plos.org/plosone/s/data-availability

Re3Data (n.d.) https://www.re3data.org/

SURF (n.d.). SURF Data Repository. https://repository.surfsara.nl/

Whyte, A. (2015). ‘Where to keep research data: DCC checklist for evaluating data repositories’ v.1.1 Edinburgh: Digital Curation Centre. Available online: www.dcc.ac.uk/resources/how-guides

Zenodo (n.d.) https://zenodo.org/