Data verzamelen
Data verzamelen
The first way of thinking about research data is where it comes from | University of Southampton, 2016

Hoe komen onderzoekers aan hun onderzoeksdata? In deze paragraaf passeert kort een aantal manieren de revue.
Data verzamelen
Hoe verzamelt een onderzoeker zijn/haar data? Dat doet hij/zij op één van de twee volgende manieren (University of Southampton, 2016):

-
De onderzoeker gebruikt bestaande data
Bestaande data zijn:
- Data die door anderen zijn verzameld zoals data verzameld door grote instellingen zoals het CBS, het Kadaster, ministeries enzovoort. CentERdata (n.d.) is bijvoorbeeld een instituut dat (panel)data verzamelt, analyseert en ter beschikking stelt voor wetenschappelijk onderzoek.
- Onderzoeksdata die door andere onderzoekers voor hergebruik in data-archieven zijn gedeponeerd. Zie de paragraaf 'Zoeken naar data' voor het vinden van herbruikbare datasets.
-
De onderzoeker genereert de onderzoeksdata zelf
Bij het genereren van onderzoeksdata bestaat er een onderscheid tussen ruwe data en bewerkte data, maar die scheidslijn is in de praktijk vaag. Meetapparaten worden steeds geavanceerder en een deel van de bewerking van de data kan al gedaan zijn in het apparaat voordat de data uit het apparaat rollen. Daarmee is de ruwe data in feite al bewerkt.
Vijf manieren
Er zijn grofweg vijf verschillende manieren om onderzoeksdata te creëren (University of Southampton, 2016):
- Door observatie
Dit type data kan in de regel maar één keer verzameld worden en is daardoor uniek te noemen. Denk hierbij aan klimaatgegevens, astronomische observaties, archeologische opgravingen, opiniepeilingen, surveyonderzoek.
- Met experimenten
Data verzameld met experimenten (met behulp van labapparatuur). Denk aan de synthese van nieuwe moleculen, de analyse van gensequenties en psychologische tests. Deze experimenten kunnen in de regel herhaald worden.
- Door simulatie (testmodellen)
Denk hierbij aan klimaatmodellen en economische modellen. De resultaten van simulaties zijn meestal eenvoudig te reproduceren. Het model en de metadata zelf zijn dan belangrijker om te bewaren dan de data die de simulaties opleveren.
- Door data processing
Combinatie, herbewerking, (her)groepering etc. van eerder gecreëerde data.
- Door bronnenonderzoek
Denk hierbij aan data die voortkomen uit archief- en literatuuronderzoek en gericht zijn op het samenstellen van teksten of series van ‘meetbare’ gegevens uit archiefstukken, manuscripten en (vak)publicaties. Het kan ook gaan om specialistische queries op grote taalkundige of linguïstische databases.
Een onderzoeker die zelf zijn/haar onderzoeksdata verzamelt, moet rekening houden met een scala aan factoren. Is het meetinstrument wel goed gekalibreerd, bijvoorbeeld? Meet hij/zij wel wat hij denkt te meten? Zijn de surveyvragen niet te sturend? Zulke vragen zijn van grote invloed op datakwaliteit, maar maken geen onderdeel uit van deze cursus.
In de spotlight
De University of Melbourne University Library heeft een aantal video's gemaakt over datamanagement, waaronder deze over het verzamelen van data (University of Melbourne University Library, 2017). Welke van de vijf verschillende manieren om onderzoeksdata te creëren herken je?
Collecting Research Data from University of Melbourne Library on Vimeo.
CentERdata (n.d.). Over CentERdata. http://www.centerdata.nl/nl/over-ons
University of Melbourne University Library (2017). Collecting research data [video]. https://vimeo.com/200625882
University of Southampton (2016). Introducing Research Data. 4th Edition. https://eprints.soton.ac.uk/403440/1/introducing_research_data.pdf