Verhaal
3TU.Datacentrum
De drie technische universiteiten hebben samen een datacentrum opgericht voor digitale datasets. Het nieuwe datacentrum gaat ervoor zorgen dat technisch wetenschappelijke onderzoekgegevens duurzaam worden opgeslagen en toegankelijk blijven.
Datacentre.bmp -
Illustratie: LeSimonPix
Wetenschappelijke publicaties zijn al jarenlang gemakkelijk digitaal te raadplegen. Maar de data die ten grondslag ligt aan het gepubliceerde artikel zijn vaak niet meer toegankelijk. Dat kan komen door fysiek verval van de opslagmedia, problemen met oude software en besturingssystemen, of het verlies van beschrijvende metadata. Voor het verifiëren van onderzoek is het noodzakelijk dat de oorspronkelijke data toegankelijk blijven. Bovendien kunnen de data dan hergebruikt worden voor nieuw onderzoek.
De bibliotheken van de TU Delft, Eindhoven en Twente hebben daarom het initiatief genomen tot het nieuwe datacentrum: het 3TU.Datacentrum. Helemaal nieuw is het voor de technische universiteiten niet om digitale datasets duurzaam op te slaan. Thecla Ettema, projectleider van het 3TU.Datacentrum: „De TU Delft heeft tijdens een pilot al ervaring opgedaan met de techniek waarmee de datasets worden opgeslagen.” De data wordt opgeslagen in zogenaamde XML-containers, waarin de meetgegevens onafhankelijk van de software en het besturingssysteem worden geconserveerd. Een ander voordeel van XML-containers is dat de metadata samen met de data zijn opgeslagen. Ettema: „De container bevat niet alleen bestanden met cijfers, maar ook informatie over hoe, wanneer en door wie de data gemeten is. Alles wat je nodig hebt om de data te interpreteren zit erbij.”
Hoe de data het best kunnen worden verzameld, moet Ettema nog onderzoeken. „Het moet de wetenschapper niet al te veel moeite kosten om de datasets aan te leveren. Je wilt hem natuurlijk niet belasten met allerlei onnodige extra handelingen om die datasets openbaar te maken. De wetenschapper heeft het immers al druk genoeg.” Een ander aspect is dat de wetenschapper zijn data misschien niet aan iedereen wil verstrekken. Ettema: „Dus moeten we onderzoeken of we de data kunnen afschermen, zodat een wetenschapper zijn data kan delen met een collega elders in het land, maar niet met de hele wereld.” Voor de geestes- en gedragwetenschappen bestaat al langer een datacentrum voor de duurzame opslag van onderzoeksdata, namelijk DANS (Data Archiving and Networked Services), opgezet door KNAW en NWO.
Bron: ON206, pagina 3
Voeg een reactie toe