Zum Inhalt
Grund­la­gen und Konzepte

Was ist Forschungs­daten­manage­ment?

For­schungs­daten­ma­nage­ment (FDM) umfasst die Or­ga­ni­sa­ti­on, Struk­tur, Dokumentation, Publikation und sichere (Langzeit-)Aufbewahrung von For­schungs­da­ten. Es ist damit Grundlage für eine effektive Nachnutzung der eigenen Daten durch einen selbst oder andere. Zur ersten Orientierung erläutern Ihnen diese Seiten Kernkonzepte und -begriffe des For­schungs­da­ten­manage­ments. Weitergehende Fra­gen beantwortet der Forschungsdatenservice gerne.

Datenlebenszyklus © Bernd Zey​/​TU Dortmund

For­schungs­da­ten sind in allen Forschungsdisziplinen Ergebnis und Grundlage der wis­sen­schaft­li­chen Ar­beit und kön­nen in allen Formaten und Formen auf­tre­ten. Heutzutage sind For­schungs­da­ten über­wie­gend di­gi­tal und kön­nen sehr um­fang­reich sein. Damit steigen die An­for­de­run­gen an ihr Management. Nachfolgend erfahren Sie was unter Forschungs­daten­manage­ment ver­stan­den wird und wie Sie eine eigene Startegie für den Umgang mit Ihren Daten ent­wi­ckeln kön­nen.

Forschungs­daten­manage­ment (FDM) ist eine zentrale Anforderung der Deutschen Forschungsgemeinschaft (DFG), zusammengefasst in den „Regeln der guten wis­sen­schaft­li­chen Praxis“.

FDM fasst alle Konzepte zu­sam­men, die dabei helfen, die eigenen For­schungs­da­ten zu strukturieren, organisieren, dokumentieren, si­chern, archivieren und zu teilen. Bereits bei der Projektplanung sollten die verwendeten Maß­nahmen in ei­nem Datenmanagementplan zu­sam­men­ge­fasst wer­den, damit diese im Verlauf des Projekts konsequent zur An­wen­dung kom­men. Dadurch wird ein effizienter Umgang mit Daten im Verlauf des Projekts gesichert und das Wiederauffinden und das Teilen sowie die Publikation von For­schungs­da­ten und -ergebnissen wird erleichtert.

Bereits vor dem Projektstart sollte ein FDM-Kon­zept ent­wickelt wer­den, welches den Umgang mit im Pro­jekt erzeugten For­schungs­da­ten regelt und zu ei­nem ef­fi­zi­en­ten Management der Daten führt. Um dies zu er­rei­chen, eignen sich Daten­manage­ment­pläne (DMP). Das spart am Ende des Projekts sehr viel Zeit und Nerven. Ein bewährtes Tool zur Erzeugung, Verwaltung und Teilung von DMPs ist der Research Data Management Organizer RDMO

FDM liefert Ihnen die Konzepte zum nachhaltigen Umgang mit For­schungs­da­ten, jedoch ent­schei­den Sie zu jedem Zeitpunkt selbst, ob und wann Sie For­schungs­da­ten mit Kooperationspartner:innen oder Dritten teilen wol­len. Durch die An­wen­dung der FDM-Konzepte ist das Teilen oder die Veröffentlichung von For­schungs­da­ten für Dritte erleichtert, aber nicht zwingend er­for­der­lich.

Die konsequente An­wen­dung von FDM er­mög­licht es, den ge­sam­ten Forschungsprozess offenzulegen, welcher dann wiederum von anderen For­schenden auf­ge­nom­men und wei­ter­ent­wi­ckelt wer­den kann. Diese transparente Zurverfügungstellung von Wissen wird Open Science genannt und grenzt sich klar vom FDM ab.

Das The­ma Forschungs­daten­manage­ment bekommt einen immer höheren Stellenwert bei der Drittmitteleinwerbung. Immer mehr Dritt­mit­tel­ge­ber verlangen aus­führ­li­che Angaben zum Umgang mit For­schungs­da­ten:

  • Die DFG verlangt neuerdings um­fas­sen­de Angaben zum Umgang mit den erzeugten For­schungs­da­ten.
  • Bei BMBF-Anträgen wer­den je nach Förderlinie komplette Daten­manage­ment­pläne (DMP) verlangt, in welchen sehr detaillierte Angaben zum Umgang mit den For­schungs­da­ten ge­macht wer­den müs­sen.
  • Stif­tun­gen wie z. B. die Volkswagenstiftung verlangen Daten­manage­ment­pläne bei der Beantragung von Dritt­mit­teln.
  • Im H2020 För­der­pro­gramm der EU wer­den bei Einreichung eines Antrags auch Daten­manage­ment­pläne verlangt und die Veröffentlichung der For­schungs­da­ten in ei­nem Repositorium wird erwartet.

Neben dem Teilaspekt FDM un­ter­stützt Sie das Re­fe­rat For­schungs­för­de­rung bei der Beantragung von Dritt­mit­teln in Form von strategischen Lektoraten und durch die Begleitung beim hochschulinternen Antragsprozess. Kontaktieren Sie das Team der För­der­be­ra­tung gerne.

Datenmanagementplan © Bernd Zey​/​TU Dortmund

Ein Datenmanagementplan (DMP) ist ein zentrales Dokument, in dem alle In­for­ma­ti­onen und geplanten Maß­nahmen zum Management der For­schungs­da­ten innerhalb eines Projekts zu­sam­men­ge­fasst wer­den.

Es gibt un­ter­schied­li­che Mög­lich­keiten einen DMP anzulegen. Zum Bei­spiel kann das FDM-Kon­zept anhand von Leitfragen in ei­nem Dokument oder einer Ta­bel­le er­fol­gen. Dies ist vornehmlich der Fall, wenn ein Dritt­mit­tel­ge­ber ein solches Template zur Er­zeu­gung eines DMP für den Antragsprozess vorgibt. Darüber hinaus gibt es noch die Mög­lich­keit, einen DMP mit­hil­fe des Resarch Data Management Organizers (RDMO, Anleitung) anzulegen. RDMO ist ein Webtool, welches das kollaborative Erstellen eines DMP anhand eines Fragenkatalogs erlaubt. Mithilfe von RDMO lässt sich der Arbeitsaufwand des Einzelnen mi­ni­mie­ren. RDMO ist für alle Arten von Projekten geeignet, von Promotionsprojekten bis hin zu Ver­bund­pro­jek­ten wie SFBs/TRRs.

Ein bereits vor Projektbeginn erzeugter DMP hilft damit, wich­ti­ge Fra­gen schon vor Projektbeginn zu klären und schützt Sie damit vor bösen Über­rasch­ung­en.

FAIR Principles © SangyaPundir​/​Wikimedia

Datenmanagement sollte stets nach den FAIR-Prinzipien erolgen. Das bedeutet, dass die erzeugten For­schungs­da­ten

  • Auffindbar (Findable)
  • Zugänglich (Accessible)
  • Interoperabel (Interoperable)
  • Nachnutzbar (Re-useable)

sein sollen.

Für die Um­set­zung der FAIR-Prinzipen eignen sich z.B. fachspezifische Repositorien, in denen die Daten in ei­nem offenen For­mat (interoperabel) abgelegt und durch Metadaten beschrieben (auffindbar) wer­den. Durch die Vergabe von persistenten Identifikatoren (z.B. DOI, Handle usw.) kön­nen diese Daten bei Nachnutzung zitiert wer­den und das Rechtemanagement des Repositoriums sichert die Zugänglichkeit.

Die FAIR-Prinzipien sind dabei nicht mit Open Data zu verwechseln, die FAIR-Prinzipien stellen lediglich sicher, dass die Daten für einen be­stimm­ten Personenkreis nachvollziehbar, zugänglich und nutz­bar abgelegt wer­den. Es gilt der Grundsatz: so offen wie mög­lich, so geschlossen wie nötig.

Weitere Informationen über die FAIR Prinzipien und deren Umsetzung im Wissenschaftsalltag finden Sie in der Publikation "Die FAIR-Prinzipien für das wissenschaftliche Datenmanagement und Data Stewardship" (oder in der englischen Publikation The FAIR Guiding Principles)

Um die Daten langfristig zu spei­chern, stellt das IT und Medien Centrum (ITMC) in Ko­ope­ra­ti­on mit der Uni­ver­si­täts­al­li­anz Ruhr einen Forschungsdatenspeicher zur Ver­fü­gung, in dem Ihre For­schungs­da­ten für einen Zeitraum von min­des­tens 10 Jah­ren sicher aufbewahrt wer­den. Der unbefugte Zugriff auf Ihre Daten wird durch eine Rechtemanagementsystem verhindert.

Grundsätzlich sollten For­schungs­da­ten auf ei­nem zen­tra­len Server abgelegt wer­den, der Zugriff sollte nur berechtigten Per­so­nen mög­lich sein und die Daten sollten regelmäßig gesichert wer­den. Das Backup der Daten sollte nach der 3-2-1-Regel er­fol­gen: 3 Kopien auf 2 Me­di­en, wobei min­des­tens 1 Kopie räumlich getrennt abgelegt wird.

Eine mögliche Infrastruktur, um Forschungsdaten sicher zu speichern, bietet die TU Dortmund mit dem Datenrepositorium TUDOdata. In TUDOdata werden die Daten mit Metadaten versehen und sind so besser auffindbar. Neben der Speicherung für 10 Jahre nach den Regeln der guten wissenschaftlichen Praxis können die Forschungsdaten in TUDOdata ebenfalls publiziert werden: dadurch sind die Daten und Metadaten öffentlich einsehbar und durch eine DOI persistent referenzierbar

Die Dokumentation von For­schungs­da­ten erfolgt im For­schungs­all­tag vornehmlich durch Freitextdokumente, wie z.B. Labor- oder Notizbücher. Die Nutzung dieser In­for­ma­ti­onen ist jedoch ein­ge­schränkt, weil In­for­ma­ti­onen nicht maschinell durchsucht wer­den kön­nen. Die Ver­wen­dung von elek­tro­nischen Laborbüchern schafft Abhilfe, da die Dokumentation Ihrer For­schung durchsuchbar wird, Projekten zugeordnet und mit Kollaborationspartnern geteilt wer­den kann. Elektronische Laborbücher sind na­tür­lich nur für einen Teil der For­schenden der TU Dort­mund in­te­res­sant, aber es gibt noch andere Lö­sun­gen.

Die Ver­wen­dung von Metadaten zur Beschreibung und Dokumentation Ihrer For­schungs­da­ten stellt deren Auffindbarkeit und Nachvollziehbarkeit sicher. Metadaten enthalten definierte Ele­men­te, wie z.B. den Autor, die (Pro­jekt-)Zugehörigkeit, das Datum der Er­zeu­gung, aber auch wich­ti­ge Parameter, wel­che zum Ver­ständ­nis der Daten not­wen­dig sind, bis hin zu ei­nem Abstract, der das Pro­jekt be­schreibt. Durch die Ver­wen­dung eines solchen struk­tu­rier­ten Metadatenschemas sind die In­for­ma­ti­onen geordnet und allgemein ver­ständ­lich abgelegt; ein klarer Vorteil zur Freitextdokumentation.

Wir un­ter­stüt­zen Sie gerne bei der Identifikation bzw. helfen bei der Erstellung eines auf Ihre Bedürfnisse zugeschnittenen Metadatenschemas.

For­schungs­vor­ha­ben mit personenbezogenen Daten unterliegen gesetzlichen Bestimmungen. Bevor Sie ein Pro­jekt mit personenbezogenen Daten beginnen, sollten Sie Kontakt zu Ralf Offele, dem Datenschutzbeauftragten der TU Dort­mund (E-Mail senden) auf­neh­men, um Ihr Vorhaben und eventuelle Fallstricke vor Projektbeginn zu klären. Ein bereits erstellter Datenmanagementplan hilft Ihnen dabei, das Vorhaben zu erklären und eine qua­li­fi­zier­te Ein­schät­zung der Sachlage zu bekommen.

Für generelle In­for­ma­ti­onen zum Thema "Datenschutz bei Forschungsdaten" finden Sie hier eine Zusammenfassung aller wich­ti­gen In­for­ma­ti­onen. Bitte bedenken Sie, dass diese In­for­ma­ti­onen nicht die qua­li­fi­zier­te Ein­schät­zung eines Datenschutzbeauftragten ersetzen.

Um For­schungs­da­ten kollaborativ zu teilen, eignen sich vor allem Cloud-Lö­sun­gen. Dadurch kön­nen Daten einfach synchronisiert und aus­ge­tauscht wer­den.

Da die Stand­or­te der Cloud-Server und damit das Recht an den Daten laut Gesetzgebung von kommerziellen Anbietern nicht immer bekannt sind, haben einige Forschende Vorbehalte gegen die Nutzung von Cloud-Lö­sun­gen für den Aus­tausch von For­schungs­da­ten.

Hierfür eignet sich die NRW Cloud-Lö­sung Sciebo, mit der Sie For­schungs­da­ten teilen und ge­mein­sam Do­ku­mente anlegen und be­ar­bei­ten kön­nen. Alle Hoch­schu­len aus NRW besitzen einen Zugang zu Sciebo, für Kollaborationen außerhalb von NRW kön­nen Gastaccounts angelegt wer­den.

Eine Al­ter­na­ti­ve zu Sciebo wäre B2DROP, welches sich an For­schen­de der EU richtet, die For­schungs­da­ten aus­tau­schen wol­len. Der Service wird aktuell vom Jülich Supercomputing Centre (JSC) be­reit­ge­stellt und die Aufbewahrung der Daten unterliegt somit deut­scher Gesetzgebung.

Bei der Archi­vie­rung von For­schungs­da­ten wird zwi­schen der sicheren und nutzbaren Speicherung von For­schungs­da­ten über einen Zeitraum von 10 Jah­ren entsprechend den Regeln der guten wis­sen­schaft­li­chen Praxis (Archi­vie­rung) und der Langzeitarchivierung für Zeiträume von über 25 Jah­ren un­ter­schie­den.

Dies stellt spezielle He­raus­for­de­run­gen an Ihre Daten. Für die Archi­vie­rung der Daten sollten diese möglichst in ei­nem offenen, nicht proprietären For­mat vorliegen. Sollte eine Mi­gra­tion in ein offenes For­mat technisch nicht mög­lich sein, dann muss die Soft­ware, mit der die Daten erzeugt bzw. ge­öff­net wer­den kön­nen, auch archiviert wer­den. Gegebenenfalls muss die ge­sam­te Softwareumgebung archiviert wer­den (Virtualisierung), um die Nutzbarkeit der For­schungs­da­ten sicherzustellen. Damit ist ein großer Auf­wand verbunden, weshalb die Archi­vie­rung der Daten schon vor Projektbeginn mitbedacht wer­den sollte.

Die Langzeitarchivierung birgt noch mehr tech­ni­sche Hür­den, da sich Soft- und Hard­ware in ei­nem Zeitraum von über 25 Jah­ren stark verändern. Um Daten über so einen lan­gen Zeitraum nutz­bar zu halten, ist eine stetige Mi­gra­tion in nutzbare Formate not­wen­dig. Technische Lö­sun­gen, wie Rosetta, über­neh­men diesen Schritt für Sie, die bisher un­ter­stütz­ten Formate sind jedoch begrenzt.

Repositorien sind Daten- und Dokumentenserver, auf denen wis­sen­schaft­liche For­schungs­er­geb­nis­se in Form von Publikationen und For­schungs­da­ten abgelegt und zugänglich ge­macht wer­den kön­nen. Durch die Vergabe von Metadaten ist es mög­lich, diese (Daten)Publikationen über Suchmaschinen auffindbar zu ma­chen. In der Regel wird zudem ein persistenter  Identifikator vergeben (DOI), so dass die Publikation nachhaltig verlinkt ist. Es gibt fachspezifische und fachübergreifende Repositorien wel­che über die Suchmaschine Registry of Research Data Repositories (re3data) aufgefunden wer­den kön­nen. Bei der Wahl eines geeigneten Repositoriums hilft der Forschungsdatenservice der TU Dort­mund gerne.

Auch die TU Dort­mund betreibt zwei Repositorien:

  • TUDOdata ist das Daten-Repositorium der TU Dortmund. Hier kön­nen Angehörige der TU Dort­mund For­schungs­da­ten und -ergebnisse sicher speichern und für andere For­schen­de zur Ver­fü­gung stellen. Eine Anleitung mit einer Sammlung an häufig gestellten Fragen finden Sie hier
  • Eldorado ist primär auf die Speicherung und Veröffentlichung von Do­ku­menten und Publikationen ausgelegt.

Die Relevanz der Daten als Basis für zukunftsfähige Wissenschaft und die Schwierigkeit von fachübergreifenden Lösungen, wurde auch von der Politik erkannt. Beauftragt durch die Gemeinsame Wissenschaftskonferenz (GWK) hat der Rat für Informationsinfrastrukturen daher 2016 den Aufbau einer Nationalen Forschungsdateninfrastruktur (NFDI) vorgeschlagen. Finanziert durch Bund und Länder entsteht diese derzeit als bundesweit verteiltes Kompetenz- und Infrastrukturnetzwerk, das die Bereitstellung und Erschließung von Forschungsdaten für die Wissenschaft sicherstellen soll.

Weitere Informationen zur NFDI

Die Grundsätze des For­schungs­da­ten­manage­ments an der TU Dort­mund erklären das Selbstverständnis und die Ver­ant­wor­tung der For­schenden an der TU Dort­mund im Umgang mit Daten. Wenn Sie Hilfe bei der Um­set­zung benötigen, dann wenden Sie sich gerne an den Forschungsdatenservice der TU Dort­mund, wir ent­wi­ckeln mit Ihnen ein Kon­zept, um die Grundsätze des FDM auf Ihren Forschungsprozess anzuwenden.

Be­ra­tungs­an­ge­bot

Ser­vice­leis­tun­gen und An­sprech­per­so­nen

Der Forschungsdatenservice der TU Dort­mund un­ter­stützt alle For­schenden bei Umgang mit Ihren Daten – von Promotions- bis zu Ver­bund­pro­jek­ten. Wir beraten Sie gerne zu allen Fra­gen rund um den Umgang mit For­schungs­da­ten. Anhand Ihres Bedarfs ent­wi­ckeln wir ge­mein­sam eine Strategie, um die Nach­hal­tig­keit Ihrer For­schungs­da­ten entlang der Regeln der guten wis­sen­schaft­li­chen Praxis zu si­chern. Kontaktieren Sie uns gerne über unsere zentrale E-Mail-Adresse und vereinbaren Sie einen Beratungstermin.

Support © Wokandapix​/​Pixabay