Was ist Forschungsdatenmanagement?
Forschungsdatenmanagement (FDM) umfasst die Organisation, Struktur, Dokumentation, Publikation und sichere (Langzeit-)Aufbewahrung von Forschungsdaten. Es ist damit Grundlage für eine effektive Nachnutzung der eigenen Daten durch einen selbst oder andere. Zur ersten Orientierung erläutern Ihnen diese Seiten Kernkonzepte und -begriffe des Forschungsdatenmanagements. Weitergehende Fragen beantwortet der Forschungsdatenservice gerne.
Forschungsdaten sind in allen Forschungsdisziplinen Ergebnis und Grundlage der wissenschaftlichen Arbeit und können in allen Formaten und Formen auftreten. Heutzutage sind Forschungsdaten überwiegend digital und können sehr umfangreich sein. Damit steigen die Anforderungen an ihr Management. Nachfolgend erfahren Sie was unter Forschungsdatenmanagement verstanden wird und wie Sie eine eigene Startegie für den Umgang mit Ihren Daten entwickeln können.
Forschungsdatenmanagement (FDM) ist eine zentrale Anforderung der Deutschen Forschungsgemeinschaft (DFG), zusammengefasst in den „Regeln der guten wissenschaftlichen Praxis“.
FDM fasst alle Konzepte zusammen, die dabei helfen, die eigenen Forschungsdaten zu strukturieren, organisieren, dokumentieren, sichern, archivieren und zu teilen. Bereits bei der Projektplanung sollten die verwendeten Maßnahmen in einem Datenmanagementplan zusammengefasst werden, damit diese im Verlauf des Projekts konsequent zur Anwendung kommen. Dadurch wird ein effizienter Umgang mit Daten im Verlauf des Projekts gesichert und das Wiederauffinden und das Teilen sowie die Publikation von Forschungsdaten und -ergebnissen wird erleichtert.
Bereits vor dem Projektstart sollte ein FDM-Konzept entwickelt werden, welches den Umgang mit im Projekt erzeugten Forschungsdaten regelt und zu einem effizienten Management der Daten führt. Um dies zu erreichen, eignen sich Datenmanagementpläne (DMP). Das spart am Ende des Projekts sehr viel Zeit und Nerven. Ein bewährtes Tool zur Erzeugung, Verwaltung und Teilung von DMPs ist der Research Data Management Organizer RDMO.
FDM liefert Ihnen die Konzepte zum nachhaltigen Umgang mit Forschungsdaten, jedoch entscheiden Sie zu jedem Zeitpunkt selbst, ob und wann Sie Forschungsdaten mit Kooperationspartner:innen oder Dritten teilen wollen. Durch die Anwendung der FDM-Konzepte ist das Teilen oder die Veröffentlichung von Forschungsdaten für Dritte erleichtert, aber nicht zwingend erforderlich.
Die konsequente Anwendung von FDM ermöglicht es, den gesamten Forschungsprozess offenzulegen, welcher dann wiederum von anderen Forschenden aufgenommen und weiterentwickelt werden kann. Diese transparente Zurverfügungstellung von Wissen wird Open Science genannt und grenzt sich klar vom FDM ab.
Das Thema Forschungsdatenmanagement bekommt einen immer höheren Stellenwert bei der Drittmitteleinwerbung. Immer mehr Drittmittelgeber verlangen ausführliche Angaben zum Umgang mit Forschungsdaten:
- Die DFG verlangt neuerdings umfassende Angaben zum Umgang mit den erzeugten Forschungsdaten.
- Bei BMBF-Anträgen werden je nach Förderlinie komplette Datenmanagementpläne (DMP) verlangt, in welchen sehr detaillierte Angaben zum Umgang mit den Forschungsdaten gemacht werden müssen.
- Stiftungen wie z. B. die Volkswagenstiftung verlangen Datenmanagementpläne bei der Beantragung von Drittmitteln.
- Im H2020 Förderprogramm der EU werden bei Einreichung eines Antrags auch Datenmanagementpläne verlangt und die Veröffentlichung der Forschungsdaten in einem Repositorium wird erwartet.
Neben dem Teilaspekt FDM unterstützt Sie das Referat Forschungsförderung bei der Beantragung von Drittmitteln in Form von strategischen Lektoraten und durch die Begleitung beim hochschulinternen Antragsprozess. Kontaktieren Sie das Team der Förderberatung gerne.
Ein Datenmanagementplan (DMP) ist ein zentrales Dokument, in dem alle Informationen und geplanten Maßnahmen zum Management der Forschungsdaten innerhalb eines Projekts zusammengefasst werden.
Es gibt unterschiedliche Möglichkeiten einen DMP anzulegen. Zum Beispiel kann das FDM-Konzept anhand von Leitfragen in einem Dokument oder einer Tabelle erfolgen. Dies ist vornehmlich der Fall, wenn ein Drittmittelgeber ein solches Template zur Erzeugung eines DMP für den Antragsprozess vorgibt. Darüber hinaus gibt es noch die Möglichkeit, einen DMP mithilfe des Resarch Data Management Organizers (RDMO, Anleitung) anzulegen. RDMO ist ein Webtool, welches das kollaborative Erstellen eines DMP anhand eines Fragenkatalogs erlaubt. Mithilfe von RDMO lässt sich der Arbeitsaufwand des Einzelnen minimieren. RDMO ist für alle Arten von Projekten geeignet, von Promotionsprojekten bis hin zu Verbundprojekten wie SFBs/TRRs.
Ein bereits vor Projektbeginn erzeugter DMP hilft damit, wichtige Fragen schon vor Projektbeginn zu klären und schützt Sie damit vor bösen Überraschungen.
Datenmanagement sollte stets nach den FAIR-Prinzipien erolgen. Das bedeutet, dass die erzeugten Forschungsdaten
- Auffindbar (Findable)
- Zugänglich (Accessible)
- Interoperabel (Interoperable)
- Nachnutzbar (Re-useable)
sein sollen.
Für die Umsetzung der FAIR-Prinzipen eignen sich z.B. fachspezifische Repositorien, in denen die Daten in einem offenen Format (interoperabel) abgelegt und durch Metadaten beschrieben (auffindbar) werden. Durch die Vergabe von persistenten Identifikatoren (z.B. DOI, Handle usw.) können diese Daten bei Nachnutzung zitiert werden und das Rechtemanagement des Repositoriums sichert die Zugänglichkeit.
Die FAIR-Prinzipien sind dabei nicht mit Open Data zu verwechseln, die FAIR-Prinzipien stellen lediglich sicher, dass die Daten für einen bestimmten Personenkreis nachvollziehbar, zugänglich und nutzbar abgelegt werden. Es gilt der Grundsatz: so offen wie möglich, so geschlossen wie nötig.
Weitere Informationen über die FAIR Prinzipien und deren Umsetzung im Wissenschaftsalltag finden Sie in der Publikation "Die FAIR-Prinzipien für das wissenschaftliche Datenmanagement und Data Stewardship" (oder in der englischen Publikation The FAIR Guiding Principles)
Um die Daten langfristig zu speichern, stellt das IT und Medien Centrum (ITMC) in Kooperation mit der Universitätsallianz Ruhr einen Forschungsdatenspeicher zur Verfügung, in dem Ihre Forschungsdaten für einen Zeitraum von mindestens 10 Jahren sicher aufbewahrt werden. Der unbefugte Zugriff auf Ihre Daten wird durch eine Rechtemanagementsystem verhindert.
Grundsätzlich sollten Forschungsdaten auf einem zentralen Server abgelegt werden, der Zugriff sollte nur berechtigten Personen möglich sein und die Daten sollten regelmäßig gesichert werden. Das Backup der Daten sollte nach der 3-2-1-Regel erfolgen: 3 Kopien auf 2 Medien, wobei mindestens 1 Kopie räumlich getrennt abgelegt wird.
Eine mögliche Infrastruktur, um Forschungsdaten sicher zu speichern, bietet die TU Dortmund mit dem Datenrepositorium TUDOdata. In TUDOdata werden die Daten mit Metadaten versehen und sind so besser auffindbar. Neben der Speicherung für 10 Jahre nach den Regeln der guten wissenschaftlichen Praxis können die Forschungsdaten in TUDOdata ebenfalls publiziert werden: dadurch sind die Daten und Metadaten öffentlich einsehbar und durch eine DOI persistent referenzierbar
Die Dokumentation von Forschungsdaten erfolgt im Forschungsalltag vornehmlich durch Freitextdokumente, wie z.B. Labor- oder Notizbücher. Die Nutzung dieser Informationen ist jedoch eingeschränkt, weil Informationen nicht maschinell durchsucht werden können. Die Verwendung von elektronischen Laborbüchern schafft Abhilfe, da die Dokumentation Ihrer Forschung durchsuchbar wird, Projekten zugeordnet und mit Kollaborationspartnern geteilt werden kann. Elektronische Laborbücher sind natürlich nur für einen Teil der Forschenden der TU Dortmund interessant, aber es gibt noch andere Lösungen.
Die Verwendung von Metadaten zur Beschreibung und Dokumentation Ihrer Forschungsdaten stellt deren Auffindbarkeit und Nachvollziehbarkeit sicher. Metadaten enthalten definierte Elemente, wie z.B. den Autor, die (Projekt-)Zugehörigkeit, das Datum der Erzeugung, aber auch wichtige Parameter, welche zum Verständnis der Daten notwendig sind, bis hin zu einem Abstract, der das Projekt beschreibt. Durch die Verwendung eines solchen strukturierten Metadatenschemas sind die Informationen geordnet und allgemein verständlich abgelegt; ein klarer Vorteil zur Freitextdokumentation.
Wir unterstützen Sie gerne bei der Identifikation bzw. helfen bei der Erstellung eines auf Ihre Bedürfnisse zugeschnittenen Metadatenschemas.
Forschungsvorhaben mit personenbezogenen Daten unterliegen gesetzlichen Bestimmungen. Bevor Sie ein Projekt mit personenbezogenen Daten beginnen, sollten Sie Kontakt zu Ralf Offele, dem Datenschutzbeauftragten der TU Dortmund (E-Mail senden) aufnehmen, um Ihr Vorhaben und eventuelle Fallstricke vor Projektbeginn zu klären. Ein bereits erstellter Datenmanagementplan hilft Ihnen dabei, das Vorhaben zu erklären und eine qualifizierte Einschätzung der Sachlage zu bekommen.
Für generelle Informationen zum Thema "Datenschutz bei Forschungsdaten" finden Sie hier eine Zusammenfassung aller wichtigen Informationen. Bitte bedenken Sie, dass diese Informationen nicht die qualifizierte Einschätzung eines Datenschutzbeauftragten ersetzen.
Um Forschungsdaten kollaborativ zu teilen, eignen sich vor allem Cloud-Lösungen. Dadurch können Daten einfach synchronisiert und ausgetauscht werden.
Da die Standorte der Cloud-Server und damit das Recht an den Daten laut Gesetzgebung von kommerziellen Anbietern nicht immer bekannt sind, haben einige Forschende Vorbehalte gegen die Nutzung von Cloud-Lösungen für den Austausch von Forschungsdaten.
Hierfür eignet sich die NRW Cloud-Lösung Sciebo, mit der Sie Forschungsdaten teilen und gemeinsam Dokumente anlegen und bearbeiten können. Alle Hochschulen aus NRW besitzen einen Zugang zu Sciebo, für Kollaborationen außerhalb von NRW können Gastaccounts angelegt werden.
Eine Alternative zu Sciebo wäre B2DROP, welches sich an Forschende der EU richtet, die Forschungsdaten austauschen wollen. Der Service wird aktuell vom Jülich Supercomputing Centre (JSC) bereitgestellt und die Aufbewahrung der Daten unterliegt somit deutscher Gesetzgebung.
Bei der Archivierung von Forschungsdaten wird zwischen der sicheren und nutzbaren Speicherung von Forschungsdaten über einen Zeitraum von 10 Jahren entsprechend den Regeln der guten wissenschaftlichen Praxis (Archivierung) und der Langzeitarchivierung für Zeiträume von über 25 Jahren unterschieden.
Dies stellt spezielle Herausforderungen an Ihre Daten. Für die Archivierung der Daten sollten diese möglichst in einem offenen, nicht proprietären Format vorliegen. Sollte eine Migration in ein offenes Format technisch nicht möglich sein, dann muss die Software, mit der die Daten erzeugt bzw. geöffnet werden können, auch archiviert werden. Gegebenenfalls muss die gesamte Softwareumgebung archiviert werden (Virtualisierung), um die Nutzbarkeit der Forschungsdaten sicherzustellen. Damit ist ein großer Aufwand verbunden, weshalb die Archivierung der Daten schon vor Projektbeginn mitbedacht werden sollte.
Die Langzeitarchivierung birgt noch mehr technische Hürden, da sich Soft- und Hardware in einem Zeitraum von über 25 Jahren stark verändern. Um Daten über so einen langen Zeitraum nutzbar zu halten, ist eine stetige Migration in nutzbare Formate notwendig. Technische Lösungen, wie Rosetta, übernehmen diesen Schritt für Sie, die bisher unterstützten Formate sind jedoch begrenzt.
Repositorien sind Daten- und Dokumentenserver, auf denen wissenschaftliche Forschungsergebnisse in Form von Publikationen und Forschungsdaten abgelegt und zugänglich gemacht werden können. Durch die Vergabe von Metadaten ist es möglich, diese (Daten)Publikationen über Suchmaschinen auffindbar zu machen. In der Regel wird zudem ein persistenter Identifikator vergeben (DOI), so dass die Publikation nachhaltig verlinkt ist. Es gibt fachspezifische und fachübergreifende Repositorien welche über die Suchmaschine Registry of Research Data Repositories (re3data) aufgefunden werden können. Bei der Wahl eines geeigneten Repositoriums hilft der Forschungsdatenservice der TU Dortmund gerne.
Auch die TU Dortmund betreibt zwei Repositorien:
- TUDOdata ist das Daten-Repositorium der TU Dortmund. Hier können Angehörige der TU Dortmund Forschungsdaten und -ergebnisse sicher speichern und für andere Forschende zur Verfügung stellen. Eine Anleitung mit einer Sammlung an häufig gestellten Fragen finden Sie hier.
- Eldorado ist primär auf die Speicherung und Veröffentlichung von Dokumenten und Publikationen ausgelegt.
Die Relevanz der Daten als Basis für zukunftsfähige Wissenschaft und die Schwierigkeit von fachübergreifenden Lösungen, wurde auch von der Politik erkannt. Beauftragt durch die Gemeinsame Wissenschaftskonferenz (GWK) hat der Rat für Informationsinfrastrukturen daher 2016 den Aufbau einer Nationalen Forschungsdateninfrastruktur (NFDI) vorgeschlagen. Finanziert durch Bund und Länder entsteht diese derzeit als bundesweit verteiltes Kompetenz- und Infrastrukturnetzwerk, das die Bereitstellung und Erschließung von Forschungsdaten für die Wissenschaft sicherstellen soll.
Die Grundsätze des Forschungsdatenmanagements an der TU Dortmund erklären das Selbstverständnis und die Verantwortung der Forschenden an der TU Dortmund im Umgang mit Daten. Wenn Sie Hilfe bei der Umsetzung benötigen, dann wenden Sie sich gerne an den Forschungsdatenservice der TU Dortmund, wir entwickeln mit Ihnen ein Konzept, um die Grundsätze des FDM auf Ihren Forschungsprozess anzuwenden.
Serviceleistungen und Ansprechpersonen
Der Forschungsdatenservice der TU Dortmund unterstützt alle Forschenden bei Umgang mit Ihren Daten – von Promotions- bis zu Verbundprojekten. Wir beraten Sie gerne zu allen Fragen rund um den Umgang mit Forschungsdaten. Anhand Ihres Bedarfs entwickeln wir gemeinsam eine Strategie, um die Nachhaltigkeit Ihrer Forschungsdaten entlang der Regeln der guten wissenschaftlichen Praxis zu sichern. Kontaktieren Sie uns gerne über unsere zentrale E-Mail-Adresse und vereinbaren Sie einen Beratungstermin.