„Wir wollen einen wissenschaftlichen und gesellschaftlichen Mehrwert aus dem FDM ziehen“
Prof. Stefan M. Kast von der Fakultät für Chemie und Chemische Biologie koordiniert in RESOLV („Ruhr Explores Solvation“), dem gemeinsamen Exzellenzcluster der TU Dortmund und der Ruhr-Universität Bochum, die Task Force Forschungsdatenmanagement (FDM). Er ist zudem Mitglied bei „NFDI4Chem“, einem Konsortium innerhalb der Initiative Nationale Forschungsdateninfrastruktur (NFDI), welches das Management von Forschungsdaten für einen Großteil der chemischen Disziplinen abstimmen möchte. Im Interview berichtet Prof. Kast unter anderem, welche Herausforderungen das FDM auf technischer, personeller und konzeptioneller Ebene mit sich bringt und welche Lösungen bei RESOLV etwa für elektronische Laborbücher und Repositorien erarbeitet worden sind.
Herr Prof. Kast, warum ist eine FDM-Task-Force in einem Exzellenzcluster notwendig und was zeichnet die Arbeit konkret aus?
Forschungsdatenmanagement gehört unter modernen Standards zur guten wissenschaftlichen Praxis, was im Exzellenzcluster RESOLV früh erkannt wurde. Aber anfangs fehlte uns im Cluster der technische und konzeptionelle Rahmen, um nachhaltig mit der Heterogenität der Forschungsdaten umzugehen. Zudem standen wir aufgrund der verschiedenen Forschungsrichtungen vor ganz unterschiedlichen Anforderungen. Deshalb haben wir die Task Force mit Vertreter*innen aus RESOLV gegründet, welche die jeweiligen Methodenbereiche repräsentieren. Die Arbeit in der Task Force ist nicht nur eine technische Herausforderung. Wir wollen vielmehr Forschungsdaten so aufbereiten und verwalten, dass sie einen wissenschaftlichen und gesellschaftlichen Mehrwert schaffen. Durch unsere wöchentlichen Treffen und die Abstimmungen mit dem RESOLV-Board konnten wir nach und nach unsere Anforderungen immer stärker konkretisieren und die für uns relevanten Systeme identifizieren. Ein Problem ist allerdings noch, dass die Relevanz von FDM nicht allen klar ist. Als Task Force müssen wir daher auch sensibilisieren und den Arbeitsgruppen aufzeigen, dass FDM nicht nur ein notwendiges Übel ist, sondern einen echten Mehrwert bietet, indem Daten langfristig nutzbar und verständlich bleiben.
Welche Lösungsansätze für ein bedarfsgerechtes FDM haben Sie in der Task Force bereits erarbeitet?
Um die festgestellten Bedarfe zu decken, haben wir verschiedene Systeme evaluiert und schließlich elektronische Laborbücher (ELNs – Electronic Lab Notebooks) mit erweiterten Laborverwaltungsfunktionen sowie ein zentrales Datenrepositorium mit Metadatenfunktionalität ausgewählt. Das ELN ist dabei, vereinfacht gesagt, unser prototypisches Dokumentationsbuch. ELNs sind immer dann sinnvoll, sobald Prozesse einigermaßen standardisiert sind. Das ist in der synthetischen, also insbesondere in der anorganischen und der organischen Chemie häufig der Fall. Solche Dokumentationsstandards sind wesentlich, um Reproduzierbarkeitskrisen zu verhindern. Wenn etwas maximal reproduzierbar und, im Fall von digital gesteuerten Prozessen oder computergestützten Methoden, automatisierbar ist, kann man daraus qualifizierte – wir sagen auch kuratierte – Daten für das Training von Modellen des Maschinellen Lernens generieren. Als Repositorium haben wir schließlich Dataverse ausgewählt. Unsere zentrale Aufgabe ist weiterhin, dafür zu sorgen, dass die elektronischen Laborbücher und Repositorien routinemäßig ohne große Einstiegsbarriere in die Forschungspraxis eingebunden werden. Daraus entstehen auch die Anforderungen an technische Schnittstellen und Metadaten. Von zentraler Bedeutung ist vor allem, eine einheitliche Definition und Verwendung von Metadaten (wie z.B. Messzeitpunkt, Autorenschaft, eingesetzte Methoden) zu etablieren. Sinnvolle „Vokabulare“ werden zurzeit innerhalb der NFDI entwickelt, befinden sich aber noch in einem frühen Stadium und sind für RESOLV mit seinen besonders interdisziplinären Projekten noch nicht ohne Weiteres verwendbar. Ziel ist es, Prozesse wie Dokumentation und Archivierung der Daten nicht manuell durchführen zu müssen, sondern z.B. Experiment sowie Theorie und Methode automatisch miteinander zu verknüpfen. Das reduziert die Fehleranfälligkeit und erhöht die Nachvollziehbarkeit und Wiederverwendbarkeit von Forschungsergebnissen. Diese Standards einzurichten und das System zu warten, ist allerdings sehr personalintensiv.
Wie können sich die derzeit im Aufbau befindlichen FDM-Tools der Fachkonsortien der Nationalen Forschungsdateninfrastruktur in die FDM-Strategie von RESOLV eingliedern?
Die NFDI-Konsortien entwickeln und evaluieren derzeit noch FDM-Lösungen, die den sehr unterschiedlichen Anforderungen der einzelnen Fachrichtungen gerecht werden. Dass die Heterogenität der Forschungsdisziplinen erkannt wurde und abgebildet werden soll, ist positiv zu bewerten. Aktuell wird daher national und auch lokal auf allen Ebenen nach allgemeingültigen Lösungen gesucht, wie wir dies auch in RESOLV tun. Wissenschaft ist grundsätzlich ein demokratischer Prozess, der nicht durch eine autoritäre Kraft kontrolliert wird. Dennoch ist es eine Governance-Frage, wie der Prozess – in diesem Fall das FDM – gesteuert wird. Wir werden von den RESOLV-Mitgliedern erwarten müssen, dass Standards eingehalten werden. Deshalb ist es wichtig, dass die fachlich Verantwortlichen auch selbst die übergeordneten Konzepte konsequent umsetzen: Daten müssen auffindbar, zugänglich, kompatibel und wiederverwendbar sein. Was sich die Wissenschaftsakteur*innen hierbei an Unterstützung bzw. Richtungsweisung wünschen, wird gemeinsam innerhalb von RESOLV und auch der NFDI reflektiert. So bereichern sich RESOLV und die NFDI wechselseitig.
Zur Person:
- seit 2009 Professor für Theoretische Physikalische Chemie an der TU Dortmund
- 2012 Gründungsmitglied und seitdem Stellvertretender Vorsitzender des Dortmunder Zentrums für Wissenschaftliches Rechnen (DoWiR)
- seit 2018 Dean der “integrated Graduate School Solvation Science” (iGSS) des Exzellenzclusters RESOLV
- seit 2018 Dekan der Fakultät für Chemie und Chemische Biologie an der TU Dortmund
Prof. Kast wird als Data Champion porträtiert, weil er mit seiner Task Force innovative Strategien des Datenhandlings erprobt und das FDM als eigenständige wissenschaftliche Leistung sichtbar machen will.
Weitere Informationen: