Zum Inhalt
DATA CHAMPION: FORSCHUNGSDATENMANAGEMENT IM KONSORTIUM NFDI4CAT

„Seien Sie offen für abstrakte Konzepte wie Ontologien und Metadatenstandards“

© BCI​/​TU Dortmund

Prof. Norbert Kockmann von der Fakultät Bio- und Chemieingenieurwesen leitet die Arbeitsgruppe „Apparate Design“ und entwickelt mit seinem Team Werkzeuge und Schulungsmaterialien für die Dokumentation von Forschungsdaten. Diese fließen auch in das Angebot der „NFDI4Cat“ ein, einem Konsortium innerhalb der Initiative Nationale Forschungsdateninfrastruktur (NFDI), welches das Management von Forschungsdaten für das Forschungsfeld der Katalyse und Prozesstechnik untersucht und weiterentwickelt. Im Interview berichtet Prof. Kockmann unter anderem von der Entwicklung und den Vorteilen gemeinsamer Vokabulare in der Wissenschaft.

Herr Prof. Kockmann, warum engagieren Sie sich im Konsortium NFDI4Cat der Nationalen Forschungsdateninfrastruktur (NFDI)?

NFDI4Cat hat sich zum Ziel gesetzt, die digitale Zukunft des interdisziplinären Forschungsfeldes der Katalyse sicherzustellen. Aufgrund unserer Tätigkeit in der Prozesstechnik und im Apparate Design habe ich mich da wiedergefunden, weil es sich um ein Querschnittsthema handelt, welches zudem die Übertragbarkeit und Austauschbarkeit von Daten beinhaltet. In dem Bereich sehe ich Handlungsbedarf, da Daten zwar gewonnen und publiziert, aber nur selten ausgetauscht und konserviert werden. Zudem sind sie in den meisten Fällen nur schwer auffindbar. Das Prinzip FAIRe Daten (findable=auffindbar, accessible=zugänglich, interoperable=interoperabel, reusable=wiederverwendbar), soll in der NFDI in die Realität umgesetzt werden, und das ist eine spannende Aufgabe. Wir entwickeln Werkzeuge und Schulungsmaterialien, um Daten FAIR zu gestalten. Die Forschenden werden so achtsamer mit ihren Daten umgehen, und ich denke, die Publikationskultur wird sich dadurch ändern, dass man besser auf bestehende Daten zugreifen kann. Zudem wird die Qualität neu gewonnener Daten hinsichtlich ihrer Reproduzierbarkeit von Experimenten und Wiederverwertung in der Forschung erhöht, und dies trägt stark zur Qualität und Weiterentwicklung der Forschung an sich bei.

Zu den FAIRen Daten gehören auch Ontologien und Metadaten. Warum sind diese für die Wissenschaft von Bedeutung?

Metadaten beschreiben ein Forschungsgebiet in einer standardisierten Form, wodurch eine gemeinsame Sprache für die Kommunikation mit anderen Forschenden gewährleistet wird. Ontologien bieten die Möglichkeit, Daten strukturiert abzulegen, sodass sie sowohl für Menschen als auch für Maschinen auffindbar und interpretierbar werden. Dadurch wird das Arbeiten mit Daten vereinfacht, was gerade in der heutigen Zeit von großer Bedeutung ist, da immer mehr Daten produziert werden und der Austausch untereinander, zum Beispiel mit anderen Forschungsgruppen, immer wichtiger wird. Ontologien sind im Prinzip wie eine Sprache aufgebaut, mit der sich Zusammenhänge beschreiben lassen. Es geht also über ein reines Vokabular hinaus. Deswegen werden Ontologien gerne als wesentliche Grundlage für Künstliche Intelligenz verstanden, weil sie neben den reinen Begriffen zusätzliche Informationen enthalten. Ontologien werden von Expert*innen entwickelt, aber die daraus entstehenden Werkzeuge sind für alle Forschenden nutzbar, und zwar in allen Fachbereichen. Andere Forschende möchte ich ermutigen, offen für abstrakte Konzepte wie Ontologien und Metadatenstandards zu sein. Wenn man sich damit mal beschäftigt und die vorhandenen Werkzeuge nutzt, kann man schnell einen Vorteil für die eigene Forschung daraus ziehen. Das ist wie eine neue Sprache zu lernen, da denkt man auch über die eigene Muttersprache noch mal neu nach und lernt diese noch besser kennen. Genau so ist es auch mit Ontologien oder mit Metadatenstandards, die in Ontologien abgebildet sind. Seinen eigenen Forschungsraum noch mal mit neuen Augen zu sehen, ist eine Bereicherung.

Auch die TU Dortmund hat die Bedeutung von Ontologien erkannt und sich der Allotrope Foundation angeschlossen. Wie es dazu gekommen?

Die Allotrope Foundation sitzt in den USA und ist ein gemeinnütziger Verein, der im Wesentlichen mit Firmen im Bereich Medizinforschung und Medikamentenentwicklung zusammenarbeitet. Ziel der Allotrope Foundation ist, dass Daten aus medizinischen Studien standardisiert zwischen Firmen und Institutionen ausgetauscht werden können und ein durchgängiger Datenfluss entsteht. Und ein solcher Datenfluss ist nicht nur in der medizinischen Forschung wichtig, sondern auch für uns. Wir wurden von der Allotrope Foundation angesprochen, weil wir ähnliche Werkzeuge benutzen, und wir arbeiten seit Anfang 2024 zusammen. Alle Mitglieder einigen sich in einem bestimmten Bereich auf das gleiche Vokabular, dem ein einheitliches Vorgehen hinsichtlich der Definition zugrunde liegt. Auf diese Weise werden Daten übertragbar: Man kann sie gegenseitig verstehen und sie sind interoperabel. Das gemeinsame Vokabular spart sehr viel Arbeit und Zeit – und es ist fehlerärmer. Ich kann den Daten eher vertrauen, wenn sie ontologisch abgesichert sind. Durch die geringere Fehlerquote erreicht die Datenqualität ein höheres Niveau.

Zur Person:

  • langjährige Erfahrung in Forschung und Entwicklung im akademischen und industriellen Umfeld, zum Beispiel im Anlagenbau oder der chemischen Apparateentwicklung
  • Seit 2011 Professor für Apparatedesign, Fakultät Bio- und Chemieingenieurwesen an der TU Dortmund
  • Seit 2020 Partner und Mit-Antragsteller im Konsortium NFDI4Cat der NFDI, verantwortlich in der Task Area zu Metadaten-Standards und Ontologie-Entwicklung

Prof. Kockmann wird als Data Champion porträtiert, weil er in seiner Arbeitsgruppe Werkzeuge entwickelt, die es anderen Forschenden möglich machen, ihre Daten mit strukturierten Metadaten zu versehen und ihre Daten auffindbar und wiederverwendbar zu machen.

Weitere Informationen:

Zur Website NFDI4Cat
Zur Website der Allotrope Foundation
Zur Website des Forschungsdatenmanagements