Data Stewardship in grossen Forschungsinfrastrukturen? Finden Sie heraus, wie das im BedrettoLab funktioniert
Rebecca Hochreutener und Dr. Marian Hertrich (BedrettoLab für Geowissenschaften und Geoenergien, D-?ERDW) im vierten Interview der Reihe zu Modellen von Data Stewardship an der ETH Zürich.
- Vorlesen
- Anzahl der Kommentare
Rebecca Hochreutener arbeitet seit August 2021 als Programmadministratorin im BedrettoLab. In ihrer Funktion ist sie für den reibungslosen Ablauf aller Forschungsprojekte im BedrettoLab verantwortlich. Dies beinhaltet sowohl administrative Aspekte als auch das Datenmanagement. Sie ist Data Steward* im Open-Research-Data (ORD)?-Projekt mit der ETH-Bibliothek.
Dr. Marian Hertrich arbeitet seit 2018 als Leiter des BedrettoLabs an der ETH Zürich. In dieser Funktion ist er für die Durchführung der verschiedenen wissenschaftlichen Experimente verantwortlich. Wissenschaftlich besch?ftigt sich Marian insbesondere mit den elastischen Eigenschaften von Gesteinen und deren Ver?nderung w?hrend Stimulationsexperimenten.
Das Interview führte Dr. Julian Dederke (ETH-Bibliothek), der ein?swissuniversities-?Projekt?zur Etablierung von Data-?Stewardship an der ETH Zürich koordiniert. Die F?rderung von Data-?Stewardship ist ein Ziel sowohl der?externe Seite Nationalen Strategie zu offenen Forschungsdaten als auch der externe Seite ORD-?Strategie des ETH-?Bereichs.
Rebecca und Marian, ihr arbeitet zurzeit als Administratorin und Laborleiter. Was sind eure Aufgaben?
Marian: Als Laborleiter bin ich für die Koordination und operative Umsetzung der verschiedenen Projekte im BedrettoLab verantwortlich. Das sind Forschungsprojekte aber auch Infrastruktur-Erweiterungen. Zum Beispiel ist die Datenübertragung vom Labor zur ETH eine Herausforderung, da wir sehr grosse Datenmengen generieren – bis zu 1 Terabyte pro Tag w?hrend der grossen Experimentierphasen.
Rebecca: Neben meiner Verantwortlichkeit für die gesamte Administration des BedrettoLabs bin ich ausserdem mit der administrativen Abwicklung aller Forschungs- und Infrastrukturprojekte betraut. Im Rahmen des Data-Stewardship-Projekts bin ich Data Steward für das BedrettoLab. Dabei bin ich vor allem die Ansprechperson für Datenmanagement und unterstütze zusammen mit Marian die korrekte Speicherung der Forschungsdaten.
Welche Herausforderungen seht ihr bei euren Aufgaben bezüglich Datenmanagement?
Marian: Die grosse Vielfalt der Daten im BedrettoLab und die Menge sind eine grosse Herausforderung. Zudem generieren wir viele Daten, für die es noch keine internationalen Standards gibt. Im Idealfall würden wir uns gerne an der Schaffung dieser Standards beteiligen, was sehr aufwendig sein kann.
Rebecca: Die Entwicklung von Datenmanagementpl?ne mit vielen internationalen Kooperationen ist nicht selbstverst?ndlich. Die Zusammenarbeit erfordert auch den Austausch von Daten, was komplexer sein kann als gedacht, wenn es sich um Terabytes von Daten handelt. Die beste L?sung w?re es, alle Daten aussagekr?ftig annotiert und dokumentiert zu ver?ffentlichen und der wissenschaftlichen Gemeinschaft zur Verfügung zu stellen.
Im Zusammenhang mit deiner Rolle als Data Steward bist du auch im Data Stewardship Network in einer Pilotgruppe von Data Stewards an der ETH Zürich aktiv. Welche Austauschm?glichkeiten haben sich hier bisher für dich ergeben?
Rebecca: Das Data Stewardship Network erm?glicht einen guten Austausch mit anderen Data Stewards, die eine andere Perspektive haben, da sie zum Teil in sehr unterschiedlichen Abteilungen und Forschungsgruppen arbeiten. Der Austausch dieser unterschiedlichen Erfahrungen ist sehr nützlich und hilfreich.
Welche Potenziale seht ihr darin, Data Stewardship in Forschungsgruppen und Labs zu verankern?
Rebecca: Data Stewardship in verschiedenen Forschungsgruppen zu integrieren, ist aus unserer Sicht ein guter bottom-up Ansatz, der sich mit der Zeit etablieren wird. Die Finanzierung dieser Data Stewards sehe ich noch eher kritisch, da die F?rderm?glichkeiten meines Wissens derzeit sehr gering sind.
Welches sind aktuelle Herausforderungen, die den Forschenden am BedrettoLab in Bezug auf das Forschungsdatenmanagement immer wieder begegnen? Was sind hier eure Erfahrungen?
Marian und Rebecca: Die grossen Datenmengen und die Vielfalt der Daten sind immer wieder eine Herausforderung, damit diese sowohl intern als auch von externen Partnern genutzt werden k?nnen. Es erfordert viel Fleissarbeit, die Daten zu organisieren und zu annotieren, damit diese ordnungsgem?ss und nach FAIR-Prinzipien gespeichert und archiviert werden k?nnen. Mangelnde Ressourcen unterstützen diese Umsetzung nicht.
Wie geht ihr vor, um das Datenmanagement im BedrettoLab zu verbessern?
Marian und Rebecca: Wir arbeiten t?glich an L?sungen, um das Datenmanagement im Bedretto-Lab zu verbessern. Dabei konzentrieren wir uns haupts?chlich auf die folgenden Aspekte:
- die Daten zu organisieren und zu annotieren, was viel Fleissarbeit und Zusammenarbeit mit den Forschenden erfordert,
- das Datenmanagementkonzept zu verbessern und zu implementieren und,
- ein übergeordnetes Datenmanagementkonzept zu entwerfen, welches national und international umgesetzt werden kann.
Um Punkte eins und zwei umzusetzen, haben wir eine Stelle als Data Manager für das BedrettoLab ausgeschrieben. Diese Stelle ist hier zu finden.
Für Punkt drei haben wir den Projektantrag DAMOCLES (Data Management Concept for Underground Laboratories) im Rahmen des Open Research Data-Programms von swissuniversities geschrieben. Das Projekt wurde bewilligt und hat am 01. Januar 2024 begonnen.
Um was geht es bei DAMOCLES? Was und wie m?chtet ihr es erreichen?
Ziel von DAMOCLES ist es, ein Datenmanagementkonzept zu entwickeln, das auf die Bedürfnisse und Anforderungen von Untertagelabors zugeschnitten ist.
Tats?chlich werden einzelne Datens?tze heute meist nach akzeptablen Datenmanagement-Standards archiviert.
- Wie k?nnen Datens?tze für integrierte Experimente beschrieben und mit aussagekr?ftigen Metadaten versehen werden?
- Wie k?nnen Daten einfach zwischen verschiedenen Partnern und/oder Untergrundlabors ausgetauscht werden?
- Wie k?nnen Daten für jede und jeden ohne ?graue? Vorkenntnisse verst?ndlich/lesbar und analysierbar gemacht werden?
- Und, schliesslich: Welche L?sungen gibt es für das Streaming und Speichern sehr grosser Datenmengen?
Um diese Fragen zu beantworten, werden wir die Anforderungen der Nutzendengemeinschaft analysieren und eine umfassende Bestandsaufnahme der Sensoren, Daten, Formate und Zugangsbedingungen erfassen. Hardware- und Softwareanforderungen für Speicherung, Datenbanken und Webdienste dieser Gr?sse sind relevante Nachforschungen, um ein Datenmanagementkonzept zu entwickeln, welches den Anforderungen der Untergrundlabore entspricht.
ORD-?Projekt von swissuniversities zum Thema Data ?Stewardship
Im Rahmen der?externe Seite nationalen ORD-Strategie ermutigt swissuniversities alle Forschungsinstitutionen in der Schweiz, Data Stewardship zu f?rdern und entsprechende Anreize zu schaffen. An der ETH Zürich wird dieses Ziel unter anderem mit einem von 2023 bis 2024 laufenden Projekt verfolgt, das von der?ETH-?Bibliothek?koordiniert wird. Alle Informationen zum Thema Data Stewardship?finden Sie auf unserer Website.