Finden & Nachnutzen

Was sind offene Daten, was sind FAIRe Daten?

Offene Daten – Open Data – k?nnen ohne Einschr?nkungen genutzt und verbreitet werden. Die M?glichkeiten der Weiterverwendung sind dabei über offene Lizenzen – meist Creative Commons – kenntlich. [7]

Da es aus verschiedenen Gründen (z. B. Datenschutz oder wirtschaftliche Verwertungsinteressen) oft nicht m?glich ist, Prim?rdaten komplett offen zur Verfügung zu stellen, ist das Ziel bei der Ver?ffentlichung von Daten, diese m?glichst FAIR zug?nglich zu machen.

Die FAIR-Prinzipien besagen, dass Forschungsdaten auffindbar (findable), zug?nglich (accessible), interoperabel (interoperable) und wiederverwendbar (reuseable) ver?ffentlicht werden sollen. Sollen also sensible Daten zug?nglich gemacht werden, ist die Ablage in einem Repositorium, dass eine Datennutzung nur nach vorheriger Authentifizierung und Autorisierung erm?glicht, im Einklang mit den FAIR-Prinzipien.

Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
 

Wo finde ich nachnutzbare Daten?

Oft werden Forschungsdaten in Repositorien abgelegt. Um passende Repositorien aufzufinden, stehen u. a. Re3Data, OpenDOAR und RIsources zur Verfügung. 

Um direkt nach Forschungsdaten zu suchen, k?nnen z. B. die Suchmaschinen DataCite Commons, das European Union Open Data Portal, B2FIND oder Google Dataset Search genutzt werden.

Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
 

Erheben & Aufbereiten

Wozu dient ein Datenmanagementplan (DMP)? Wie kann ein DMP erstellt werden?

Mit einem Datenmanagementplan (DMP) wird der Umgang mit Forschungsdaten w?hrend und nach Abschluss eines wissenschaftlichen Projekts beschrieben. Ein DMP ist ein sinnvolles Hilfsmittel, das der Projektleitung und allen Projektbeteiligten über die gesamte Dauer und den Forschungsdatenlebenszyklus hinweg den ?berblick über Datenhaltung und -verwaltung erm?glicht.

Die Erstellung eines DMP kann unabh?ngig davon, ob eine Publikation der Daten angestrebt wird, sinnvoll sein, da Lücken und Unklarheiten in Bezug auf den Umgang mit den erstellten Forschungsdaten frühzeitig und umfassend ausger?umt werden k?nnen. Die Art der Daten, der dafür ben?tigte Speicherplatz sowie Zugriffsrechte w?hrend und nach Ende des Projekts sind ein paar Aspekte, die in einem DMP gekl?rt und dokumentiert werden k?nnen.

Mehrere Forschungsf?rdereinrichtungen fordern Angaben zum Umgang mit Forschungsdaten in Antr?gen. Meist wird dabei kein formaler DMP erwartet, die Umsetzung dieser F?rderbedingung kann mit einem DMP jedoch erleichtert werden. Die Vorgaben der forschungsf?rdernden Institutionen sind auf der Informationsplattform forschungsdaten.info in einer ?bersicht dargestellt.

Ein verbreitetes Tool zur Erstellung eines DMP ist der Research Data Management Organiser (RDMO). Frei verfügbare Installationen werden von forschungsdaten.info und NFDI4Ing zur Verfügung gestellt. Der Login ist jeweils u. a. mit Ihrer ORCID ID m?glich.

Die Deutsche Forschungsgemeinschaft (DFG) bietet eine Checkliste zum Inhalt eines DMP. Die Plattform DMPonline, die ebenfalls zur Erstellung von DMP genutzt werden kann, führt eine Liste mit ?ffentlich einsehbaren DMP, die als Beispiele genutzt werden k?nnen (nicht qualit?tsgeprüft).

Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
 

Wie lassen sich Daten organisieren?

Eine von vornherein geregelte Strukturierung, Dokumentation und Sicherung der Forschungsdaten kann für eine erhebliche Reduzierung von Aufwand und Zeit in der allt?glichen Forschungsarbeit sorgen. Dazu z?hlen so grundlegende Festlegungen wie eine klar geregelte Ordnerstruktur und -benennung im Rahmen eines Projekts, die für alle Beteiligten bindend ist. Empfehlenswert ist dabei eine Ordnerhierarchie, die aus h?chstens drei Ebenen besteht. Au?erdem sollte eine klare Regelung für die Datenl?schung nach Projektende getroffen werden. Alle Festlegungen sollten dabei schriftlich dokumentiert und allen Projektbeteiligten bekannt und jederzeit zugreifbar gemacht werden.

Für die erhobenen Daten(s?tze) selbst ist es entscheidend, Ver?nderungen durch eine funktionale Versionskontrolle nachvollziehbar zu machen. Dies kann durch eine pr?zise Benennungskonvention erreicht werden, in der eine Versionsnummer und das ?nderungsdatum (bestenfalls in der Form YYYYMMDD) enthalten ist. Final bearbeitete Datens?tze sollten eine entsprechende Kennzeichnung erhalten. Um Datenverlust m?glichst zu vermeiden, empfiehlt es sich, regelm??ig Versionen, die nicht gel?scht oder ver?ndert werden dürfen, an einem weiteren Speicherort zu sichern.

Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
 

Ver?ffentlichen & Archivieren

Warum sollen Forschungsdaten ver?ffentlicht werden?

Die Ver?ffentlichung von Forschungsdaten dient v. a. der guten wissenschaftlichen Praxis und wird an mehreren Stellen des Kodex Leitlinien zur Sicherung guter wissenschaftlichen Praxis der Deutschen Forschungsgemeinschaft (DFG) adressiert.

Besonders relevant ist dafür Leitlinie 12: Dokumentation, die beschreibt, dass zur Bewertung und ?berprüfung von Forschungsergebnissen s?mtliche relevanten Informationen zu deren Entstehung nach fachspezifischen Standards dokumentiert werden müssen. Dabei sind Ma?nahmen zum Schutz vor Manipulation zu treffen und Dritten der Zugang zu diesen Informationen zu erm?glichen. Neben Forschungsdaten betrifft dies u. a. auch Methode, Auswertung und Analyse sowie Quellcode von Forschungssoftware.

In Leitlinie 13: Herstellung von ?ffentlichem Zugang zu Forschungsergebnissen wird eingangs dargelegt, dass es in Einzelf?llen begründet sein kann, Ergebnisse nicht zu ver?ffentlichen. Forschende treffen eigenverantwortlich und auf Grundlage von Gepflogenheiten des jeweiligen Fachgebiets die Entscheidung der Ver?ffentlichung. Forschungsdaten sollen dabei unter Berücksichtigung der FAIR-Prinzipien (s. auch Abschnitt “Wie k?nnen Forschungsdaten FAIR ver?ffentlicht werden?”) in zuverl?ssigen Repositorien zug?nglich gemacht werden.

Der Umgang mit Forschungsdaten wird au?erdem u. a. in Leitlinie 10: Rechtliche und ethische Rahmenbedingungen, Nutzungsrechte und Leitlinie 17: Archivierung geregelt. Einen ?berblick zu den Aussagen des Kodex zu Forschungsdaten gibt die Informationsplattform forschungsdaten.info
 

Wie k?nnen Forschungsdaten FAIR ver?ffentlicht werden?

Die FAIR-Prinzipien besagen, dass Forschungsdaten auffindbar (findable), zug?nglich (accessible), interoperabel (interoperable) und wiederverwendbar (reuseable) ver?ffentlicht werden sollen.

Um die Auffindbarkeit zu gew?hrleisten, müssen die Daten u. a. mit umfangreichen Metadaten beschrieben werden und einen persistenten Identifikator (z. B. DOI) bekommen. Au?erdem ist die Indexierung der (Meta-)Daten in einer Suchmaschine oder Datenbank notwendig.

Die Zug?nglichkeit zu den (Meta-)Daten soll über ein standardisiertes und offenes Kommunikationsprotokoll m?glich sein, das bei Bedarf eine Authentifizierung und Autorisierung erm?glicht. Die Metadaten bleiben abrufbar, auch wenn die Verfügbarkeit der eigentlichen Forschungsdaten nicht (mehr) gegeben ist.

Im Kontext der Interoperabilit?t werden die genutzten Sprachen und Vokabularien für die (Meta-)Daten beschrieben. Au?erdem sollen die (Meta-)Daten jeweils sinnvoll mit weiteren (Meta-)Daten verknüpft werden.

Die Wiederverwendbarkeit zielt v. a. auf die Beschreibung der Daten ab. Dabei sind der Entstehungskontext der Daten, die Verwendung einer Nutzungslizenz sowie fachspezifische Standards zu berücksichtigen.

Diese und weitere ausführliche Informationen zu den FAIR-Prinzipien sowie Erl?uterungen zu ihrer Umsetzung bietet GO FAIR.
 

Wo k?nnen Forschungsdaten ver?ffentlicht werden?

Zur reinen Beschreibung komplexer und bedeutsamer Datens?tze eignen sich Artikel in Data Journals. Analog zu klassischen Forschungsartikeln in wissenschaftlichen Journals durchlaufen sie ein Begutachtungsverfahren. Einen ?berblick über Data Journals bietet u. a. das Portal forschungsdaten.org. [8]

Der beschriebene Datensatz sollte separat in einem geeigneten Repositorium ver?ffentlicht werden. Bei der Auswahl sind fachspezifische Standards und Vorgaben der F?rderinstitutionen oder von Verlagen zu beachten. Auch eine angestrebte Langzeitarchivierung sollte berücksichtigt werden.

Wenn ein passendes fachliches Repositorium existiert, sollte die Ver?ffentlichung der Forschungsdaten dort erfolgen. Die Verzeichnisse Re3Data und RIsources erm?glichen eine fachspezifische Suche nach Repositorien. 

Stehen keine geeigneten fachlichen Repositorien zur Verfügung, k?nnen generische Repositorien genutzt werden, z. B. Zenodo.

Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.
 

Welche Dateiformate eignen sich für Nachnutzung und Langzeitarchivierung?

Um die langfristige Nachnutzbarkeit Ihrer Forschungsdaten zu gew?hrleisten, sollten Sie für die Ver?ffentlichung Dateiformate nutzen, die mit verschiedenen Systemen kompatibel, m?glichst langfristig archivierbar und verlustfrei konvertierbar sind.

Bei der Datenerhebung werden i. d. R. spezielle Programme verwendet, die in den Fachgebieten verbreitet und auf die Erhebungsmethode gezielt ausgerichtet sind. Dabei werden meistens eigene Dateiformate genutzt. Steht eine Exportfunktion zur Verfügung, die eine Speicherung in einem alternativen, nach den oben genannten Kriterien für die Ver?ffentlichung besser geeigneten Dateiformat erm?glicht, sollte diese genutzt werden. Die Informationsplattform forschungsdaten.info hat eine ?bersicht zu Dateiformaten erstellt, die sich für eine Ver?ffentlichung langfristig oder mittelfristig eignen oder als ungeeignet angesehen werden.

Wenn eine Konvertierung in ein anderes Dateiformat notwendig ist, muss die Entscheidung getroffen werden, ob diese Konvertierung verlustfrei, verlustbehaftet oder sinnhaft erfolgen soll. Eine verlustbehaftete Konvertierung kann gegenüber einer verlustfreien Konvertierung von Vorteil sein, wenn eine geringere Dateigr??e angestrebt wird. Erfolgt diese verlustbehaftete Konvertierung so, dass alle wesentlichen Inhalte erhalten bleiben (also sinnhaft), kann dies ausreichend sein.

Diese und weitere Informationen finden Sie auf der Informationsplattform forschungsdaten.info.