INF: Forschungsdatenmanagement und nachhaltige Forschungssoftwareentwicklung
Das INF-Projekt soll sicherstellen, dass a) Forschungsdaten, b) Forschungssoftware und c) Modelle, die im Rahmen von SynTrac entstehen, den sogenannten FAIR-Leitprinzipien entsprechen. Dies Prinzipien fordern, dass sie auffindbar, zugänglich, kompatibel und wiederverwendbar sind. Auf diese Weise unterstützt das INF-Projekt die Regeln guter wissenschaftlicher Praxis, indem es würdigt, dass die Verwaltung und die langfristige Archivierung von Forschungsdaten eng mit der Nachhaltigkeit von Forschungssoftware verbunden sind.
Motivation
Die Projekte von SynTrac sollen mehrere hundert Terabyte an miteinander verbundenen Forschungsdaten produzieren, die über alle beteiligten Standorte verteilt sind. Verschiedene PRs von SynTrac nutzen ihre hauseigene Forschungssoftware und kommerzielle Tools, um diese Daten innerhalb einer komplexen Simulationskette während der Projektzusammenarbeit zu verarbeiten und zu produzieren. Daher ist eines der Hauptziele des INF-Projekts, Daten zusammen mit der eingesetzten Software mit gleicher Bedeutung zu erhalten, um eine effiziente Verwaltung und Nachhaltigkeit sowohl der Daten als auch der verwendeten Software zu ermöglichen.
Ziel
-
- Einrichtung von Richtlinien, Infrastruktur und Workflows zur erleichterten Austausch, Archivierung und Veröffentlichung von SynTrac-bezogenen Daten und Software
- Umgebung zur Handhabung stark sich entwickelnder „hot“ Daten im SynTrac-Zeitplan, um eine effiziente und nachhaltige Zusammenarbeit zu ermöglichen
- Bereitstellung von Forschungsdaten mit der verwendeten Forschungssoftware mittels Metadatenstandards
- Schulung und Unterstützung von SynTrac-Forschern bei der Anwendung von Ansätzen aus:
◦ Leitprinzipien „FAIR – Auffindbarkeit, Zugänglichkeit, Interoperabilität und Wiederverwendbarkeit“
◦ DFG-Projekt „SURESOFT“
Lösungsansatz
Das Projekt beginnt mit der Anforderungsanalyse, die die Überprüfung der Codes und Entwicklungsabläufe gegen SURESOFT-Ansätze für nachhaltige Software, FAIR-Prinzipien und institutionelle Richtlinien umfasst. Die Ergebnisse werden später in den Schulungen verwendet.
Anschließend werden Richtlinien und ein Managementplan erstellt. Eine kombinierte Forschungsdaten- und Forschungssoftwarepolitik wird auf Basis von Richtlinien der TU Braunschweig und der Universität Stuttgart erstellt, wobei Kategorien wie „heiße“ und „kalte“ Daten definiert werden.
Daraufhin werden Schulungen, Beratungen und Unterstützungsleistungen für alle Forscher auf Basis der festgelegten Richtlinien und des Managementplans angeboten. Die Schulungen finden im Rahmen bestimmter Kurse innerhalb des iRTG-Projekts statt.
Das Projekt umfasst auch die Definition eines Metadatenstandards und das Metadatenmanagement. Dies erfolgt durch Arbeitsgruppen, die alle Forschungsbereiche und Disziplinen vertreten.
Zusätzlich werden automatisierte und vereinfachte Workflows für den Austausch und die Veröffentlichung identifiziert, wobei geeignete Tools ausgewählt werden, um die Vorbereitung von Daten und Software auf der Grundlage des vorgeschlagenen Metadatenschemas zu automatisieren.
Schließlich werden Unterstützungsdienste und Evaluationen bereitgestellt. Anforderungen bezüglich digitaler Workflows werden im Rahmen der kontinuierlichen Unterstützung für Forscher evaluiert und formalisiert.