E-Science-Tage 2019
Zitierempfehlung (Kapitel)

Lanza, Giacomo et al.: Implementierung der FAIR-Prinzipien im Forschungsdatenmanagement, in: Heuveline, Vincent , Gebhart, Fabian und Mohammadianbisheh, Nina (Hrsg.): E-Science-Tage 2019: Data to Knowledge, Heidelberg: heiBOOKS, 2020. https://doi.org/10.11588/heibooks.598.c8416

Weitere Zitierweisen
Lizenz

Dieses Werk ist unter der
Creative Commons-Lizenz 4.0
(CC BY-SA 4.0)
veröffentlicht.
Creative Commons Lizenz BY-SA 4.0

Identifikatoren (Buch)
ISBN 978-3-948083-14-4 (PDF)
ISBN 978-3-948083-15-1 (Softcover)

Veröffentlicht am 26.03.2020.


Giacomo Lanza , Joachim Erich Meierl , Ulrich Schwardmann , Thomas Wiedenhöfer

Implementierung der FAIR-Prinzipien im Forschungsdatenmanagement

Eine Terminologie-basierte Strategie für die inhaltliche Beschreibung numerischer Faktendatensätze

Abstract

In der Open Science-Ökonomie stellen numerische Faktendaten eine disziplinübergreifende Herausforderung für die praktische Umsetzung der vier FAIR-Prinzipien dar. Die zu erwartende unüberschaubar große Anzahl von Datensätzen und die heute schon in den verschiedenen Disziplinen gängige große Vielfalt an verwendeten Datenformaten und -strukturen sind wesentliche Ursache des Problems. Diese Heterogenität erschwert die Festlegung eines einheitlichen Standards zur Metadaten-Beschreibung und Archivierung von Forschungsdaten unterschiedlichen Ursprungs, und folglich deren Nachnutzung: z.B. sieht das Data-Cite-Metadatenschema keine Felder für eine detaillierte Beschreibung numerischer Faktendaten jenseits der Angabe unkontrollierter Schlagwörter vor. Vor diesem Hintergrund ist bereits das F-Prinzip (Auffindbarkeit) nur eingeschränkt umsetzbar: zielgerichtetes, feingranulares Suchen und präzises Finden auf Datenrepositorien-übergreifender Ebene ist auf dem derzeitigen Stand nicht möglich.

Wir setzen zur Lösung des Problems bei den typischen Eigenschaften numerischer Faktendaten an. Diese sind gekennzeichnet durch Messgrößen, Maßeinheiten, numerische Werteangaben, Rollen (z. B. Messgröße, Messvariable, Messparameter) und, bei quantitativ bewerteter Zuverlässigkeit der Faktendaten, auch die Messunsicherheitsangabe und das Messunsicherheitsmodell. Als Module eines Metrology Terminology Directory (MTD) werden in abgegrenzten Namensräumen kontrollierte Vokabulare für Messgrößen, Maßeinheiten, Messverfahren und verschiedene Charakteristiken von Messobjekten mehrsprachig entwickelt und jeweils über spezifische Persistent Identifiers in einer sogenannten Data Type Registry sprachübergreifend adressierbar gemacht. In von uns neu entwickelten Faktendaten-spezifisch strukturierten Metadatenmodulen dienen diese Vokabulare zur Beschreibung des Faktendatensatzes. Auf diese Weise werden die wesentlichen Eigenschaften numerischer Faktendatensätze für komplexes Suchen und Finden mit geeigneten Retrieval-Werkzeugen zugänglich gemacht.

Durch Implementierung der Metadatenschema-Module seitens der Hersteller von digitalen Messgeräten, digitalen Sensoren, Messdatenverarbeitungs-Software, könnte zukünftig erreicht werden, dass die Metadatenbeschreibung schon bei der erstmaligen analog/digital-Wandlung von Messdaten beginnen und dann über die weitere Verarbeitungskette bis zur Archivierung und Publikation angereichert werden kann. Das würde die Dokumentationsarbeit erleichtern, einen gewissen Qualitätsstandard einführen und somit zu einer effizienten Umsetzung der FAIR-Prinzipien beitragen können. Über eine Pilotrealisierung der MTD und ausgewählter Metadaten-Module werden wir im Vortrag berichten.