Zitationsvorschlag
Lizenz (Kapitel)

Dieses Werk steht unter der Lizenz Creative Commons Namensnennung - Weitergabe unter gleichen Bedingungen 4.0 International.
Identifier (Buch)
Veröffentlicht
Nachnutzbar, aber nicht reproduzierbar. Abgeleitete Textformate für die Arbeit mit urheberrechtsbewehrten Texten
Der vorliegende Bericht behandelt die Herausforderungen und Lösungsansätze im Umgang mit urheberrechtlich geschützten Texten in der wissenschaftlichen Forschung. Trotz der Einführung der Text und Data Mining-Schranke (§60d UrhG) im Jahr 2018 bleiben zahlreiche Einschränkungen bestehen, die die freie Nutzung dieser Ressourcen durch Forschende verhindern. Bibliotheken, die den gesetzlichen Auftrag haben, ihre Sammlungen der Allgemeinheit zugänglich zu machen, engagieren sich daher u. a. in Text+, einem Konsortium der Nationalen Forschungsdateninfrastruktur. Text+ zielt darauf ab, sprach- und textbasierte Forschungsdaten dauerhaft zu bewahren
und für die Forschung verfügbar zu machen. Ein zentraler Ansatz dabei ist die Nutzung abgeleiteter Textformate (ATFs), die mittels Methoden des Text- und Data Minings erstellt werden. Mit ATFs können Forschungsfragen beantworten werden, ohne die Rechte der Urheberrechtsinhaber zu beeinträchtigen. Die Herstellung von ATFs erfolgt durch Anreicherungen wie Part-of-Speech-Tagging und Lemmatisierung und durch anschließende gezielte Informationsreduktion, die eine Rekonstruktion des Ausgangstextes verhindert. In Text+ arbeiten verschiedene Universitäten und außeruniversitäre Einrichtungen an der Standardisierung und rechtlichen Klärung von ATFs. Zudem werden Tools und Textkorpora bereitgestellt, die nur in Form von ATFs veröffentlicht werden dürfen. Das Projekt
fördert auch die Forschung zur Eignung und Rekonstruierbarkeit von ATFs und betreibt Disseminationsmaßnahmen, um das Thema einer breiteren Öffentlichkeit zugänglich zu machen. Die DNB untersucht zudem im Projekt CORAL die Möglichkeit, Sprachmodelle mit ATFs zu trainieren, ohne Originaltexte reproduzieren zu können. Durch diese Aktivitäten
möchten die beteiligten Bibliotheken ihre Relevanz für die Forschungsgemeinschaft unterstreichen und sich weiter als wertvolle Partner der Wissenschaft etablieren.
Keywords: Abgeleitete Textformate, Urheberrecht, NFDI, Text+

