Standardisierung
Für FAIRe Forschungsdaten ist die Orientierung an etablierten und weit verbreiteten Standards für Objekt- und Metadaten essentiell. Insbesondere zur Gewährleistung von Auffindbarkeit, Interoperabilität und Nachnutzbarkeit in einer ortsverteilten Infrastruktur wie der in Text+ sind einheitliche Formate und Standards über die Repositorien hinweg unerlässlich.
Text+ verfolgt im Hinblick auf Datenstandards mehrere Ziele:
- Mittels Veranstaltungen und Beratung zum Forschungsdatenmanagement (z. B. durch den Text+ Helpdesk) soll die data literacy in der Community im Bezug auf Standards erhöht werden.
- Zahlreiche Mitarbeitende von Text+ sind in nationalen und internationalen Standardisierungsgremien aktiv, um Standards (weiter) zu entwickeln und zu etablieren.
- Die GND-Agentur Text+ unterstützt Projekte, die im Rahmen des NFDI-Konsortiums Text+ gefördert werden, dabei ihre Forschungsdaten als Normdaten in die Gemeinsame Normdatei einzubringen.
Standards für Text- und Sprachdaten
Damit Forschende mit den von Text+ zur Verfügung gestellten Daten gut arbeiten können, dokumentieren die Text+ Zentren die in ihren Ressourcen jeweils angewendeten Standards ausführlich. Doch auch bei der Übernahme von Daten steht die Datenqualität – und damit auch die verwendeten Standards – im Mittelpunkt. Darum erfolgt im Vorfeld der Datenübernahme stets ein ausführliches bilaterales Beratungsgespräch zwischen den Datengebenden und Mitarbeitenden des zuständigen Text+ Zentrums.
Allgemeine Informationen zu gängigen Standards für Sprach- und Textdaten stellt Text+ in mehreren Publikationen zur Verfügung:
- Standards und bevorzugte Datenformate für Korpora und Textsammlungen – sowohl für Meta- und Objektdaten als auch für Datenpakete – wurden in diesem Papier zusammengetragen: https://zenodo.org/doi/10.5281/zenodo.12800179.
- Empfehlung zur Erstellung, Bearbeitung und Publikation FAIRer Forschungsdaten in der Datendomäne Editionen - A Living Handbook über das How-to der Bewertung und Gewährleistung FAIRer, qualitativ hochwertiger editionswissenschaftlichen Forschungsdaten.
- Overview of writing systems and character encoding standards and article formats used in the domain: https://doi.org/10.5281/zenodo.13867283.
Anwendungsbeispiele
Hier finden Sie Beispiele für einen gelungenen Einsatz von Standards im Bereich der Text- und Sprachdaten:
GND-Agentur
Die GND-Agentur Text+ ist ein Service, der im Rahmen des NFDI-Programms Text+ an der SUB Göttingen aufgebaut wird. Als Partner der GND (Gemeinsame Normdatei) fungiert die Agentur als zentrale Anlaufstelle zunächst für geistes- und kulturwissenschaftliche Projekte, die im Rahmen des NFDI-Konsortiums Text+ gefördert werden. Mehr zur GND-Agentur befindet sich hier:
Standardisierungsgremien
Mitglieder von Text+ bringen sich aktiv in unterschiedliche Gremien und Organisationen ein, die die Weiterentwicklung anerkannter Standards betreiben.
- DIN – Deutsches Institut für Normung
- DINI – Deutsche Initiative für Netzwerkinformation e.V. (Letter of Support, PDF)
- IIIF – International Image Interoperability Framework
- ISO – International Organization for Standardization
- RDA – Research Data Alliance (Letter of Support, PDF)
- TEI – Text Encoding Initiative
- W3C – World Wide Web Consortium