Collections

Hintergrundbild: Pexels (Pixabay), https://pixabay.com/de/users/pexels-2286921

Die Datendomäne Collections umfasst sprach- und textbasierte Sammlungen geschriebener, gesprochener oder gebärdeter Sprache und Texte, die auf Grundlage wissenschaftlicher Kriterien erstellt wurden. Dazu gehören beispielsweise Textsammlungen und Korpora, mono- und multimodale Aufnahmen von Sprache, aber auch sprach- und textbezogene Experimental- oder Messdaten. Die Sammlungen werden in der verteilten Infrastruktur von Text+ von verschiedenen, zertifizierten Datenzentren mit je eigenen Spezialisierungen bereitgestellt und sind im Rahmen von Text+ über die Registry wie auch die föderierte Inhaltssuche recherchierbar.

Für den Wissenstransfer und bei Fragen im Umgang mit Collections und deren Vernetzung ist der Helpdesk von Text+ die erste Anlaufstelle. Er dient auch als Kontaktadresse für Projekte, die Interesse an der Integration von Forschungsdaten in die Infrastruktur von Text+ haben.

Besonderes Augenmerk legt die Datendomäne auf rechtliche und ethische Fragestellungen, für die sie innerhalb des Konsortiums und darüber hinaus als Anlaufstelle fungiert. So stehen etwa abgeleitete Textformate, die eine Beforschung urheberrechtlich geschützter Ressourcen ermöglichen, ohne das Urheberrecht zu verletzen, besonders im Fokus. Weitere Schwerpunkte sind die Community-basierte Weiterentwicklung von Software Services, große Sprachmodelle und KI sowie Fragen zu Themen wie Forschungsdatenmanagement oder Standardisierung.

Ansprechpersonen

Sprecher der Datendomäne Collections ist Dr. Peter Leinen, koordiniert wird sie von Philippe Genêt. Beide arbeiten in der Deutschen Nationalbibliothek.

Beteiligte Institutionen

Akademie der Wissenschaften in Hamburg
Albert-Ludwigs-Universität Freiburg
Bayerische Akademie der Wissenschaften
Berlin-Brandenburgische Akademie der Wissenschaften
Deutsche Nationalbibliothek
Deutsches Literaturarchiv Marbach
Eberhard Karls Universität Tübingen
Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen
Heidelberger Akademie der Wissenschaften
Julius-Maximilians-Universität Würzburg
Klassik Stiftung Weimar
Leibniz-Institut für Deutsche Sprache, Mannheim
Ludwig-Maximilians-Universität München
Niedersächsische Staats- und Universitätsbibliothek Göttingen
Universität des Saarlandes
Universität Duisburg-Essen
Universität Hamburg
Universität Trier
Universität zu Köln