Niedersächsische Staats- und Universitätsbibliothek Göttingen (SUB)
Text+ Zentrum:
Zentrumstyp: Daten-/Kompetenzzentrum
Mit ihrem derzeit rund 9 Millionen Medieneinheiten umfassenden Bestand zählt die SUB zu den größten Bibliotheken in Deutschland. Sie stellt umfassende Angebote für die Archivierung und Bereitstellung von geistes- und kulturwissenschaftlichen Forschungsdaten zur Verfügung. Gemeinsam mit der eResearch Alliance, der GWDG, dem Rechenzentrum der Max-Planck-Gesellschaft und der Georg-August-Universität Göttingen, fungiert die SUB Göttingen als Datenzentrum insbesondere für textbasierte Forschungsdaten. Darüber hinaus komplettieren eine umfassende FDM-Beratung sowie ein Data Depositing-Dienst für generische Forschungsdaten das Portfolio.
In Text+ ist die SUB Teil der Datendomänen Editionen und Collections. Zudem ist die SUB der führende Partner in der Domäne Infrastruktur/Betrieb, die sich unter anderem um die Bereitstellung einer FAIR-konformen Plattform für generische Dienste und die Verknüpfung existierender und in Entwicklung befindlicher Daten- und Diensteportfolios der Datendomänen kümmert.
Zusätzlich bietet die SUB Text+ Zugang zu drei Datenrepositorien: GRO.data, DH-rep und TG-rep. Das Göttingen Research Online Data Repository (GRO.data) ist ein disziplinunabhängiges Datenrepositorium für die Veröffentlichung von Forschungsdaten am Campus Göttingen. Das DARIAH-DE Repository (DH-rep) ist ein digitales Langzeitarchiv für geistes- und kulturwissenschaftliche Forschungsdaten. Das TextGrid Repository (TG-rep) ist ein digitales Archiv zur Erhaltung von Forschungsdaten aus den mit textuellen Forschungsdaten arbeitenden Geisteswissenschaften. Es umfasst die Digitale Bibliothek von TextGrid, die Werke von 700 Autoren der Belletristik (Prosa, Lyrik und Drama) sowie Sachliteratur vom Beginn des Buchdrucks bis zum frühen 20. Jahrhundert in deutscher Sprache oder Übersetzung.
Highlights bereitgestellter Daten und Dienste
- Research Data Management Organizer (RDMO): Ein Tool, um dynamische Datenmanagementpläne zu erstellen und zu verwalten, mit welchen die systematische Organisation von Forschungsdaten geplant und dokumentiert werden kann
- European Literacy Text Collection (ELTeC): Eine Sammlung von Korpora in über 15 europäischen Sprachen
- Modes of Narration and Attribution Pipeline (MONAPipe): Bereitstellung von Werkzeugen zur Verarbeitung natürlicher Sprache für Deutsch, implementiert in Python/spaCy
Entgegennahme Daten Dritter
Sofern Forschungsdaten als Self Deposit übernommen werden sollen, können das TG-rep, das DH-rep sowie GRO.data frei genutzt werden. Eine Unterstützung beim Ingest kann im Helpdesk angefragt werden.
Kontakt
Ansprechperson für Text+: TextGrid Repository, DARIAH-DE Repository und GRO.data