Die Text+ Architektur

An der verteilten Infrastruktur von Text+ sind über 30 Institutionen beteiligt. Das führt zwangsläufig zu Komplexitäten, wenn es darum geht, den Aufbau des Verbunds darzustellen.

Bei der bildlichen Darstellung der Architektur handelt sich um eine Sicht auf Text+, die wesentliche technische Komponenten entlang ihrer Funktionen zeigt. Die Architektur besteht aus drei Ebenen – User, Frontend, Backend – und wird ausgehend vom User bzw. einem neuen Datenbestand/neuen Datenzentrum von oben nach unten gelesen.

wissenschafts-
getriebener Dienst aus Datendomäne

wissenschafts-...
wissenschafts-
getriebener Dienst aus Datendomäne

wissenschafts-...





Text+ Portal
Zugang für Nutzer:innen (menschlich, maschinell) zum Such- und Datenraum von Text+,
zu individuellen Diensten, zu Informationen, zu dokumentierten APIs
Use Cases: Daten finden, Daten geben, Dienste nutzen, Informationen finden, Beratung
Text+ Portal...
IAM4NFDI
Identity & Access Management

IAM4NFDI...
TS4NFDI
Terminology Services

(Art der Verbindung zu T+ noch unklar)
TS4NFDI...
SSH Open Marketplace
Text+ Registry harvestet Subset "ACTOR TEXT+"

SSH Open Marketplace...
PID4NFDI
persistente Identifikatoren

(Art der Verbindung zu T+ noch unklar)
PID4NFDI...
GND - Gemeinsame Normdatei
GND - Gemeinsame Normdatei
Academic
ID
IAM
Academic...

Langzeitarchiv

weiterentwickeltes Koala-System, CDStar als Konnektor zwischen Portal und Koala als Fallback für Text+ Datenzentren

Langzeitarchiv...
Knowledge Graph Infrastructures
Knowledge Graph Infrastructures
greifen zu, nutzen,
übermitteln Daten
greifen zu, nutzen,...
Research Data Commons
Research Data Commons

Helpdesk/Consulting
GOTRS: 16 Queues, N Agenten, Text+, CLARIAH-DE, DARIAH-DE, DARIAH-EU; berät zu: allen Angeboten von Text+

Helpdesk/Consulting...
GND-Agentur Text+
GND-Agentur Text+
entityXML
Validierung, Anreicherung mit Normdaten
entityXML...
Indico
Indico

neuer Datenbestand

kann sein: Edition, Sammlung, lexikalische Ressource, perspektivisch weitere Domänen möglich

neuer Datenbestand...
GitLab
GitLab
Pads
Pads
Open
Project

Open...
Frontend
Frontend
User
User
Backend
Backend
Biblio-
graphie

Biblio-...

Rechenzentren, Informationsinfrastruktureinrichtungen

Virtuelle Maschinen, Hosting, Hochleistungsrechnen, Speicher, Basisdienste

Rechenzentren, Informationsinfrastruktureinrichtungen...
Zugangs- und Präsentationsschicht
Zugangs- u...
Daten
Daten
Applikationen/ Dienste
Applikationen/ Dienste
Blog
Blog
Text+ Registry
Normalisierung; Anreicherung;
listenförmige und durchsuchbare Metadaten;
Datenmodellierung;
Entitäten: Editionen, Sammlungen,
 lexikalische Ressourcen, Dienste,+++
Text+ Registry...
Data Processing Pipelines
MONAPipe, JupyterNotebooks
Data Processing Pipelines...
(Daten-)Ingest
Ziel: Übernahme von Daten durch ein
Text+ Datenzentrum oder das LZA
(Daten-)Ingest...
(Daten-)Suche
durchsucht: FCS, Registry, Webseite
(Daten-)Suchedurchsucht: FCS, Registry, Webseite

Text+ Datenzentren (N=34)
stellen bereit: Repositories (Metadaten, Daten), FCS-Endpunkte, Trainingsdaten für LLMs, anwendungsspezifische LLMs, Langzeitarchive

Text+ Datenzentren (N=34)...

externes Datenzentrum

kann sein: FCS-Endpunkt, Lieferant Metadaten f. Registry

kann werden: Text+ Datenzentrum

externes Datenzentrum...

FCS-Endpunkte (N=30 mit 142 Ressourcen)

stellen bereit: Daten, Metadaten

FCS-Endpunkte (N=30 mit 142 Ressou...
LLMs
LLMs
NextCloud
NextCloud
Dienste
wissenschafts-
getriebene Dienste aus Datendomänen

Dienstewissenschafts-...
(tlw. interne) Werkzeuge/Dienste
für die Projektkollaboration
(tlw. interne) Werkzeuge/Dienste...
basale Infrastruktur
basale Inf...
Dienste
Zugänglichmachung der Text+ Dienste
 über die Registry bzw. das Portal
Dienste...
LLMs
Trainingsdaten, eigene Modelle
LLMs...
abgeleitete
Datenformate
stammen aus: Datenzentren, Registry
abgeleitete...
thematische
Cluster
speisen sich aus den 
Datenzentren/-domänen
thematische...
stellen
bereit
stellen...
Daten-
übergabe
Daten-...
unter-
stützt
unter-...
unter-
stützt
unter-...
unter-
stützt
unter-...
durchsucht/
übermittelt
Suchergebnisse
durchsucht/...
Tickets/Cases via Webform, Mail/
Beratung, tlw. in Datendomänen
Tickets/Cases via Webform, Mail/...
Suchintegration Portal
Suchintegration Portal
durchsucht/
übermittelt
Suchergebnisse
durchsucht/...
Dienste via 
Angebotsbeschreibung
 und Registry
Dienste via...
Zugang
Zugang
Initiierung
Dateningest
Initiierung...
Registry
harvestet
SSHOMP
Registry...
Anbindung von Text+
an die AcademicID
sowie IAM4NFDI
Anbindung von Text+...
Rollen:
Identity Provider,
Service Provider
Rollen:...
Integration
ins Text+ Portfolio
Integration...
Kooperationsprojekt
kann sein: neuer Datenbestand, neuer Dienst, neue Funktionalität eines vorhandenen Dienstes
Kooperationsprojekt...
reichern an,
validieren
reichern an,...
Text
Text
beraten,
Diensteentwicklung, Datenmodelle
beraten,...
trägt bei
trägt bei
stellen
bereit
stellen...
Text is not SVG - cannot display

Im Zentrum (rot) steht das Text+ Portal, also die Website des Verbunds. Darunter liegen zentrale Angebote von Text+ wie das Consulting, die Suche nach Daten und Diensten sowie die Möglichkeit, Forschungsdaten an das Konsortium zu übergeben (Datenaufnahme). Viele weitere Dienste und Themen sind jedoch für das Funktionieren von Text+ von zentraler Bedeutung.

Ein besonderes Feature dieser Darstellung besteht darin, dass die einzelnen Komponenten verlinkt sind. Man findet also bspw. von der Bibliographie den direkten Weg zur entsprechenden Seite im Portal. Es handelt sich insofern nicht nur um eine Abbildung von Funktionen, sondern die Abbildung ist selbst funktional.

Changelog