Text+ Blog

Das Text+ Blog beschäftigt sich mit Themen rund um die wissenschaftliche Arbeit mit text- und sprachbasierten Forschungsdaten und bietet einen Blick hinter die Kulissen des Konsortiums an. Eine kurze Vorstellung der Ziele und Inhalte des Blogs bietet der Beitrag Text+ bloggt!.

Dies hier sind die drei aktuellsten Beiträge:

Lexi, Paul und Leia – Personas für die föderierte lexikalische Suche

Am 26. Januar 2026 trafen sich elf Expert:innen des Scientific Coordination Committees Lexical Resources und der Task Area Lexical Resources sowie praktisch arbeitende Lexikografinnen des Zentrums für digitale Lexikographie der deutschen Sprache an der Berlin-Brandenburgischen...

Werkstattreihe Standardisierung #05 DeReKo. Vom Rohtext zum linguistisch analysierbaren Korpus – ein praktischer Workflow mit etablierten Tools

Featured image for blog entry Werkstattreihe Standardisierung #05 DeReKo. Vom Rohtext zum linguistisch analysierbaren Korpus – ein praktischer Workflow mit etablierten Tools

Das Leibniz-Institut für Deutsche Sprache (IDS) beherbergt zahlreiche für die Forschung genutzte Korpora. Eine besonders wichtige Ressource ist das Deutsche Referenzkorpus (DeReKo)...

Text+Plus, #09: SwineBad Tool Support: Building an Extraction Pipeline for Historical Tables

Historical newspapers are not only narrative sources, they are structured data archives. Price lists, shipping registers, demographic statistics, and guest lists were often printed in tabular form. Yet despite large-scale digitization efforts, this structured information usually remains locked in scanned page images.