OCR-D: Integration von Kitodo und OCR-D zur produktiven Massendigitalisierung

Kontakt: Stefan Weil
Förderung: Deutsche Forschungs­gemeinschaft (DFG)
Laufzeit: 2021–2023
Projekt­partner: SLUB Dresden, Universitäts­bibliothek Braunschweig

Die DFG fördert im Rahmen des Koordinierungs­projekts OCR-D seit 2015 verschiedene Projekte zur Entwicklung eines Verfahrens zur Massenvolltextdigitalisierung der im deutschen Sprachraum erschienenen Drucke des 16. bis 19. Jahrhunderts. In der aktuellen dritten Förder­phase arbeitet die Universitäts­bibliothek Mannheim daran, den OCR-D-Workflow in Kitodo zur produktiven Massendigitalisierung zu integrieren.

Mit Kitodo steht seit mehreren Jahren eine lizenzfreie Software zur Unterstützung der Massendigitalisierung und des Workflow-Managements von Digitalisierungs­projekten zur Verfügung.  Die UB Mannheim setzt Kitodo seit 2014 ein und ist dabei auch in die Weiter­entwicklung der Software eingebunden.

In Zusammenarbeit mit der SLUB Dresden und der Universitäts­bibliothek Braunschweig beteiligt sich die Universitäts­bibliothek Mannheim an dem Vorhaben, OCR-D und Kitodo wechselseitig zu integrieren. OCR-D soll dabei für den verteilten Betrieb auf einem Web-Server nutzbar gemacht werden. Volltexte können dann im DFG-Viewer dargestellt und „on demand“ bereitgestellt werden.

Ein weiteres Ziel ist es, den Workflow für OCR-D zu optimieren und verstärkt zu automatisieren. So sollen unter anderem Community-Workshops durchgeführt und ein prototypischer Aufbau für einen allgemein verfügbaren OCR-Dienst innerhalb der Kitodo-Community erstellt werden.

Projektseite DFG