Automatisierte Texterkennung – Datenerhebung via OCR/HTR
Mithilfe von maschineller Texterkennung (OCR) werden Texte aus digitalen Bildern automatisiert erfasst und auf diese Weise durchsuchbare und analysierbare Daten erzeugt. Die Universitätsbibliothek Mannheim blickt auf langjährige Erfahrung in der Digitalisierung und mit der Anwendung verschiedenerTexterkennungssoftware zurück.
Gerne unterstützt das Forschungsdatenzentrum Forschende der Universität Mannheim entlang des gesamten Workflows von der Digitalisierung über die Layout- und Texterkennung sowie dem Nachtraining spezialisierter Modelle bis hin zur Strukturierung der Daten.
Services
- Beratung zur maschinellen Texterhebung für Forschungsprojekte
- OCR Recommender
- Offene OCR-Sprechstunde: jeden 2. Donnerstag im Monat, von 15 bis 16 Uhr, ohne Anmeldung (Link zum Zoom-Meeting: https://ocr-bw.bib.uni ..., Meeting ID: 682 8185 1819, Kenncode: 443071)
Projekte und Kooperationen
- Kooperationsprojekt zur Texterkennung und Datenstrukturierung mit Lehrstuhl für Wirtschaftsgeschichte (Prof. Streb)
- Kooperationsprojekt zur Handschriftenerkennung mit Lehrstuhl für Spätmittelalter und Frühe Neuzeit (Prof. Kümper)
Wenn wir Sie unterstützen können oder Sie Fragen haben, zögern Sie nicht uns zu kontaktieren.
Kontakt

Forschungsdatenzentrum (FDZ)
Universitätsbibliothek Mannheim
Schloss Schneckenhof West
68161 Mannheim