Automatisierte Texterkennung – Datenerhebung via OCR/HTR

Mithilfe von maschineller Texterkennung (OCR) werden Texte aus digitalen Bildern automatisiert erfasst und auf diese Weise durchsuchbare und analysierbare Daten erzeugt. Die Universitäts­bibliothek Mannheim blickt auf langjährige Erfahrung in der Digitalisierung und mit der Anwendung verschiedenerTexterkennungs­software zurück.

Gerne unterstützt das Forschungs­datenzentrum Forschende der Universität Mannheim entlang des gesamten Workflows von der Digitalisierung über die Layout- und Texterkennung sowie dem Nachtraining spezialisierter Modelle bis hin zur Strukturierung der Daten.

Services

  • Beratung zur maschinellen Texterhebung für Forschungs­projekte
  • OCR Recommender (in Vorbereitung)
  • Offene OCR-Sprechstunde: jeden 2. Donnerstag im Monat, von 15 bis 16 Uhr, ohne Anmeldung (Link zum Zoom-Meeting: https://ocr-bw.bib.uni-mannheim.de/sprechstunde, Meeting ID: 682 8185 1819, Kenncode: 443071)

In unseren FAQs finden Sie Antworten auf die am häufigst gestellten Fragen rund um das Thema automatisierte Texterkennung sowie die im Projekt OCR-BW genutzte Software.

Wenn die gesuchte Antwort nicht dabei ist, wenden Sie sich einfach per E-Mail an uns.

Projekte und Kooperationen

Wenn wir Sie unterstützen können oder Sie Fragen haben, zögern Sie nicht uns zu kontaktieren.

Kontakt

Larissa Will, M.A.

Larissa Will, M.A.

Referentin für Forschungs­daten­management und Digitalisierung (Digital Humanities)
Universität Mannheim
Universitäts­bibliothek
Schloss Schneckenhof West – Raum SW 273
68161 Mannheim