Automated Text Recognition – Extracting Data via OCR/HTR

Automated or optical text recognition (OCR) is used to automatically capture text from digital images and thus generate searchable and analyzable data.

The Mannheim University Library has many years of experience in digitization and with the use of various text recognition software.

The Research Data Center is happy to support researchers at the University of Mannheim along the entire workflow from digitization to layout and text recognition as well as training specialized models and structuring of the data.


  • Consulting on automated text recognition (OCR) for research projects
  • OCR recommender (work in progress)
  • Open OCR consultation hour: every 2nd Thursday of the month, from 3 to 4 p.m., without registration (link to Zoom meeting:, meeting ID: 682 8185 1819, ID code: 443071).

In unseren FAQs finden Sie Antworten auf die am häufigst gestellten Fragen rund um das Thema automatisierte Texterkennung sowie die im Projekt OCR-BW genutzte Software.

Wenn die gesuchte Antwort nicht dabei ist, wenden Sie sich einfach per E-Mail an uns.

Projekte und Kooperationen

Wenn wir Sie unterstützen können oder Sie Fragen haben, zögern Sie nicht uns zu kontaktieren.


Larissa Will, M.A.

Larissa Will, M.A.

Research Data Consultant (Digital Humanities)
University of Mannheim
University Library
Schloss Schneckenhof West – Room SW 273
68161 Mannheim