Symbolbild mit den Außenseiten der Kompaktusanlage in Blau- und Türkistönen und Kurbeln im Ausleihzentrum. Über das Bild ist Binärcode gelegt.

Automatisierte Texterkennung – Datenerhebung via OCR/HTR

Mithilfe von maschineller Texterkennung (OCR) werden Texte aus digitalen Bildern automatisiert erfasst und auf diese Weise durchsuchbare und analysierbare Daten erzeugt. Die Universitäts­bibliothek Mannheim blickt auf langjährige Erfahrung in der Digitalisierung und mit der Anwendung verschiedenerTexterkennungs­software zurück.

Gerne unter­stützt das Forschungs­datenzentrum Forschende der Universität Mannheim entlang des gesamten Workflows von der Digitalisierung über die Layout- und Texterkennung sowie dem Nachtraining spezialisierter Modelle bis hin zur Strukturierung der Daten.

Icon aufgeschlagenes Buch

Services

  • Beratung zur maschinellen Texterhebung für Forschungs­projekte
  • OCR Recommender
  • Offene OCR-Sprechstunde: jeden 2. Donnerstag im Monat, von 15 bis 16 Uhr, ohne Anmeldung (Link zum Zoom-Meeting: https://ocr-bw.bib.uni ..., Meeting ID: 682 8185 1819, Kenncode: 443071)
Icon Fragezeichen in einem Kreis

In unseren FAQs finden Sie Antworten auf die am häufigst gestellten Fragen rund um das Thema automatisierte Texterkennung sowie die im Projekt OCR-BW genutzte Software.

Wenn die gesuchte Antwort nicht dabei ist, wenden Sie sich einfach per E-Mail an uns.

Icon Händeschütteln

Projekte und Kooperationen

Wenn wir Sie unter­stützen können oder Sie Fragen haben, zögern Sie nicht uns zu kontaktieren.

Kontakt

Forschungsdatenzentrum (FDZ)

Forschungs­datenzentrum (FDZ)

Team: Irene Schumm, Phil Kolbe, David Morgan, Thomas Schmidt, Renat Shigapov, Christos Sidiropoulos, Vasilka Stoilova, Larissa Will
Universität Mannheim
Universitäts­bibliothek Mannheim
Schloss Schneckenhof West
68161 Mannheim