Home | Drucken | English English | Suche
DFG-Projekt: "Verbesserung der Fachrecherche in großen Volltextsammlungen mit Methoden des Semantic Webs"

Förderung: Deutsche Forschungsgemeinschaft

Laufzeit des Projekts: 2007-2009

(in Zusammenarbeit mit Prof. Dr. Heiner Stuckenschmidt, Fak. f. Mathematik und Informatik der Universität Mannheim)

 

Zusammenfassung


Ziel des Projekts ist die Optimierung der Fachrecherche in verteilten und heterogenen bibliographischen Daten und Volltextsammlungen. Die Antragsteller werden ein Recherchesystem implementieren, das die Suche nach wirtschaftswissenschaftlicher Literatur durch das Einbeziehen von Thesaurusbegriffen unterstützt.
Konkret soll für dieses System die Software Collexis der Firma SyynX eingesetzt werden, eine Suchmaschine, deren Einsatzschwerpunkt die Indizierung großer Volltextmengen ist. Im Rahmen des beantragten Vorhabens werden Artikel aus wirtschaftswissenschaftlichen Zeitschriften indexiert und auf der Basis mehrerer Thesauri automatisch erschlossen und in der graphischen Clustermap-Technologie präsentiert. Mit ihrem Antrag folgt die Universität Mannheim auch den förderpolitischen Konsequenzen der Deutschen Forschungsgemein€schaft, die Vorhaben zur qualifizierten Nutzung von Inhalten durch Suchmaschinentechnologie fördern möchte.



Ziele

1. Optimierung der Fachrecherche in verteilten und heterogenen bibliographischen Datensammlungen

Der Antrag stellt sich der eingangs skizzierten Problematik der Fachrecherche in verteilten und heterogenen bibliographischen Daten. Dabei geht es um die Frage, wie bei der Recherche mit Suchmaschinen eine Qualität erreicht werden kann, die mit der Suche mit normiertem Vokabular in Bibliothekskatalogen vergleichbar ist. Beispielsweise führt eine Suche nach dem Begriff „Open Source“ fast ausschließlich zu Rechercheergebnissen, die sich mit Software beschäftigen und schließt Homonyme und Synonyme aus.



2. Entwicklung von Verfahren zur automatischen Inhaltserschließung

Es stellt sich häufig das Problem, dass große Volltextarchive von Verlagen wie Elsevier keine Erschließung ihrer Artikeldaten anbieten. Im Projekt sollen unterschiedliche Ansätze zur automatischen Erschließung von Dokumentbeständen mit Hilfe der SyynX Technologie anhand von ausgewählten Volltexten getestet und jeweils im Hinblick auf eine Verbesserung der Recherche evaluiert werden. Am Ende des Projekts wird auf der Basis der Produkts Collexis ein Verfahren für die automatische Erschließung von Volltexten sowie den jeweiligen Metadaten und die graphische Präsentation der Rechercheergebnisse an der Universitätsbibliothek Mannheim eingesetzt, das anderen Bibliotheken zur Nachnutzung zur Verfügung steht. Aber auch unabhängig vom Erwerb der Software Collexis können die Ergebnisse des beantragten Projekts von der wissenschaftlichen Öffentlichkeit kostenfrei nachgenutzt werden. Die Metadaten und die automatisiert vergebenen Schlagwörter liegen in maschinenlesbarer Form vor und können in jegliches anderes System überführt werden.



3. Entwicklung von Verfahren zur automatisierten Genese von Crosskonkordanzen

Es ist damit zu rechnen, dass sich durch eine automatische Erschließung nicht immer das optimale Ergebnis erzielen lässt. Dies kann zum einen im verwendeten Verfahren selbst, aber auch in der Natur des verwendeten Thesaurus begründet sein: oft sind bestimmte thematische Bereiche nicht ausreichend oder gar nicht abgedeckt. In diesem Zusammenhang soll untersucht werden, ob sich das letztgenannte Problem durch die Verwendung unterschiedlicher Thesauri bei der Erschließung lösen läßt. Da es sich bei den Wirtschaftswissenschaften um ein inhärent interdisziplinäres Forschungsgebiet handelt, soll vor allem auch untersucht werden, ob die Verwendung zusätzlicher Thesauri aus verwandten Bereichen (insbesondere Rechts- und Sozialwissenschaften) zu besseren Ergebnissen führen kann.
Auf der Grundlage gemeinsam indizierter Dokumente sollen automatisch Korrespondenzen zwischen unterschiedlichen Thesauri erstellt werden, die dann verwendet werden können um direkt über die Suchfunktion des entsprechenden Anbieters auf Inhalte zuzugreifen. Konkret soll diese Möglichkeit am Beispiel des Standard Thesaurus Wirtschaft (STW) und des der Suche in der Dokumentensammlung “Business Source Complete” zugrunde liegenden Thesaurus des Anbieters EBSCO untersucht werden. Beide Thesauri werden weiter unten besprochen.



4. Optimierung der Recherche in den im Rahmen der Nationallizenzen von der Deutschen Forschungsgemeinschaft erworbenen Zeitschriftenarchiven

Die Antragsteller möchten sich bei ihrem Projekt auf die Wirtschaftswissenschaften beschränken und die Artikel in den wirtschaftswissenschaftlichen Zeitschriften des Verlags Elsevier mit dem Standard Thesaurus Wirtschaft (STW) automatisch erschließen. Eine Zusammenarbeit mit dem Verlag Elsevier ist für das beantragte Projekt von großem Vorteil, da die Deutsche Forschungsgemeinschaft im Rahmen der Nationallizenzen für digitale Publikationen u.a. von Elsevier Lizenzen bis zum Erscheinungsjahr 1994 erworben hat und damit ein kostenfreier Zugang für deutsche Hochschulen möglich ist. Das beantragte Projekt verbessert die Nutzung der erworbenen digitalen Zeitschriften und trägt damit maßgeblich zur Nachhaltigkeit der von der Deutschen Forschungsgemeinschaft aufgewendeten finanziellen Mittel bei. Wie bereits erwähnt liegen die automatisiert vergebenen Schlagwörter in maschinenlesbarer Form vor und können beispielsweise in ECONIS eingespielt werden. Damit stehen die Ergebnisse des Projekts auch im Rahmen der virtuellen Fachbibliothek Wirtschaftswissenschaften (EconBiz) zur Verfügung.

 

Projektergebnisse