Foto: UB Mannheim

InFoLiS II

Kontakt: Dr. Philipp Zumstein
Förderung: Deutsche Forschungs­gemeinschaft (DFG)
Laufzeit: 2014–2016
Zum Projekt: InFoLiS II
Projekt­partner: GESIS - Leibnizinstitut für Sozial­wissenschaften, Research Group Data and Web Science an der Universität Mannheim

Das Projekt InFoLiS II ist das Fortsetzungs­projekt zu InFoLiS. In Kooperation mit dem Lehr­stuhl für Data and Web Sciences der Universität Mannheim und der GESIS wurden heuristische Verfahren entwickelt, um aus wissenschaft­lichen Publikationen aus der Sozial­wissenschaft Referenzen auf darin verwendete Forschungs­daten zu extrahieren und diese im Katalog Primo der UB Mannheim und den Datenbestandskatalog der GESIS zu integrieren.

In der nächsten Projekt­phase soll es darum gehen, die Ergebnisse aus InFoLiS I fach­lich und sprachlich auszuweiten, auf eine solide, produktunabhängige technische Basis aufzusetzen und die Verknüpfungen zwischen Publikationen und Forschungs­daten besser zu beschreiben.

Ziele von InFoLiS II

InFoLiS II hat sich drei wesentliche Ziele gesetzt.

1. Ausweitung auf andere Disziplinen und Sprachen

Während der ersten Projekt­phase von InFoLiS wurde der Schwerpunkt auf die Integration deutschsprachiger, sozial­wissenschaft­licher Quellen gelegt. InFoLiS II weitet den Fokus auf andere Disziplinen und Sprachen. Konkret wird das InfoLink-Verfahren auf eine Vielzahl von Publikationen und Forschungs­daten aus den Sozial- und Wirtschafts­wissenschaften sowie verwandten Fächern und auf Dokumente in deutscher und englischer Sprache angewandt. In Kooperation mit nationalen und internationalen Forschungs­einrichtungen, Repositorienbetreibern und Verlagen soll die Datenbasis massiv ausgeweitet werden.

2. Infrastruktur basierend auf Linked Data

Die Verfahren, die im Vorgänger­projekt entwickelt wurden, um Verknüpfungen zwischen Publikationen und Forschungs­daten herzustellen und in bestehende Systeme einzubinden, sollen in eine flexible und dauerhaft trag­fähige Infrastruktur eingebettet werden. Basierend auf den Paradigmen von Linked Data und RESTful web services werden alle Schritte von InfoLink als eigenständige Web-Services implementiert und Workflows eingerichtet, um das System regelmäßig und automatisiert mit aktuellen Daten anzureichern.

Die von InfoLink erkannten Verknüpfungen sollen großflächig genutzt werden. Um das zu erreichen wird Software entwickelt, um die Daten in bestehende Recherchesysteme wie Publikations­datenbanken, Forschungs­datenrepositorien, Forschungs­infrastrukturdatenbanken und Discoveryplattformen einzubinden.

Den Nutzen der integrierten Daten für das Information Retrieval soll ein Rechercheprototyp zeigen, der für die Indexierung die ganze Bandbreite des Netzwerkes aus Publikationen, Forschungs­daten und Autoren heranzieht.

3. Verbesserung der Nachnutzbarkeit der Links

Es ist festzustellen, dass immer mehr Forschungs­daten archiviert, zugänglich gemacht und beschrieben werden. Dies geschieht aber in unterschiedlicher Weise. Einerseits können die Granularität (was ist die kleinste zu beschreibende Einheit bei Forschungs­daten?) und die möglichen aggregierenden Zwischenstufen unterschiedlich sein. Anderseits können auch die Beziehungen zwischen einer Publikation und den dazugehörigen Forschungs­daten unterschiedlich sein.

Um dies alles festhalten zu können, wird eine Ontologie entwickelt unter Einbeziehung des DDI-RDF Discovery Vokabulars der Data Documentation Initiative. Die daraus resultierenden Verbesserungen einer Recherche bzw. allgemein bei der Nachnutzbarkeit der Links werden ebenfalls untersucht.