InFoLiS II

Kontakt: Dr. Philipp Zumstein
Förderung: Deutsche Forschungsgemeinschaft (DFG)
Laufzeit: 2014–2016
Zum Projekt: InFoLiS II
Projektpartner: GESIS – Leibnizinstitut für Sozialwissenschaften, Research Group Data and Web Science an der Universität Mannheim

Das Projekt InFoLiS II ist das Fortsetzungsprojekt zu InFoLiS. In Kooperation mit dem Lehrstuhl für Data and Web Sciences der Universität Mannheim und der GESIS wurden heuristische Verfahren entwickelt, um aus wissenschaftlichen Publikationen aus der Sozialwissenschaft Referenzen auf darin verwendete Forschungsdaten zu extrahieren und diese im Katalog Primo der UB Mannheim und den Datenbestandskatalog der GESIS zu integrieren.

In der nächsten Projektphase soll es darum gehen, die Ergebnisse aus InFoLiS I fachlich und sprachlich auszuweiten, auf eine solide, produktunabhängige technische Basis aufzusetzen und die Verknüpfungen zwischen Publikationen und Forschungsdaten besser zu beschreiben.

Ziele von InFoLiS II

InFoLiS II hat sich drei wesentliche Ziele gesetzt.

1. Ausweitung auf andere Disziplinen und Sprachen

Während der ersten Projektphase von InFoLiS wurde der Schwerpunkt auf die Integration deutschsprachiger, sozialwissenschaftlicher Quellen gelegt. InFoLiS II weitet den Fokus auf andere Disziplinen und Sprachen. Konkret wird das InfoLink-Verfahren auf eine Vielzahl von Publikationen und Forschungsdaten aus den Sozial- und Wirtschaftswissenschaften sowie verwandten Fächern und auf Dokumente in deutscher und englischer Sprache angewandt. In Kooperation mit nationalen und internationalen Forschungseinrichtungen, Repositorienbetreibern und Verlagen soll die Datenbasis massiv ausgeweitet werden.

2. Infrastruktur basierend auf Linked Data

Die Verfahren, die im Vorgängerprojekt entwickelt wurden, um Verknüpfungen zwischen Publikationen und Forschungsdaten herzustellen und in bestehende Systeme einzubinden, sollen in eine flexible und dauerhaft tragfähige Infrastruktur eingebettet werden. Basierend auf den Paradigmen von Linked Data und RESTful web services werden alle Schritte von InfoLink als eigenständige Web-Services implementiert und Workflows eingerichtet, um das System regelmäßig und automatisiert mit aktuellen Daten anzureichern.

Die von InfoLink erkannten Verknüpfungen sollen großflächig genutzt werden. Um das zu erreichen wird Software entwickelt, um die Daten in bestehende Recherchesysteme wie Publikationsdatenbanken, Forschungsdatenrepositorien, Forschungsinfrastrukturdatenbanken und Discoveryplattformen einzubinden.

Den Nutzen der integrierten Daten für das Information Retrieval soll ein Rechercheprototyp zeigen, der für die Indexierung die ganze Bandbreite des Netzwerkes aus Publikationen, Forschungsdaten und Autoren heranzieht.

3. Verbesserung der Nachnutzbarkeit der Links

Es ist festzustellen, dass immer mehr Forschungsdaten archiviert, zugänglich gemacht und beschrieben werden. Dies geschieht aber in unterschiedlicher Weise. Einerseits können die Granularität (was ist die kleinste zu beschreibende Einheit bei Forschungsdaten?) und die möglichen aggregierenden Zwischenstufen unterschiedlich sein. Anderseits können auch die Beziehungen zwischen einer Publikation und den dazugehörigen Forschungsdaten unterschiedlich sein.

Um dies alles festhalten zu können, wird eine Ontologie entwickelt unter Einbeziehung des DDI-RDF Discovery Vokabulars der Data Documentation Initiative. Die daraus resultierenden Verbesserungen einer Recherche bzw. allgemein bei der Nachnutzbarkeit der Links werden ebenfalls untersucht.