Datenbanken und Informationssysteme

Datenbanken und Informationssysteme

Die Kernherausforderung bei der Ergründung und Weiterentwicklung von Datenbanken und Informationssystemen liegt im Bereich des Datenmanagements. Das Datenmanagement befasst sich mit dem Umgang der Daten während des gesamten Lebenszyklus: von der Erfassung über die Analyse bis hin zur aus der Analyse resultierenden Generierung weiterer Daten.

Daten sind wesentlicher Input und Erfolgsfaktor für alle Arten von datengesteuerten Lösungen. Dazu gehören unter anderem digitale Systeme und fortschrittliche Analytik, beispielsweise maschinelles Lernen sowie datengesteuerte Anwendungen, wie etwa Empfehlungs- und Fragebeantwortungssysteme. Der Erfolg dieser Anwendungen hängt maßgeblich vom schnellen Zugriff auf qualitativ hochwertige Daten ab.

Herausforderungen

Trotz der Entwicklungen des Datenmanagements in den letzten Jahrzehnten steht der Bereich aufgrund der zunehmenden Menge an nutzergenerierten Daten und dem Aufkommen neuer Datenmodelle und Computerarchitekturen ständig vor neuen Möglichkeiten und Herausforderungen. Die Forschung an innovativen Datenverarbeitungstechniken, die die Chancen neuester Technologien ausschöpfen, bildet daher das Fundament zur Entwicklung von umfangreichen und bedeutsamen datengetriebenen Lösungen.

Schwerpunkte

Der Forschungsbereich Datenbanken und Informationssysteme der RUB beschäftigt sich mit der Entwicklung neuer Techniken zur effizienten und effektiven Verwaltung dezentraler Daten, insbesondere mit folgenden Forschungsthemen:

Abfrageoptimierung: Reduzierung der Ausführungszeit und Menge an Ressourcen, die für die Auswertung von Abfragen auf Basis großer Datenquellen verwendet werden.

Föderierte Abfrageverarbeitung: Quellenauswahl und Abfrageplanungstechniken zur effizienten Ausführung von Abfragen über dezentrale, autonome Quellen, die eine Föderation bilden.

Datenqualität: Erkennung von Qualitätsproblemen einschließlich unvollständiger oder falscher Angaben in Datenquellen. 

Projekte und Personen

Die Projekte des Teams um Prof. Dr. Maribel Acosta haben zum Stand der Technik bei der Verarbeitung von Abfragen über große, föderierte Daten im Web, die als Wissensgraphen modelliert sind, beigetragen. Dazu gehört die Veröffentlichung folgender Systeme:

  • ANAPSID: Adaptive Abfragemaschine für Föderationen von SPARQL-Endpunkten
  • nLDE: Adaptive Abfrage-Engine für Triple Pattern Fragments
  • HARE: Verbesserung der Vollständigkeit von Abfrageantworten mit Crowdsourcing