Hauptinhalt

Datenintegration

Projektleitung

bseeger.jpg
Foto: Natur 4.0
Prof. Dr. Bernhard Seeger
Universitätsprofessor

Praktische Informatik / Datenbanksysteme | Mathematik & Informatik | Philipps-Universität Marburg

Zur Personenseite

Team

Johannes Drönner
Wissenschaftlicher Mitarbeiter

Praktische Informatik / Datenbanksysteme | Mathematik & Informatik | Philipps-Universität Marburg

Zur Personenseite

Ausgangsbasis

Durch das im GFBio-Projekt entwickelte VAT-System wurde bereits ein Werkzeug zur Datenintegration, Analyse und Visualisierung von Biodiversitätsdaten geschaffen, das sich ideal als Grundlage für die in diesem Projekt zu entwickelnde NatDB eignet. Es bietet Funktionalität für Import, Export, Verwaltung und Verarbeitung von Vektor- und Rasterdaten an. Daten können statisch importiert werden, eine dynamische Anbindung von Live-Daten und deren Persistierung ist in VAT derzeit aber noch nicht vorgesehen. Gleiches gilt für Bild- und Audiodaten, die zwar bereits interaktiv angezeigt, aber noch nicht verarbeitet werden können. VAT verfügt jedoch über eine Benutzer- und Projektverwaltung, die für die Erstellung von benutzerspezifischen Schnittstellen genutzt werden kann. Für die ökologische Wissenschaftsdomäne ist zudem die Interaktion mit R interessant, die sowohl im System die Einbindung von R-Funktionen als auch außerhalb den Aufruf der in VAT erzeugten Workflows in R ermöglicht.

Ziele

  1. Die Unterstützung des Imports und Exports von allen im Projekt erforderlichen Daten in der NatDB.
  2. Die umfängliche Unterstützung domänenspezifischer Programmiersprachen (Python, R) in NatDB.
  3. Die Bereitstellung fachbezogener Funktionalität für die Ableitung von Biodiversitätsindikatoren und deren Visualisierung in NatDB.

Arbeitsprogramm

Nach einer Bestandsaufnahme der zu verwaltenden Daten werden die Schnittstellen für den Import und Export in NatDB entwickelt. Insbesondere werden Bausteine für den dynamischen Import und Export von Live-Daten aus dem Sensornetzwerk (SN2) durch Einbindung eines Datenbanksystems für Zeitreihen entwickelt. Die im Projekt zu definierenden Python-Schnittstellen werden intern in NatDB zur Verfügung gestellt, um benutzerspezifische Funktionalität in den Workflows aufzurufen. Hierdurch sollen insbesondere Algorithmen eingebunden werden, die Grundlage für die Ähnlichkeitssuche in Multimediadaten sind (UM2, UM3). Zudem wird eine API für Python erstellt, um die in UM2 entwickelten Module direkt in die NatDB implementieren zu können. In Kooperation mit UM4 werden effiziente Algorithmen für die zeitliche Analyse und Visualisierung insbesondere von Live-Daten geschaffen und gemeinsam Warnindikatoren entwickelt. Mit Blick auf die bürgerwissenschaftlichen Aktivitäten werden zusammen mit SN3 entsprechende web-basierte Schnittstellen konzipiert, um in einfacher Weise interessensspezifische Web-Seiten zur Aus- und Fortbildung zu generieren.