Offener Datenzugang (Open Data)

Der offene Datenzugang (Open Data) stellt uns vor mehrere Herausforderungen. Neben der Bereitstellung der Daten sind sowohl die Fragen des Datenzugangs als auch deren Nutzung zu klären. In diesem Punkt besteht eine Ähnlichkeit mit dem Konzept des semantischen Webs.

Die Hauptprobleme bei der Nutzbarmachung offen verfügbarer Daten sind technischer Art, da der Mensch die Masse an Daten nicht verarbeitet kann.

Die Anwendung des Konzeptes Netz der Daten auf offen verfügbare Daten bedarf der Einführung dreier ineinandergreifender Grundvoraussetzungen:

  1. 1

    Die Verbreitung der Daten im Netz über eine eindeutige URI-Adresse (darin enthalten die URLs).

  2. 2

    Die Kostenreduzierung der Datentransformation durch die Einführung maschinelesbarer Standartformate (wie RDF, RDFa oder die Mikroformate HTML5).

  3. 3

    Die Verbesserung der Datenqualität, um zu verhindern, dass bei der Bearbeitung für die Datenbereitstellung keine Verfälschungen eintreten. Dabei ist es besser, bei der Daten-Zwischenlagerung einige Irrtümer in Kauf zu nehmen als das Risiko einer Zwischenlagerung mit eventueller Datenverzerrung einzugehen. Somit ist eine Steuerung der Häufigkeit und der automatischen Aktualisierung der Daten durch den Informationserzeuger mit Hilfe eines SPARQL Dienstes für diese Daten möglich.

Die offen verfügbaren Daten sind nur von Ihren Erzeugern (Kontrolle der Datenaktualisierung) kontrollierbar und sie können nur unter Ausschöpfung dieser drei Voraussetzungen von Dritten wirklich genutzt werden.

Der ELI -Initiative

  • Bereitstellung offen verfügbarer Daten wie die Rechtsvorschriften der Europäischen Union und ihren Mitgliedstaaten in Form einer eindeutigen, verständlichen und sicheren URI-Adresse.
  • Bereitstellung von strukturierten Metainformationen für dasselbe Begriffsgebiet.
  • Bereitstellung einer Ontologie und eines RDF-Format Bezeichners mit einer Verknüpfung auf dasselbe Begriffsgebiet.