L’accessibilité de l’Open Data

Les données ouvertes (l’Open Data) présentent plusieurs défis. Outre leur mise à disposition se pose le problème de leur accessibilité et de leur exploitabilité. En cela, elles se rapprochent des concepts du Web sémantique.

Les principaux problèmes de l'exploitation des données ouvertes sont d'ordre technique car les données en masse ne peuvent pas être traitées humainement.

Le concept de Web des données appliqué aux données ouvertes met en œuvre 3 mécanismes :

  1. 1

    Permettre l'existence de la donnée sur le réseau à travers une URI unique (cela inclut les URL).

  2. 2

    Diminuer le coût de transformation de la donnée en apportant des formats standards lisibles par les machines (comme avec RDF, RDFa ou les microformats dans le HTML5).

  3. 3

    Améliorer la qualité de la donnée pour éviter qu'un traitement de mise à disposition ne puisse les altérer. Un entrepôt de données même avec des erreurs est préférable à un entrepôt biaisé. Ainsi, des mécanismes pour la fréquence et l’automatisation des mises à jour de la donnée par les producteurs des données sont possibles avec un service SPARQL sur ces données.

Les données ouvertes ne sont contrôlables par leurs producteurs (contrôle des mises à jours) et réellement exploitables par d'autres qu'à la condition d'utiliser ces 3 mécanismes.

L'Initiative d'ELI

  • Mise à disposition des données « ouvertes » que sont la législation européenne et la législation des Etats membres sous la forme d’URI uniques, intelligibles et stables.
  • Mise à disposition de méta-informations structurées sur ce même périmètre.
  • Mise en place d’une ontologie et du marquage RDF associé sur ce même périmètre.