Retour

Open Data #01 : la donnée ouverte, kesako ?

L'exploitation des données 7/08/2015 Scala Dream Team

L’Open data ou les « données ouvertes »

OpenData, c’est quoi ?

Open data ou « donnée ouverte », est une donnée… numérique, bien sûr ! Elle peut être d’origine privée mais dans la pratique la démarche impacte surtout les données publiques[1].

En pratique, les institutions publiques (mais pas uniquement car les organismes privés aussi) collectent de nombreuses données qui servent à faire fonctionner l’organisation : que ce soient les inscrits dans les collèges, la parité dans les institutions, les résultats des élections, le niveau de pollution de l’air,… un quantité importante de données est collectée (et stockée sur des serveurs) quotidiennement. Le mouvement open data vise à ouvrir ces données, à les mettre à disposition des citoyens.

C’est à la fois un mouvement philosophique d’accès à l’information (que l’on peut rapprocher de l’open source) et une pratique de publication qui s’est construite à partir de l’émergence des nouvelles technologies. Il s’agit ici de considérer la donnée publique comme un bien commun, dont la diffusion, l’analyse, et la réutilisation est d’intérêt public et général.

D’un point de vue économique, c’est un facteur d’innovation, de création de nouveaux services et de contribution à la croissance par la création de nouveaux services liés à la réutilisation des données ouvertes.

D’un point de vue politique, il s’agit de revitaliser la démocratie. Ainsi, en 2009, le gouvernement Obama pose les trois piliers de la coopération entre l’État et les citoyens : la transparence du gouvernement, la participation et la collaboration des administrés.

Enfin, cela impacte d’importantes questions d’ordre juridique et réglementaire : certains pays obligent ainsi les organismes publics à publier leurs données, et la question des licences qui encadrent les usages des données publiées est cruciale.

La démarche Open data reste cependant un phénomène récent, qui s’est structuré avec la loi Open Government Act aux USA en 2007 et des évolutions réglementaires qui peinent encore à avancer en France et en Europe.

Définitions

Séparer les notions de «données» de l’«information»

La donnée est un « fait » brut, c’est à dire non traité, sans analyse ni contexte (le contexte ou l’enrichissement des données est parfois appelé “méta-données”)

A contrario, l’information englobe la donnée ET son traitement : croisement et comparaison des données, analyse, commentaires, visualisation,…

Si le débat assimile parfois l’un à l’autre, et si les deux notions vont de paire, le terme « open data » s’intéresse à la donnée elle-même, plutôt qu’à l’information.

10 critères pour caractériser l’Open Data

Le concept de donnée publique ouverte a été défini précisément en 2007 par une trentaine de penseurs du web (dont Lawrence Lessig, le promoteur de Creative Commons et Tim O’Reilly, à qui l’ont doit le concept « web 2.0 ») puis, en 2010, par la Sunlight Foundation qui établit une liste de 10 critères caractérisant une donnée ouverte :

  • Complète : toutes les données publiques doivent être ouvertes à l’exception de celles susceptibles de porter atteinte à la vie privée des individus ou à la sécurité du territoire
  • Primaire, ou données brutes : mises à disposition sans travail d’agrégation ou d’interprétation. Dans leur forme première.
  • Opportune : données à jour, publiées rapidement
  • Accessible à tous, pour tous usages
  • Exploitable : données qui peuvent faire l’objet d’un traitement automatisé, informatique.
  • Non-Discriminatoire : l’accès aux données ne doit pas faire l’objet d’un enregistrement préalable
  • Non-Propriétaire : données sont mises à disposition dans des formats non-propriétaires (par exemple pas de document PDF)
  • Libre de droits : les données ne doivent pas être soumises à des droits d’auteur et couverts par la propriété intellectuelle.
  • Permanente : les données doivent être mises à disposition de manière permanente
  • Gratuite

 Quels usages pour la donnée ouverte

Les données ouvertes peuvent faire l’objet d’une utilisation directe par l’utilisateur final, lorsque les données sont accessibles et facilement compréhensibles. Par exemple on en trouve sur www.insee.fr avec les données issues du recensement.

Mais ce sont surtout les données traitées, croisées et analysées qui vont intéresser l’usager final.

Ainsi c’est l’intervention de médiateurs qui vont retraiter la donnée pour permettre de mieux visualiser l’information et lui apporter une logique de l’usage. Des interfaces (formulaires, outils de recherche et de tri, interfaces de data-visualisation…) permettent alors de manipuler et de visualiser les données traitées. L’utilisateur final n’accède alors pas forcément aux données brutes, mais à un post-traitement des données (le champ de la data-visualisation prend alors tout son sens…)

Le journalisme de données en est un exemple concret, par exemple sur www.owni.fr ou au Guardian .

Par ailleurs, de nombreuses applications mobiles utilisent des données ouvertes. L’usage de technologies mobiles permet ainsi une utilisation de la donnée géolocalisée et horodatée : transports et horaires liés à de l’information touristique, temps de trajets, localisation de toilettes publiques à Paris,… les idées et projets sont foisonnants.

Si la donnée est ouverte, les applications sont par contre parfois propriétaires sur des formats fermés, en contradiction avec les objectifs d’ouverture, de partage et de standardisation du mouvement open data.

Les champs d’application et les projets sont foisonnants et nous n’en sommes aujourd’hui qu’aux prémisses de nombreux usages qui, à n’en pas douter vont se généraliser petit à petit. La démarche, parce qu’elle est ontologiquement transversale (technique, juridique, économique, culturelle et politique) et structurante, a du mal à s’installer dans les organisations. Mais à l’heure de la transformation numérique, l’open data est certainement un projet pilote pour aider la transformation des organisations vers le monde digital de demain d’aujourd’hui.

Article suivant de la série Open Data : 7 exemples concrets de l’utilisation de la donnée ouverte

[1] Dans un article récent Loic Bodin explique l’open data comme « la mise à disposition des données publiques produites par les administrations »

www.huffingtonpost.fr/loic-bodin/open-data-administration-democratie_b_1897086.html

Avatar auteur
Écrit par ,
Consultants Scala
Ça vous a plu ? Faites tourner !

À lire aussi

Impact des failles de sécurité Meltdown et Spectre

22/01/2018

Pour cette nouvelle année 2018, une vulnérabilité massive va toucher des centaines de millions d'utilisateurs Windows, Linux et Mac dans le monde entier : les failles de sécurité Meltdown et Spectre. Comme l'a révélé le projet Goole Zero elles concernent potentiellement tous les processeurs incluant INTEL, AMD et ARM et ceci depuis 1995. Quels impacts pour les infrastructure Cloud ?

Je veux lire la suite

say hello !

un projet ? des infos ? un devis ?

on est partout.

Amiens
Scala Amiens

7 rue de l’Ile Mystérieuse

80440 Boves Amiens
Lyon
Scala Lyon

Parc du Crecy, 12 rue Claude Chappe

69370 Saint Didier au Mont d’Or Lyon
Marseille - Siège social
Scala Marseille

11 avenue André Roussin
Immeuble Grand Ecran

13 016 Marseille
+33 (0)4 91 46 84 60
Paris
Scala Paris

8 Rue Euler

75 008 Paris
+33 (0)1 56 68 77 80
Tunis – Tunisie
Scala Tunisie

Rue du Lac Biwa, Immeuble Fraj
3ème étage, Lac 1,
Les Berges du Lac

1053 Tunis – Tunisie
+216 71 657 451
Et même Londres, Bruxelles, NY, Montréal et Casablanca.Voir carte.

on recrute !

Venez voir toutes nos offres ici.

contact
le blog