Open Data
En théorie
Définition
Qu'est-ce qu'une données ouverte/libre (open data) ?
Une donnée ouverte, aussi appelé libre (« open data » en anglais), représente une information brute qui est fournie librement au public. En informatique, on décrit habituellement ses données comme n'étant pas « human-readable », c'est-à-dire qu'elles pourront être interprétés par une machine mais n'auront pas de sens si lu par une personne. Il s'agit souvent d'informations en très grande quantité, des statistiques notamment, qui doivent être synthétisés ou représentés sous forme de « visualisation » (des graphiques notamment) pour pouvoir les comprendre.
Dans ce mini-site, le terme de donnée ouverte (libre) fera référence aux données collectées par les organismes du secteur public. Celles-ci sont supposées être précises, complètes, de qualité et fiables. De plus, il est important de préciser qu'il s'agit d'informations qui sont anonymes et qui ne risquent aucunement d'impacter la sécurité nationale.
Des exemples de données qui ont vocation à être ouvertes sont : les informations économiques comme le budget du gouvernement, météorologiques comme la température, et touristiques d'un territoire, comme les coordonnées géographiques des monuments importants.
Qu'est-ce que le mouvement Open Data (d'ouverture des données publiques) ?
Toutes ces données libres ont pour vocation d'être réutilisé, présenté de manière innovante, et diffuser librement. Pour que cela soit possible, il faut avant tout que les gouvernements et autres instances publiques « libèrent les données », procède à « l'ouverture des données publique ». C'est ce mouvement de mise à disposition des données que l'on nomme en anglais « open data ». Ces données se veulent librement disponible pour tous, et sans restriction de réutilisation (copyright, brevets, etc.).
L'Open Definition proposé par l'Open Knowledge Foundation (OKFN) explique les critères qui permettent de définir qu'une œuvre est ou n'est pas libre. Il existent 11 conditions au total, elles sont disponibles sur http://opendefinition.org/okd/francais/ .
Voici les 3 premières conditions, extraites du site de l'Open Definition :
- Accès
L’œuvre doit être accessible dans son intégralité pour un prix ne dépassant pas un coût raisonnable de reproduction, et de préférence via téléchargement gratuit par Internet. L’œuvre doit également être accessible dans un format utilisable et modifiable. - Redistribution
La licence n’empêche pas les parties de vendre ou d’aliéner l’œuvre, considérée tant individuellement, que comme composante d’un ensemble plus large d’œuvres issues de différentes sources. La licence ne conditionne pas une telle vente ou distribution à une redevance ou à un autre type de rémunération. - Réutilisation
La licence autorise les modifications et la réalisation d’œuvres dérivées et n’empêche pas que leur distribution soit soumise aux mêmes conditions que l’œuvre originale. La licence peut imposer des conditions relatives à l’attribution et à l’intégrité de l’œuvre : voir point 4 (attribution) et point 5 (intégrité).
On note l'importance que prend l'interopérabilité puisque les données ouvertes doivent être exploitables sur tout type d'ordinateur, avec tout type de systèmes et de logiciels (propriétaires et libres), et peuvent potentiellement être associées avec des données qui n'auraient pas la même licence.
Objectifs et Valeurs
Quels sont les objectifs et les valeurs de ce mouvement ?
- Générer de nouvelles connaissances et des tendances à partir de sources de données combinées (mashups) extraites d'importants volumes de données.
- Mesurer l'impact des politiques en surveillant le processus démocratique (décision prises par tel ou tel élu au gouvernement, rapport financier et humain après mesures prises etc.)
- Accroître le rendement et l'efficacité des services publics en centralisant les données publiques, qui pourront être comparées entre elles et il sera ainsi beaucoup plus rapide d'évaluer si une erreur s'y est introduite. On peut illustrer ce principe avec une phrase d'Eric S. Raymond, acteur célèbre du mouvement Open Source, « given enough eyeballs, all bugs are shallow » (extrait de "The Cathedral and the Bazaar", 1999).
- Assurer la transparence et le contrôle démocratique en proposant au public les mêmes données qui sont utilisées pour en arriver aux conclusions des élus.
- Améliorer la sensibilité des citoyens concernant le rôle du gouvernement, pour permettre une meilleur responsabilisation (principe de responsabilité sociétal) : donner au gouvernement les moyens de rendre compte publiquement de ses actions, et par extension, de se responsabiliser.
- Permettre l'autonomisation du public, en s'assurant que tous citoyens puisse s'informer directement à la source (et non à travers des médias comme la presse ou la télévision), lui donnant ainsi les moyens d’interpréter à sa guise des informations brutes, et de les comparer à d'autres valeurs historiques (si ces dernières sont également fournis).
- Engendrer l'innovation en permettant d’accéder à des données qui n'avaient jamais été mise à disposition du public, et en les combinant pour générer des services nouveaux.
- Stimuler l'amélioration et la création de nouveaux produits et de services dans le secteur privé. En effet, une niche de produits s'appuie sur le mouvement Open Data pour exister. En 2006, selon le rapport MEPSIR, financé par la Commission Européenne, le marché européen lié à la réutilisation des informations publiques représente 27 milliards d'euros.