Table des matières
Draft conf 16/02/2012 WebSchoole de Tours
Draft conf 16/02/2012 WebSchool de Tours
Cyrille Giquello.
S1 - Bonjour
Bonjour et bienvenue à cette présentation.
Je vais vous présenter ce qu'est le mouvement Open Data et essayer de vous convaincre de l'opportunité qu'il représente.
Je ne suis pas maître de conférence mais un simple citoyen qui souhaite partager sa connaissance sur le sujet.
S2 - Origine - Open Data
Commençons par un peu de sémantique.
Le terme Open est défini comme la liberté d’utiliser, de réutiliser, de redistribuer plus ou moins librement l’œuvre originale. Il est notamment utilisé pour les démarches basées sur des alternatives éthiques ou solidaires de partage libre des savoirs. Dans le mouvement Open Data, le terme “Open” s'inscrit dans une démarche plus vaste de transparence et de participation des citoyens.
Le terme Data qui en anglais veut dire données, prend dans le mouvement Open Data le sens de connaissance qui peut être statistique, géographique mais aussi administrative, financière ou politique. Grandes productrices de données, les collectivités conservent depuis longtemps (1970) cette “matière grise” dans des bases de données stockées sur des serveurs informatiques. Ces bases, alimentées chaque jour en informations fraîches, racontent une histoire des collectivités, des territoires, de son impact sur l’environnement et de son environnement lui-même: sur les habitants, les usagés, équipements, ressources, investissements, etc …
S3 - Origine - Libération
La libération des données publiques, comme nous allons le voir au cour de cette présentation, couvre 6 dimensions: politique, juridique, organisationnelle, technique, économique et sociale.
On parle généralement d'ouverture des données publiques, mais j'aime être plus incisif et parler de libération des données publiques. comme nous le verrons, les données publiques sont censées être ouvertes depuis longtemps. Alors, puisqu'il y a un nouveau mouvement, autant utiliser un nouveau vocabulaire.
S4 - Origine - Liberté guidant le peuple
Un court voyage historique permet de poser les fondement de l'ouverture des données.
Tout commence avec la Déclaration des droits de l'homme et du citoyen de 1789. Celle-ci, dans son article XVI dit:
- « La Société a le droit de demander compte à tout Agent public de son administration. »
L'accès au données publiques à toujours été difficile.
et ce n'est qu'en 1978 qu'une loi a été établie. Celle-ci créée la Commission d'Accès au Documents Administratif (C.A.D.A.) pour assurer la bonne application du droit d'accès des citoyens.
Cette loi s'est vue renforcer par une ordonnance en 2005 qui traduit en droit français la directive européenne de 2003 sur l'utilisation des informations du secteur public.
Je reviendrai plus tard sur l'aspect juridique. Continuons ce petit tour d'horizon qui permet de mieux comprendre l'origine du mouvement Open Data.
S5 - Origine - TIC guidant l'état
L’État français, depuis les années 1970 durant lesquelles l'informatisation de l'administration à commencée, a porté des efforts pour facilité les échanges avec les citoyens. Le vecteur facilitant cette volonté sont les TIC, les Technologies de l'Information et des Communications.
Il y a eu l'e-administration pour faciliter l'accès aux documents administratifs.
Des tentatives d'e-democratie pour relancer la participation des citoyens au processus démocratique. e-vote, vidéo diffusion de conseils municipaux. Notamment la ville d'Issy-les-Moulineaux a menée de nombreuses expériences dans ce sens.
Il y a eu aussi une grande volonté mondiale de développement durable des sociétés, au travers de l'Agenda 21, un Plan d'action pour le XXIe siècle adopté par 173 États lors du sommet de la Terre à Rio en 1992. Il porte sur toutes les dimensions d'une société, tant sur l'environnement que sur les processus d'une république démocratique.
Plus récemment en 2007, il y a eu la directive Européenne INSPIRE, Infrastructure for Spatial Information in the European Community, qui impose aux autorités publiques, d’une part de rendre toutes les données géographiques accessibles au public en les publiant sur Internet, d’autre part de les partager entre elles.
Attention à ne pas confondre Open Data et le résultat de l'application de cette directive. Des administrations ont ouvert leurs données géographiques, mais quid des autres données citoyennes ? Celles qui correspondent vraiment au mouvement Open Data.
Le moyen technique permettant de concrétiser ces volontés est l'Internet 2.0, qui amène au plus grand nombre la possibilité de créer et d'interagir dans une nouvelle société en mouvement.
L'Open Data découle de toute cette histoire. Il est un des outils pour la construction d'un nouveau mode de gouvernance pour les républiques démocratiques.
S6 - Origine - FR, UK, US
Au États-Unis une loi ressemblant à la loi C.A.D.A. française est voté en 1966, c'est la “Freedom of Information Act”. Celle-ci oblige les agences fédérales à fournir leurs documents à qui les demande. Cette loi est une réponse à l'opinion publique qui pendant la guerre du viêt Nam exigeait un accès aux documents administratifs. Mais suite aux attentats de 2001, l'application de cette loi a été affaibli. En 2007, un retour vers la transparence est initié avec le Open Government Act.
Mais c'est en 2009 à son arrivée au pouvoir que le président Barak Obama a amené l'initiative de Gouvernement Ouvert (Open Gouvernement Initiative), dans laquelle la transparence et la participation des citoyens sont centrales pour construire une gouvernance collaborative. L'Open Data est l'un des outils de ce projet.
Le portail data.gov d'accès aux données publiques américaines est créé.
Le Royaume-Uni suit le mouvement en ouvrant sont portail d'accès au données publiques en 2010.
Mais la France n'est pas en reste. S'il a fallu attendre fin 2011 pour voir le portail de l’État français data.gouv.fr s'ouvrir, c'est depuis 1980 que les publications du Journal Officiel sont disponibles via le Minitel. Celui-ci est porté vers Internet en 2002. D'autres sites de diffusion d'information publique ont vu le jour pour chaque ministère et chaque institut nationale.
Mais la diffusion des données publiques tel que définie par l'Open Data n'a commencé en France qu'en 2010 avec l'ouverture du portail de données de la ville de Rennes, puis la ville de Paris, et d'autres ont suivis.
S7 - Origine - Carte de France
Avant de présenter les différents aspects de l'Open Data je vous propose de jeter un oeil sur l'état de la libération des données publiques en France au 1er janvier 2012.
Cette représentation est quelque peu subjective dans le sens où toutes les initiatives ne respectent pas forcément toutes les règles de l'Open Data. Mais nous sommes au début, et le démarrage est prometteur.
S8 - Objectifs - Cercle vertueux
L’ouverture des données publiques contribue a créer un cercle vertueux qui constitue un levier puissant pour réformer les services publics, favoriser l'innovation, et remettre le pouvoir entre les mains des citoyens.
Attention, ne soyons pas naïf, ce cercle vertueux ne se formera pas sans combattre. Les données sont un pouvoir, pas seulement financier, que certaines administrations ne lâcherons pas facilement.
S9 - Objectifs - Valeurs
Valorisation :
Les données libérées sont une matière premier pour l'économie numérique et vont permettre le développement de nouveaux services et de nouveaux usages.
Elles sont aussi un moyen pour revaloriser l'image de l'administration au service des citoyens.
Cette ouverture va également améliorer, re-dynamiser le fonctionnement de nos institutions.
Innovation:
C'est aussi une matière première pour l'innovation. Les chercheurs, les entreprises vont pouvoir inventer à partir de ces données publiques. Ce qui peut être un levier pour dynamiser une économie locale.
Transparence:
On ne construit de débat objectif qu'à partir de données brutes, non retraitées pour la communication. Cette transparence des données permettra une meilleur visibilité entre perception et réalité.
Lien social:
Le lien social peut-être renforcé grâce à une meilleur collaboration des pouvoirs public avec la société civile. Les dicisions politiques pourront être éclairées de manière plus objective et avec des acteurs mieux informés.
S10 - Objectifs - données ouvertes
J'ai parlé précédemment des règles de l'Open Data. Voyons ce qu'il en retourne.
Qu'est-ce qu'une données ouverte ? Une données libre ?
- Complète : Toutes les données doivent être mise à disposition sans exception. Seules les données exclues ne sont pas publiées, il s'agit des données concernant la vie privée (données nominatives) et celles concernant la sécurité.
- Primaire : Les données sont publiées telle que collectées à la source, sans être agrégées ni modifiées
- Opportune : Pour préserver leur valeur les données ne doivent pas être obsolètes. Elles doivent être publiées aussi rapidement que possible et être tenues à jour.
- Accessible : Les données doivent être accessibles au plus grand nombre sans aucune limitation pour leur réutilisation.
- Exploitable : Elles doivent pouvoir être utilisées par les humains ET les machines. Pour ce faire elles doivent être structurées et documentées.
- Non-discriminatoire : Tout le monde peut avoir accès aux données sans demande préalable et quelques soit sont statut, sa nationalité…
- Non propriétaire : Les données sont publiées de façon qu'aucune entité ne dispose d'un contrôle exclusif (format, licence)
- Libre de droits : On doit pouvoir utiliser les données sans clause commerciale, brevet ou autre protection juridique.
S11 - Objectifs - producteurs
Il y a énormément de producteurs de données publiques.
Il y a les ministères, les collectivités locales, les instituts nationales ou locaux, mais aussi les opérateurs ayant une délégation de service publique.
S12 - Objectifs - données
- Décisions politiques et juridiques : projets, enquêtes, délibérations
- Fonds documentaires : études, statistiques, réglementations
- Utilisation des territoires : carte, cadastre, occupation des sols
- Économique : marchés publiques, développement local, analyses sectorielles
- Santé publique : assainissement, polluants, infections des populations
- Environnementales : conditions naturelles, air, eau, mais aussi la faune, la flore
- Fonctionnement des réseaux : distribution de l'eau et de l'énergie, les transports, la logistique, les télécommunications.
- Occupation et flux des ressources : voirie, bâtiments, parkings
- Tourisme : patrimoine, activités
- Culture : événements, lieux, archives
Faisons une pause avant de continuer la théorie en regardant à quoi peu ressembler un portail Open Data.
S13 - pilote41.fr
Une liste de données organisée par thématique.
S14 - opendata71.fr
Un portail Open Data, pour ne pas créer de surcoût, n'est pas obligé d'avoir des outils de visualisation des données.
Mais c'est indéniablement un plus.
S15 - Aspects - Légal 1
Reprenons le chemin théorique en approfondissant l'aspect légal de la l'ouverture, de la libération des données publiques.
L'accès aux données publiques est un droit opposable en France.
Je vous est parlé de la loi de 1978 a visée démocratique et pro-transparence, d'ailleurs une des 1ères en Europe, qui a créé la CADA, Commission d'Accès au Documents Administratifs, une autorité indépendante visant à faciliter et contrôler l'accès aux D.A..
La CADA émet des conseils quand elle est saisie par une administration, mais son activité principale est de fournir des avis aux particuliers qui se heurtent au refus d'une administration de communiquer un ou plusieurs documents qu'elle détient.
Pour mieux concrétiser cette volonté a été aussi créé les PRADA, les Personnes Responsables de l’Accès aux Documents Administratifs, qui ont pour mission d'être l'interlocuteur unique de la CADA pour l'instruction des demandes. Les PRADA sont obligatoires dans les collectivités de plus de 10.000 habitants et dans les administrations de plus de 200 salariés.
Tempérons notre joie, il reste des améliorations à apporter car la CADA n'a pas de pouvoir d'investigation, ni de liste des documents existants, c'est aux citoyens de les identifier.
Il y a même eu des lois qui risquaient d'aller à l'opposée, comme la “loi d’orientation et de programmation sur la performance de la sécurité intérieure” (LOPPSI2), qui devait instaurer “un contrôle de comportement” préalable à la réutilisation de données publiques. Heureusement, quelques 35 associations, dont Regards Citoyens et La Quadrature du Net ont réussi à faire retirer cette disposition.
L'accès aux données publiques est donc un droit opposable en France.
Et pourtant il reste des exceptions, comme le Code du patrimoine public.
Le Code du patrimoine pose un principe général: les archives publiques sont communicables de plein droit. Il précise également que, par dérogation à ce principe, certaines catégories d'archives publiques ne sont communicables de plein droit qu'au terme d'un délai déterminé.
Mais en fouillant plus profondément sur le site des Archives Nationales on trouve à propos de la “Reproduction et réutilisation des informations publiques” que les archives nationales bénéficient d’un régime dérogatoire et fixent elles-mêmes leurs règles de réutilisation des données publiques. Et c'est comme ça que l'on trouve dans les mentions légales de leur site la clause suivante concernant les informations publiques: Toute reproduction ou diffusion, totale ou partielle, des contenus multimédia, sonores ou textuels des pages ainsi que des bases mises en ligne par les Archives nationales est strictement interdite.
Données exclues
Les seules exceptions qui devraient exister sont les données exclues, à savoir:
- Les données nominatives
- de sécurité
S16 - Aspects - Légal 2
Le producteur n'est pas responsable des inexactitudes, des erreurs ou omissions dans le contenu des données.
Sa responsabilité s'arrête aux spécifications techniques (précision, mise à jour, couverture…).
Le ré-utilisateur exploite les données à ses risques et périls.
Imaginez que l'itinéraire que vous avez constitué à partir de données géographiques publiques vous indique de tourner à gauche, mais que le pont qui devrait enjamber le précipice a été détruit l'année précédente.
Licences
Durant toutes ces années de tentatives de transparence par l'ouverture des données publiques, de nombreuses initiatives ont été lancées pour créer des licences encadrant l'ouverture des données publiques.
En 2010 le Ministère de la Justice a inventé Licence “Information publique librement réutilisable”. Mais cette licence comporte des incohérences à propos de la “non-altération des informations” et la “dénaturation du sens”.
Il y a aussi les licences de l'APIE, Agence du patrimoine immatériel de l’État. Ces licences ont été décriées par les promoteurs de l'Open Data pour leur clauses trop compliquées et sujette à ambiguïté. Alors que cette agence devait travaillé en collaboration tous les ministères elle s'est mise à publier des licences, d'où une période de “Guerre des licences”. Aujourd'hui, le site de l'APIE propose par défaut d'utiliser la licence ouverte conçue par la mission EtatLab.
Enfin, en 2011, la mission EtatLab, mission lancée par le 1er Ministre pour initier et stimuler un mouvement Open Data français cohérent a rédigé la “Licence ouverte” qui est cette fois compatible avec les règles de liberté promues par l'Open Data.
La « Licence Ouverte / Open Licence » présente les caractéristiques suivantes :
- Une grande liberté de réutilisation des informations :
- Une licence ouverte, libre et gratuite, qui apporte la sécurité juridique nécessaire aux producteurs et aux ré-utilisateurs des données publiques ;
- qui promeut la réutilisation la plus large en autorisant la reproduction, la redistribution, l’adaptation et l’exploitation commerciale des données ;
- qui s’inscrit dans un contexte international en étant compatible avec les standards des licences Open Data développées à l’étranger ainsi que les autres standards internationaux (ODC-BY, CC-BY 2.0).
- Une exigence forte de transparence de la donnée et de qualité des sources en rendant obligatoire la mention de la paternité.
- Une opportunité de mutualisation pour les autres données publiques en mettant en place un standard réutilisable par les collectivités territoriales.
S17 - Aspects - Eco, TCO1
Les données existent, il ne reste qu'à les publier.
Pour ce faire, il faut:
- de logiciels
- de la bande passante et du volume de stockage.
- pour la petite histoire, afin de réduire le coût de la bande passante le gouvernement du Royaume-Uni a utilisé le protocole BitTorrent (P2P Peer-to-Peer).
- Et bien sûr, pour assurer la qualité et la pérennité du service il faut du personnel pour gérer les mises à jour et le support aux utilisateurs.
Perte de revenus
- Certains disent qu'il s'agit d'un prétexte pour camoufler la réticence des administrations à perdre le contrôle sur leurs données.
- Il s'agit souvent d'un calcul inexacte, le prix des licences est fixé notamment pour financer le coût de leur gestion : gestion de la facturation, juristes, comptabilité, relations clients… Mais en fonction du nombre de licenciés, souvent peu nombreux, les revenus liés peuvent ne pas couvrir ces frais, rendant alors cette gestion contre-productive.
Et concernant la Ville de Rennes, celle-ci a fait le bilan, et seulement moins de 2% de ses données ont une valeur marchande.
S18 - Aspects - Eco, TCO2
Investissements réalisés
Des infrastructures existantes
Il existe des logiciels
S19 - Aspects - Eco, ROI 1
Plus de services en faisant des économies
- L'administration ne peut pas suivre, surtout en ces temps de vaches maigres.
L'administration devient plus efficiente
S20 - Aspects - Eco, ROI 2
Innovation
Les études économiques disent que les TIC comptent pour 25% de la croissance depuis plusieurs années, alors fournissons lui de la matière 1ère.
Politique augmentée
grâce à des citoyens mieux informés, et mieux outillés.
S21 - Aspects - Eco, Social 1
L'Open Data n'est qu'un outil.
La détention exclusive des données publiques est un danger pour la démocratie, il faut donc les libérer. Mais les données publiques ne sont qu'une représentation de la vie de notre société, il faut encore leur donner un sens.
Il est donc nécessaire de développer une interprétation culturelle de cet outil.
S22 - Aspects - Eco, Social 2
Car l'Open Data libère aussi des données sensibles, qui si elles sont livrées tel quelles sans culture pour les interpréter, risque d’entacher le bel objectif porté par l'Open Data.
* La criminalité
- data.cityofchicago.org/Public-Safety
Il faut faire attention à ne pas créer des ghettos.
Ne pas enfoncer les territoires pauvres, mais rechercher leur valorisation par une recherche des opportunités valorisantes.
Ne pas trop dégraisser le “mammouth”.
Ne pas stresser les services publics.
S23 - Aspects - Eco, Social 3
La démocratie se limite-t-elle au vote ?
- Plus de transparence amène plus de participation.
- Plus de participation amène plus de collaboration
- Plus de collaboration amène de meilleurs idées
- De meilleurs idées amène à une meilleur démocratie
Crowdsourcing
Un nouveau concept vient renforcé l'Open Data, il s'agit du Crowdsourcing que l'on peut traduire par “à l'origine de la foule”.
Il s'agit de la création de valeurs par un grand nombre de membres d'un groupe. Chacun, avec le temps et les moyens qu'il a à sa disponibilité, contribue à enrichir un savoir.
Devant la masse de données libérées, et pour ne pas reproduire le phénomène de détention exclusive des données par un petit nombre, le crowdsourcing est un moyen de collaborer en contribuant selon ses capacités.