Table des matières

Draft Conférence Open Data

Mais qu'est-ce que l'Open Data

De façon à ne pas vous perdre dès le début, voici une première réponse simple et rapide: L'Open Data c'est la libération des données publiques de façon à les rendre accessibles et réutilisables par le plus grand nombre.

Un peu de Sémantique

Le terme Open est défini comme la liberté d’utiliser, de réutiliser, de redistribuer plus ou moins librement l’œuvre originale. Il est notamment utilisé pour les démarches basées sur des alternatives éthiques ou solidaires de partage libre des savoirs, avec notamment l'utilisation de licences libres. Dans le mouvement Open Data, le terme “Open” s'inscrit dans une démarche plus vaste de transparence et de participation des citoyens.

Le terme Data qui en anglais veut dire données, prend dans le mouvement Open Data le sens de connaissance qui peut être statistique, géographique mais aussi administrative, financière ou politique. Grandes productrices de données, les collectivités conservent depuis longtemps cette “matière grise” dans des bases de données stockées sur des serveurs informatiques. Ces bases, alimentées chaque jour en informations fraîches, racontent une histoire d'une collectivité, d'un territoire, de son impact sur l’environnement et de son environnement lui-même (habitants, usagés, équipements, ressources, investissements, etc).

Et concrètement ?

Le mouvement de l'Open Data s'inscrit dans deux autres mouvements qui sont:

TIC : technologies de l'information et de la communication, dont l'Internet.

Quels objectifs ?

Il est donc question de libérer les données publiques de façon à les rendre accessibles et réutilisables par le plus grand nombre. Mais dans quels objectifs ?

Ces données numériques, une fois passées au filtre des critères de protection des données personnelles (cf. CNIL), constituent une véritable mine d’or si on sait en exploiter le potentiel. Mieux comprises et mieux utilisées, elles peuvent délivrer des informations à forte valeur ajoutée utiles aux entreprises et collectivités (intelligence économique et territoriale ; innovation de services), aux citoyens (transparence démocratique et action civique), aux journalistes et aux chercheurs (sources d’information).

Transparence, confiance, participation, coproduction et efficacité sont donc au cœur de la démarche Open Data.

Quelles données publiques ?

Les données publiques sont les données acquises et générées par l'administration dans le cadres de son fonctionnement et de ses missions.

Il y a les grands producteurs nationaux de données publiques :

Mais aussi toutes les données produites par nos collectivités régionales (CR), départementales (CG) et communales :

Et n'oublions pas les opérateurs de services publics, syndicats et entreprises privées, comme :

Allons-y

Dans la suite de cette présentation je vais essayer de rester concentré sur la libération des données publiques ouvertes des collectivités et administrations, celles qui concernent la société civile.

En passant, j'insiste sur le terme Libération parce que ces données publiques, pour une grande part ont toujours été ouvertes (au public), mais elles demandent souvent beaucoup d'énergie pour y accéder. Alors qu'attendons-nous pour les libérer !

Pour en savoir plus:

Un peu d'Histoire

Quoi de plus démocratique que de rendre les données à ceux qui les financent ?

Les données publiques ouvertes ont vu le jour aux États-Unis dès 1966 avec l'adoption de la loi sur le libre accès à l'information, la Freedom of Information Act, amendée plusieurs fois notamment en 2007 par la loi OPEN Government Act. La libération des données s'est développée de manière formelle avec l’élection de Barack Obama, qui, dès son investiture à dévoilé son intention de « créer un niveau d’ouverture du gouvernement sans précédent ». En mars 2009 que le projet http://data.gov est lancé

Au Royaume Uni, un projet analogue a officiellement été lancé en janvier 2010. Le projet oblige le gouvernement à publier, entre autres, toute dépense supérieure à 25.000 £.

En France, l'ouverture a commencé dans le domaine du droit. Dès 1980 avec le service du Journal Officiel accessible par le Minitel, et s'est continuée en 2002 par l'ouverture du site Légifrance http://legifrance.gouv.fr, service public de la diffusion du droit par l’internet. Le site du Journal Officiel http://www.journal-officiel.gouv.fr/ a dû attendre 2004 pour quitter son Minitel et passer sur Internet. Et 2010 a vu naître des initiatives Open Data de collectivités grâce aux villes de Paris et Rennes.

Mais n'oublions pas le fondement de notre république, dans l'Article XV de la déclaration des droits de l'homme et du citoyen de 1789: « La Société a le droit de demander compte à tout Agent public de son administration. ».

Agenda 21 (1992) : Plan d'action pour le XXIe siècle adopté par 173 États lors du sommet de la Terre à Rio en 1992.

INSPIRE (2007) : Attention à ne pas confondre Open Data et le résultat de l'application de la directive INSPIRE (Infrastructure for Spatial Information in the European Community) qui impose aux autorités publiques, d’une part de rendre ces données accessibles au public en les publiant sur Internet, d’autre part de les partager entre elles.
Des administrations ont ouvert leurs données géographiques, mais quid des autres données citoyennes ? Celles qui correspondent vraiment au mouvement Open Data, qui rappelons-le n'est qu'un des outils de l'Open Gouvernement.

Aujourd'hui, en France c'est le printemps de l'Open Data. On voit pousser des projets un peu partout.

Pour aller plus loin:

Aspects Légaux

Un droit opposable

L'accès aux données publiques est un droit opposable en France.

A la fin des années 70, en pleine période d’informatisation des administrations, l'état légifère et créé la loi du 17 juillet 1978 qui reconnaît à toute personne un droit très large d'obtenir communication des documents détenus par une administration, quels que soient leur forme ou leur support. Ce droit s'exerce à l'égard de toutes les administrations publiques ainsi qu'à l'égard des organismes privés chargés d'une mission de service public.

Cette loi a créé:

Les PRADAs sont obligatoires dans les collectivités de plus de 10 000 habitants et dans les administrations de plus de 200 salariés.

D'autres lois ont été crées, comme la Directive 2003/98/CE du Parlement européen et du Conseil du 14 novembre 2003 sur l'utilisation des informations du secteur public transposée en droit français par l'Ordonnance 2005/650 du 6 juin 2005 et par le décret n° 2005/1755 du 30 décembre 2005 relatif à la liberté d'accès aux documents administratifs et à la réutilisation des données publiques.

Cette directive précise notamment que : ” les informations publiques doivent pouvoir être réutilisées à des fins commerciales ou non, d'une manière non discriminatoire et non exclusive, et à des coûts qui n'excèdent pas leur coût de production”.

La transparence et le droit d’accès à l’information se retrouvent ensuite mis en avant dans tous les programmes successifs d’e-administration (programme Pagsi sous le gouvernement Jospin, le plan ReSo sous Raffarin …). Mais la transparence ne crée pas à elle seule la confiance et dans l’Open Data, c’est la transparence des données qui est retenue, non pas celle du processus politique.

Ces lois prétendent mettre un terme aux problèmes d'accès aux données publiques, pourtant il reste des exceptions.

Par exemple pour l'accès au patrimoine publique. Prenons comme exemple le site des archives nationales.

Mais en fouillant plus profondément [2] on trouve à propos de la “Reproduction et réutilisation des informations publiques” que les archives nationales bénéficient d’un régime dérogatoire et fixent elles-mêmes leurs règles de réutilisation des données publiques. Et c'est comme ça que l'on trouve dans les mentions légales de leur site la clause suivante concernant les informations publiques: Toute reproduction ou diffusion, totale ou partielle, des contenus multimédia, sonores ou textuels des pages ainsi que des bases mises en ligne par les Archives nationales est strictement interdite.

En savoir plus:

Les données concernées

Les données publiques sont celles que possèdent les entités publiques et sur lesquelles elles ont les droits.

A titre d'exemple: Transport, Cartographie, Géographie, Culture, Statistiques, Sociologie, Environnement, Juridique

Les organismes CADA et ses PRADAs sont à même d'identifier les services qui possède les données.

L'Open Data ce n'est pas comme wikileaks ;-)

Données nominatives

Le cadre légal est clair : les données nominatives, à caractère privé, ne sont pas des données publiques ouvrables et ne sont pas concernées par l'Open Data. Il n'est pour l'instant même pas envisagé de les “anonymisées”.

Données de sécurité

Les données attendues sont les données publiques, telles que définies par la loi sur le droit d'accès à l'information. Les données classées secret-d’État ou secret-défense ne sont donc pas concernées.

Données sensibles

Les institutions et les décideurs rechignent à communiquer des données sensibles, pouvant mettre à jour un défaut d’action publique.

La difficulté d’accéder à certaines données par exemple celles liées à l’insalubrité des logements (saturnisme), ou à la santé publique (chiffres statistiques nationaux du cancer du sein). Ces données existent à des échelles micro-locales, mais leur consolidation nationale n’est pas partagée.

Limites de responsabilité

Les producteurs de données craignent les retombées de responsabilité légale. Pourtant ils ont déjà conscient du problème puisque leur CGV/CGU en tiennent déjà compte. Donc rien de nouveau avec l'Open Data.

De façon général le producteur, dans son contrat de réutilisation, se désengage des réutilisations pouvant être faites avec ses données. Il n'est pas responsable des usages et sa responsabilité porte seulement sur la mise à disposition.

Licence

La libéralisation des données se fait par le biais de licences qui fixent les conditions dans lesquelles ces données pourront être copiées, diffusées, réutilisées.

Aspects Financiers

Internet, facteur de croissance

Depuis l’an 2000, la contribution d’Internet à la croissance de l’économie française s’est accélérée : 10 % au cours des 15 dernières années, 20 % sur la période 2005-2009, et 25 % entre 2009 et 2010.

Le Web apparaît comme l’un des principaux facteurs de la croissance française depuis 15 ans, et aurait contribué au quart environ de la progression du PIB français en 2010. Par ailleurs, Internet a, en l’espace de 15 ans, permis la création nette de 700 000 emplois, soit un quart du total des créations nettes d’emplois en France sur cette période.

De l'argent et de l'énergie à perte

L'énergie investie à libérer des données serait peine perdue parce qu'il n'y aura pas assez de ré utilisateurs et valorisateurs ?

Il est a noté que déjà des moyens énormes sont mis en œuvre pour la production et l'ouverture des données publiques. Les libérer ne doit pas engendrer de sur-coûts notoires.

L'open data est une mode passagère ?

Plus de services en faisant des économies

L'évolution des besoins des citoyens croit à grande vitesse, trop rapidement pour permettre aux administrations et collectivités de suivre la cadence d'autant qu'elles sont limitées financièrement, surtout en cette période de vache maigre. Heureusement les applications de ré-utilisation des données publiques sont réalisées et produites par les utilisateurs (citoyens et entreprises)

Le producteur peut arguer qu'il n'a pas les compétences en interne. Mais la mise à disposition des données ne nécessite pas de compétences plus poussées que celles permettant la réalisation d'un site web. Et aujourd'hui il y a même une plate-forme d’État qui propose d'héberger gratuitement les données des collectivités. Le travail se résume donc à utiliser un site web pour y déposer des fichiers.

Coût de l'Open Data

Le coût et le TCO (coût total de la possession) de la mise à disposition des données publiques ne pourra pas être le même selon les collectivités, mais quelques exemples permettent de ce rendre compte:

La Ville de Rennes (212 229 habitants):

Département de la Saône et Loire 71 (554 720 habitants):

Le site gouvernemental data.gouv.fr

Pour la petite histoire, un rond-point coûte entre 100 000 et 1 million € d'après le Centre d'études techniques de l'équipement (CETE).

L'investissement est donc principalement humain.

Pour le démarrage du projet, le temps du formatage des données et du lancement certains services estiment la surcharge de travail à 20% durant 4 mois. Ensuite pour la vie du projet il faut se fonder sur des sources existantes qui auront put être adaptées lors de la phase de démarrage et le coût se limitera au téléchargement des fichiers et au support des utilisateurs et à une éventuelle (si nécessaire) mise en valeur des données.

Retour sur investissement (ROI)

Concernant les données des collectivités qui n'ont à priori pas de valeur marchande, la finalité est réellement de permettre à chacun d’utiliser des données d’utilité publique de manière à innover en créant de nouveaux services et usages, gratuits comme payants (qui peuvent avoir de réels modèles économiques motivés par l’ajout de valeur par rapport aux données brutes).

Ces nouveaux services conçus par et pour la communauté répondent à des besoins réels et spécifiques.

Concernant les données publiques à valeur marchandes, je n'ai pas encore de source variés. Mais dans le cadre de la ville de Rennes elle ne représentent que 2% du total. On peut donc pour l'instant les laisser de côté pour commencer un projet Open Data.

Autres modèles économiques

La collectivité qui ne souhaite pas s'engager peut aussi renoncer à exposer elle-même ses données et en confier la tâche à d'autres. Elle ne se concentre que sur l'aspect juridique de leur réutilisation et laisse d'autres acteurs les exposer et les valoriser. Une sorte de délégation de service public centré sur l'accès aux données : des “data stores” organisés en associations ou entreprises qui pourraient développer des économies d'échelle dans l’agrégation de sources, des sociétés de droit privé qui achèteraient des droits d'utilisation de licences…

Aspects Sociaux

L'Open Data est au cœur de la vie d'aujourd'hui. Les données ouvertes sont une représentation de la vie des collectivités et des administrations, qui n'ont d’existence que l'organisation notre vie de tous les jours.

Quand on a analysé par les chiffres que les réseaux d’eau étaient de meilleure qualité dans tel quartier riche plutôt que tel autre plus pauvre, comment faut-il s’y prendre pour agir en tant que citoyen ?

Avec l’Open Data, la problématique de l’accès à l’information est résolue. Mais la donnée brute n’est pas de l’information, elle n’a pas de pouvoir en soi. C'est un un préalable, mais n’est pas suffisant. « La force de la donnée c’est ce qu’on en fait », c’est-à-dire comment et avec qui on la partage, comment on la réutilise, on la compare, ce qu’elle produit comme informations supplémentaires.

C'est pourquoi il est nécessaire de développer une interprétation culturel de cet outil.

Éviter la ségrégation

La libération des données publiques n'a pas une seule forme, elle doit être adapté à la culture locale. Pour ce faire, le citoyen ne doit pas être seulement invité à ré-utiliser les données, mais aussi à débattre et exprimer son avis sur les formes de cette ré-utilisation, et ce dès la phase d'étude du projet Open Data. Toutes les idées sont bonnes mais leur succès dépendront de leur interprétation.

Par exemple la cartographie en temps (presque) réel de la criminalité dans les rues d'une commune n'est peut-être pas utile à la notion du vivre ensemble.

Le principe de FixMyStreet, le site anglais permettant de rapporter les dégâts sur la voie publique, est très intéressant, mais il ne doit pas générer de stress au sein des services des municipalités sous peine de détruire un des apports de l'Open Data: “améliorer les rapports entre le citoyen et ses administrations”.

On peut aussi réutiliser des données sur les financements sociaux ou sur les réussites scolaires, mais il ne faut pas que cela serve à stigmatiser des quartiers, à créer des ghettos.

Démocratie participative

Comment construire les conditions de réussite de la rencontre entre démocratie participative et open data ?

La rhétorique politique de l’Open Data fait une large place aux enjeux citoyens : la transparence des données, l’amélioration du service rendu aux usagers, l'augmentation des capacités d’interpellation citoyennes. Paradoxalement, les acteurs portant la dynamique, dans le secteur public comme associatif, sont issus généralement d’univers plus techniques. C’est peut-être pour ça que les acteurs traditionnels de la démocratie participative, associatifs, militants, ne se sont pas emparés du sujet jusqu’à présent.

L’association Regards Citoyens (2009) (http://Nosdeputes.fr) est venue à l’Open Data par ce biais-là : une vigilance portée à la transparence des processus et des actions en politique.

Regards Citoyens est parti du postula qu'il y avait énormément d'informations publiées par l'Assemblée Nationale mais que ça représentait des pages et des pages, ce qui rendait ces informations difficilement appréhensibles par le public.

Par exemple l'une des études (RC & Transparence Internationale) a porté sur le lobbying auprès des parlementaires. Il a s'agit d'analyser les documents des auditions (9 000 documents) des commissions parlementaires pour en extraire les organisations auditionnées (ong, institutions, entreprises) les plus écoutées. Il s'agit donc dans cet exemple du création de données à partir des données publiques.

Mais le succès de Regards Citoyens ne doivent pas cacher leur caractère d’exception dans le panorama français.

http://Nosdeputes.fr

Co-production

Et quand la société civile se met à produire des données ?

De façon traditionnelle la production de données par les citoyens existe depuis longtemps dans les domaine de l'astronomie, la botanique, de la météorologie.

Plus récemment, des initiatives comme NosDeputes.fr, et aussi le projet de cartographie mondial Open Street Map qui consiste à créer une carte du monde la plus précise et la plus à jour possible, grâce à la contribution de centaines de milliers de contributeurs.

Nouveau terme: le crowd-sourcing (crowd=la foule, source=origine). C'est une forme pour dire aux acteurs publiques qu'ils ne sont pas les seuls à produire des données que si vous ne voulez pas les produire nous le ferons à votre place.

La co-production des données publiques, facilitée par les moyens que nous offre le Web 2.0, peut-être poussée plus loin: les acteurs publics pourraient ouvrir leurs systèmes d'information aux citoyens pour qu'ils y intègrent ses connaissances.

exemple: FixMyStreet.com en Angleterre le site pour designer les défauts sur la voie publique.

Il pourrait aussi en être de même entre acteurs public, ce qui permettrait dans bien des cas d'en améliorer l'efficacité.

Aspect technique

Présentation des données

Les données doivent être présentées de façon intelligibles, c'est à dire qu'au minimum une notice doit les accompagner pour décrire les nomenclatures utilisées.

Un responsable de données ouvertes doit être clairement identifié et joignable.

La date de dernière mise à jour doit être indiquée. Et si possible, un historique des versions doit être proposé.

Format ouvert

Les données ouvertes sont soumises à une seule contrainte technique; elles doivent être accessibles par tous types de machines pour permettre leur exploitation. On dit qu'elle doivent être interopérables. Pour être interopérables, les données sont proposées dans des formats ouverts, standardisés et parfaitement utilisables par tous.

En mode dégradé d'ouverture des données, les mettre à disposition dans le format possédé en interne (Si la licence le permet) et laisser au ré-utilisateurs le soin des les convertir.

Les collectivités et administrations devront intégrer dans les achats et appels d'offre cette contrainte de formats ouverts et rediffusables.

Recherche de données

Le service de mise à disposition sur Internet doit proposer au minimum un système de recherche des données. Toujours dans la volonté de faciliter l'accès au plus grand nombre ce moteur de recherche doit proposer une recherche par mots clés mais aussi par catégorie, thématique ou toutes autres segmentations pertinentes.

Ce service est encouragé d'utiliser les standards du web maintenus par l'organisme W3C notamment tous les standards proposés dans le cadre du Web Semantique, comme par exemple:

En pratique

Data Journalisme

Le data journalisme ou journalisme de données, c’est l’exploitation de données numériques disponibles et donc réutilisables sous des formats plus ou moins structurés. Il s’agit, en amont ou en aval d’un reportage, d’utiliser des bases de données comme source d’informations pour les analyser, en extraire l’essentiel et représenter cette information en images. Le data journaliste donne ainsi à lire des histoires via des formes de visualisation adaptées aux potentialités du web : les visualisations sont interactives et permettent plusieurs niveaux d’entrées dans l’information.

Ces nouvelles sources d’informations que constituent les bases de données, cette nouvelle manière de la chercher représentent pour les journalistes un nouveau terrain d’investigation.

Conclusion

Carte de France des initiatives d'ouverture des données publiques, état du 1er janvier 2012 par Libertic

L'Open Data est peut-être l'outil pour passer la 3ème révolution industrielle, à cette nouvelle économie qui se dessine. Après le productivisme, le consumérisme on passerait au contributif. Apprendre à développer un écosystème de contributeurs, gérer la participation, utiliser les outils collaboratifs, améliorer l'efficacité, etc… C'est l'opportunité qu'il y a derrière les projets Open Data, une modernisation des modes de travail et d'échange, adaptés aux outils et enjeux du 21eme siècle, c est à cela que devrait servir l open data pour les administrations.

Malgré tout cet argumentaire qui semble coulé de source, L'Open Data ressemble à une révolution. C'est probablement que ce mouvement est bien éloigné des mœurs administratives françaises qui ont souvent pratiqué le culte du secret pour l’accès aux données et qui, lorsqu’elles y donnent accès, en interdisent par principe, par culture, toute utilisation dans un cadre qu’elles n’auraient pas défini par avance.

L’Open Data est un véritable changement de paradigme pour l’acteur public. C’est une nouvelle posture d’ouverture et de participation car la valeur produite vient du partage de la donnée, de l’ampleur et de la pertinence de sa réutilisation. Or celle-ci ne se fera pas forcément spontanément. L’acteur public va devoir jouer un rôle fort d’animation pour faire connaître les données existantes, pour inciter, soutenir, induire des réutilisations. Il va aussi être en posture de ré-utilisateur de données produites par d’autres acteurs publics.

Et tout ceci ne se fera pas sans nous, les gentils citoyens !

Divers

Approfondir

N'ayons pas peur des chinois à Paris (Les Chinois à Paris de Jean Yanne 1974)

Définition: société civile, acteurs publics.

stigmatisation, ségrégation:

LES DATA INUTILES

“ … figurez-vous que le responsable de Paris a dit que la toute première utilisation concrète par des tiers des données étaient les… sanisettes. Une société a développé une application iPhone pour ça.” Finalement, ça peut être bien pratique de savoir via son smartphone où sont les sanisettes du quartier. Tout dépend du niveau de civilité des habitant de la ville ”. De quoi a le plus besoin la démocratie locale ? De l’emplacement des clubs du troisième âge ou du montant des subventions ? Le débat continue…

checklists OD : https://checklists.opquast.com/490/criteria/16302/#body

Faire les slides

3 axes pour l'opendata de LiberTIC.

Exemples app france

Plan (heatmap) des sanisettes de Toulouse: http://static.tetalab.org/sanimap.html

http://www.centroscope.org/?p=2322