Position – L'ouverture des données publiques : les risques d'une bonne idée
Dépenses de la sécurité sociale, résultat des élections, chiffres de la délinquance, fiscalité locale : l’ouverture des données publiques crée des possibilités inédites, porteuses de progrès démocratique et de renouveau économique. Mais elle comporte aussi des risques encore informulés.
La capacité d’opérateurs comme Google à analyser des masses gigantesques de données numériques amène certes à relativiser la valeur des données publiques. Sur nombre de sujets, de l’épidémiologie à la délinquance, les données incomplètes et mal structurées qui transitent chaque seconde sur l’internet permettent déjà de construire une représentation très précise de la réalité, et de le faire en temps réel. Mais les données publiques ont une qualité particulière, du fait des procédures de recueil et de leur formalisation a priori. Nous parlons bien sûr de données qui ne sont ni personnelles, ni nominatives, ni sensibles pour la sécurité mais dont l’ouverture au public reste sensible, car si l’on accepte volontiers un certain monopole de l’État sur des données utiles à son action, que peut-il se passer avec une large dissémination ?
Pour autant, un puissant mouvement va aujourd’hui dans le sens de l’ouverture des données publiques. Ce phénomène est récent : la notion d’open government est apparue en 2007, l’administration Obama en a fait un élément clé de son action dès 2009, et la France a suivi en 2010.
De quoi s’agit-il précisément, et en quoi l’ouverture des données publiques diffère-t-elle de leur simple publication ? Jusqu’ici, n’étaient véritablement publiés que les résultats agrégés d’un corpus de données relativement restreint. Avec l’open data, on parle de mettre à la disposition du public des données brutes. Cela couvre un champ immense, des informations d’une municipalité sur l’état de sa voirie aux données à partir desquelles on calcule les « chiffres de l’emploi », en passant par des fichiers d’horaires de bus, etc.
À quels enjeux répond cette démarche ? Le premier est démocratique. L’ouverture des données publiques s’inscrit dans un souci de transparence de l’action publique et de participation citoyenne. On attend aujourd’hui du pouvoir politique et administratif qu’il soit capable de motiver ses décisions et d’en rendre compte, en livrant les bases de ses raisonnements pour que chacun puisse les reprendre et les critiquer. Scientifiques et universitaires le font depuis longtemps ; avec l’internet, la société tout entière veut entrer dans une relation fondée sur le partage de l’information.
Cet enjeu se double d’une dynamique économique et sociale directement liée à la révolution numérique. De plus en plus, les données sont vues comme une ressource, à partir de laquelle on peut créer de la valeur1. Une base de données peut révéler des besoins insatisfaits, et susciter en retour une offre de services de la part d’acteurs variés : l’administration, si on lui en adresse la demande, des associations ou des entreprises. Les données permettent aux tiers (citoyens, associations, entreprises) de prendre des décisions mieux informées. L’enjeu est de remettre en circulation la valeur de l’information ; de valoriser, en somme, un bien public. On comprend dans ces conditions que l’open data ait ses militants : il y a là de quoi changer le monde. Mais des débats existent.
Le premier concerne la confidentialité. Les lois qui ont créé en 1978 la Commission d’accès aux documents administratifs (Cada) et la Commission nationale de l’informatique et des libertés (Cnil) ont été rédigées avec en mémoire les dérives de Vichy. Suffiront-elles à prévenir celles d’un nouveau régime de l’information ? La question est posée car, même nettoyés des données personnelles, certains corpus de données recèlent des informations qu’il est possible de raccorder assez précisément à un ménage ou à un individu. On peut néanmoins considérer que les défauts se révéleront à l’usage, et que le principal enjeu ici est de rester attentif.
Un autre débat, mené au sein des administrations, concerne le mauvais usage des données. Certaines sont complexes à appréhender si l’on ne connaît pas le contexte de leur utilisation première : n’est-il pas risqué de les ouvrir ? L’argument mérite d’être entendu, mais il peut traduire une simple réticence technocratique au partage de l’information. On peut d’ailleurs le retourner : il revient aux producteurs et aux diffuseurs de données d’accompagner les corpus les plus sensibles et de veiller à leur bonne compréhension.
Ce deuxième débat en cache un troisième, à peine émergent mais qui mérite d’être placé au premier plan. Les organisations capables d’analyser les données bénéficieront d’une information sans équivalent, dont seule jouissait jusqu’à présent la puissance publique. Les lecteurs de Michel Foucault et d’Alain Desrosières2, récemment disparu, savent à quel point la statistique, comme outil de preuve et instrument de gouvernement, est source de légitimité et de pouvoir. En mettant à la disposition du public une masse d’informations jusqu’ici d’accès malaisé, on peut favoriser ceux qui sauront exploiter les données, au détriment de ceux qui passeront à côté sans en percevoir les enjeux.
On le comprend : l’agenda politique, mais aussi les équilibres des écosystèmes qui se développeront sur l’ouverture des données publiques, dépendront largement des stratégies de publication de l’administration et des capacités des utilisateurs. Le risque existe d’une résurgence subtile de la technocratie, et tout autant de la capture du débat public par les intérêts les mieux armés et les mieux conseillés, capables d’exploiter et de mettre en scène les informations qui favoriseront leur agenda.
Prendre conscience de ces risques n’implique nullement de freiner un mouvement qui semble à bien des égards porteur d’avenir. Mais il est essentiel de comprendre et de faire comprendre ce qui se joue ; essentiel, aussi, de permettre à tous d’entrer dans le jeu sans en être dupes. Il y a là un espace, une responsabilité particulière, pour la société civile. Tout d’abord, syndicats et associations doivent impérativement se donner les moyens techniques et politiques de jouer au même niveau que les autres acteurs. Ensuite, un travail de formation et de sensibilisation est nécessaire : cet enjeu de citoyenneté s’inscrit dans la grande tradition de l’éducation populaire. Enfin, au-delà des concertations déjà prévues sur les champs à privilégier, il est urgent de faire entrer ce sujet dans le débat public. L’open data est un sujet à prendre au sérieux.
- 1.
Voir Nicolas Colin, « Consommation numérique : qui crée la valeur ? », Esprit, mai 2013.
- 2.
Alain Desrosières, la Politique des grands nombres. Histoire de la raison statistique, Paris, La Découverte, 1993.