L’url est tout un programme, mieux vaut la reproduire complètement : http://libertic.wordpress.com/2011/02/25/pourquoi-la-reutilisation-des-donnees-publiques-a-des-fins-commerciales-doit-etre-gratuite/

Le récent article publié en mars 2011 sur le blog Libertic, de l’association éponyme, largement reproduit tel quel, sans guère de critique y compris par le journal « Le Monde », et revendiquant la gratuité des données publiques pour toutes les utilisations, fait suite à de nombreuses publications promotionnelles du mouvement dit « Opendata » ; littéralement, on entendrait « données ouvertes » mais on lit aussi souvent « données libres » et, de plus en plus, « données gratuites ». La démarche, d’origine américaine, a été reprise en France notamment par deux autres associations, Regards citoyens et la FING et, pour le domaine de l’information géographique, par une association de fait transposant une initiative universitaire britannique maintenant devenue un réseau international sous la marque OpenStreetMap gérée par l’OpenStreetMap Foundation .

Aux sources de l’Opendata

Pour examiner ce qu’il en est, il faut revenir à une source souvent citée de ce mouvement, publiée par la "Sunlight Foundation", "Ten principles for opening up government information".

Il faut d’abord observer que cette source est publiée en anglais et que Libertic, l’association la plus active en France sur cet aspect, n’en fournit pas de traduction française ce qui n’en facilite pas le commentaire ; c’est un peu dommage s’agissant d’un texte prétendant influer sur des dispositions légales et réglementaires françaises.

Quant à l’association (« non profit organisation » ou association à but non-lucratif) « Sunlight Foundation », apparemment transparente sur ce point, elle fait état de ses donateurs qui, pour les dix premiers, l’ont financée à hauteur de plus de 5 millions de dollars en 2010, ce qui situe la hauteur de l’enjeu.

Bien sûr, savoir de qui il s’agit et connaître le contexte d’activité ne suffit pas à apprécier l’ensemble, il faut interroger les principes énoncés ; voyons donc ces dix principes : les trois premiers concernent l’intégrité et la fraîcheur des données, les deux suivants la possibilité d’utiliser les données par des procédures informatiques aussi automatisées que possible et les cinq derniers traitent de la facilité d’accès qui doit être améliorée par la publication au moyen de formats connus, stables dans le temps, de conditions de réutilisation explicitement non contraignantes et sans tarification, ceci pour tous, sans identification.

Ces principes ont été énoncés dans le contexte bien particulier de la fin de l’année 2007, moment important où l’opposition démocrate des Etats-Unis cherchait des éléments de renouvellement de la vie démocratique, après deux mandats présidentiels républicains ; cette démarche s’est trouvée liée à la campagne de Barack Obama qui y a donné suite, une fois élu, en faisant du site DATA.GOV un élément important de la nouvelle administration américaine. Cette ambition de rechercher plus d’informations officielles disponibles pour vivifier la vie démocratique trouve en France sa presque exacte transposition avec l’activité de « Regards citoyens » qui par son site nosdeputes.fr propose une autre présentation de l’activité des députés à l’assemblée nationale, pour ne citer que cet exemple ; le contexte politique est évidemment tout autre mais l’ambition de plus de transparence de l’activité du gouvernement et des corps constitués est la même.

La légitimité de la demande de transparence et de gratuité parait évidente lorsqu’il s’agit de l’activité des élus, eu égard aux ambitions démocratiques de nos sociétés ou aux contextes politique et technologique ; il peut en revanche sembler plus étonnant que la même démarche ait lieu à propos de l’information géographique ou d’autres types d’information à caractère technique, souvent compréhensibles seulement par les professionnels experts ; le contexte est bien différent et il est nécessaire de l’examiner précisément. Mais il faut au préalable mieux appréhender quel regard le mouvement Opendata porte sur les données publiques de manière générale, particulièrement en Europe.

Opendata et données publiques

On a vu ci-dessus que le développement du mouvement Opendata était lié à un contexte politique et se concrétisait notamment par le site http://www.data.gov/ A la date du 15 avril 2011, ce site officiel propose en page d’accueil une rubrique Opendata, renvoyant à une liste de neuf forums, encore plutôt vides. L’Opendata a donc un caractère officiel aux Etats-Unis, mais sous une forme encore en plein développement. Des démarches similaires ont lieu dans le monde entier et Data.gov en publie une carte. Carte de l'Opendata

En France, le relais a été pris par les trois associations mentionnées plus haut (Regards citoyens, FING et Libertic) ainsi que par quelques villes et régions ; une carte publiée par Libertic montre que la démarche est seulement naissante : Au niveau de l’Etat français, le projet Etalab, par le décret 2011-194 du 21 février 2011, offre maintenant un cadre officiel pour « la création d'un portail unique interministériel destiné à rassembler et à mettre à disposition librement l'ensemble des informations publiques de l'Etat, de ses établissements publics administratifs et, si elles le souhaitent, des collectivités territoriales et des personnes de droit public ou de droit privé chargées d'une mission de service public. » ; la mention « Opendata » n’est évidemment pas reproduite sous cette forme dans un décret publié au JORF mais l’ambition décrite semble assez analogue à celle de data.gov.

Parmi les données publiques, une très grande partie –la plus grande partie ?- est constituée par l’information littérale des lois et règlements, des statistiques, des registres produits au cours de l’exécution des actions administratives ordinaires de l’administration et des corps constitués ; la question du coût de constitution de ces données ne se pose donc généralement pas puisqu’il est intégré au coût de fonctionnement de l’administration elle-même ; seuls peuvent être isolés les coûts d’archivage à long terme et les coûts de publication. L’évolution de l’informatique et du web est venue bien évidemment impacter ces postes de dépense de manière importante dans les vingt dernières années ; aussi, le coût de diffusion d’un document ou d’un fichier isolé, correctement indexé et mis en place sur un serveur, devient infime, inférieur en tout cas au coût d’une transaction financière.

L’économie générale de la diffusion des données publiques, majoritairement littérales ou statistiques, permet donc de satisfaire la demande de gratuité inscrite dans les principes de l’Opendata ; pour certains types de données plus lourdes à saisir, à tenir à jour et à manipuler, il peut en être autrement ; il s’agit principalement de données techniques, répondant aux critères de « données publiques », mais que la puissance publique n’est pas forcément prête à financer en totalité, ce qui conduit donc à les diffuser à titre onéreux.

Opendata et données techniques

Dans le domaine technique, on ne parle pas de données qui mettraient des stratégies politiques ou des carrières personnelles en cause, comme les interventions publiques dans le cadre du fonctionnement des assemblées élues ; il ne s’agit que de données techniques, utiles d’abord aux professionnels des secteurs concernés mais pouvant être utiles à tous ; dans la plupart des cas, la diffusion des ces données est régulée par la loi qui impose aux entités publiques qui les ont produites de faciliter leur accès pour tous, réservant toutefois la possibilité aux producteurs de mettre en place un régime d’accès payant. On se référera en particulier pour la France à la loi de 1978 et pour les données environnementales à la convention d’Aarhus, mais de nombreux textes, commentaires et recommandations existent pour préciser toutes les situations possibles dans les divers secteurs. Dans le domaine technique, les demandes ne portent donc pas sur l’accès, puisque les données sont déjà accessibles (sauf ce qui « doit » demeurer secret, des données touchant à la défense nationale, la sécurité publique, la protection d’espèces rares ou des données archéologiques) ; elles portent en revanche sur les conditions tarifées d’accès aux données.

L’affirmation de Libertic « Pourquoi la réutilisation des données publiques à des fins commerciales doit être gratuite” appellera certainement de nombreux commentaires ; voici les miens, répondant point par point à l’article référencé ci-dessus:

  • « Le Mouvement Opendata privilégie la gratuité” : certes il s’agit d’une préférence qui peut être réaffirmée, il ne s’agit toutefois pas d’un argument ; de nombreuses données publiques sont déjà gratuites et diffusées depuis longtemps sans aucune restriction,
  • « La tarification des données est limitée par la loi » : il s’agit là d’un simple rappel de la loi en vigueur ; la dernière remarque sur l’éventualité de « bénéfices financiers » pouvant être réalisés par des administrations ne peut que faire sourire ; les derniers exemples de ce type remontent à certaines années, maintenant lointaines, où l’administration des postes et télécommunications a été à l’origine de péréquations financières en direction d’autre ministères ; ceci ne remettait du reste nullement en cause le principe de l’unicité budgétaire de l’Etat, ni ne transformait les fonctionnaires en rentiers,
  • « L’investissement entre dans les budgets des collectivités » : il s’agit là de l’approche que les collectivités peuvent avoir avant d’engager les investissements nécessaires pour satisfaire les demandes de l’Opendata ; l’état des lieux est en fait très hétérogène et reflète avant tout le regard que les collectivités ont de l’informatisation et de l’intégration de l’internet dans leurs processus ; c’est à mon avis d’abord un chantier « e-administration » avant d’être un sujet « Opendata », même si ce dernier peut être un élément de la demande exprimée,
  • « La gratuité génère des bénéfices » : la série d’exemples fournis semble convaincante mais il s’agit en réalité de cas-types de portée assez restreinte dans l’espace et dans le temps, toujours répétés par les mêmes lobbyistes ; l’exemple de Rennes est en particulier très sollicité par rapport à la réalité de la problématique ; il est évident que les 47 applications mentionnées n’ont été produites que parce qu’il existait un concours fort bien doté ; leur valorisation à 20 000 euros l’unité n’a rien à voir avec la pratique d’un marché public pour lequel Rennes aurait pu définir un cahier des charges et faire un appel d’offres ; un tel cahier des charges serait au demeurant inutile dans la mesure où, parmi les 43 applications finalement proposées, on retrouve le plus souvent des fonctionnalités déjà présentes dans d’autres applications déjà bien connues (Mappy, Destineo, Dismoiou, Nomao, Plyce, Foursquare, Géovélo, Jaccede, ...), la plupart reposant sur Googlemaps ou d’autres services connus et accessibles aux Rennais ; bref, à Rennes, pour le montant des dotations à ce concours d’applications, on sait maintenant comment emprunter des sentiers déjà battus par d’autres. Pour ce qui est des aspects économiques de la diffusion des données publiques, l’étude du BETA (Bureau d’économie théorique et appliquée, fichier pdf à télécharger) de l’Université de Strasbourg ne conduit pas du tout aux mêmes conclusions, tout en tenant compte du contexte budgétaire difficile ; cette étude ne se prononce explicitement pas sur le cas particulier des données pour lesquelles la vente constitue un apport indispensable au fonctionnement des administrations qui les produisent (INPI, Météo-France, IGN, Cadastre,…),
  • « Le paiement pour la réutilisation commerciale est déjà dans la norme » : sous réserve de modalités adaptées, la vente lorsqu’il s’agit de réutilisation commerciale ne constitue pas une barrière à l’entrée ; quelques exemples de la clientèle professionnelle IGN suffisent à le prouver ici ou . Les premiers pas pour une entreprise qui compte vraiment se développer consistent bien évidemment, en déposant ses statuts, à construire son business plan, calculer le montant de ses fournitures et déterminer ses prix de ventes de manière à dégager une marge ; commencer en militant pour obtenir des données gratuites est rarement la meilleure approche pour durer vraiment,
  • « Une procédure difficilement applicable » : pour ce qui est de l’IGN, la juxtaposition de bannières publicitaires est en effet considérée comme une utilisation commerciale des données, mais cette approche n’est sûrement pas unique et pourra évoluer ; en revanche, l’utilisation des couches IGN au moyen de l’API Géoportail pour géolocaliser les données de l’Assemblée nationale, en dehors de tout contexte où serait obtenu un « avantage économique direct ou indirect », est gratuite. Par ailleurs, une association loi 1901 peut parfaitement appeler aux cotisations et aux dons pour financer ses frais de fonctionnement, voire demander des subventions ; lorsque son activité est reconnue officiellement, elle peut même être « reconnue d’utilité publique » et faire alors bénéficier ses donateurs de la « loi Coluche »,
  • « Le pragmatisme, plus efficace que l’idéologie » : en la matière, pragmatisme et idéologie sont deux réalités dont il faut tenir compte pour que tous progressent vers l’accès aux connaissances dont les données ne sont que le vecteur ; il se trouve que j’ai l’avantage, l’honneur et le bonheur partagé de participer aux discussions du groupe de travail du GFII traitant de diffusion des données publiques ; on y traite, à partir des positionnements respectifs de nos entreprises privées ou de nos organismes publics, des meilleures solutions à apporter aux difficultés rencontrées par les participants à propos de réutilisation des données publiques ; si le mouvement Opendata n’y est pas méconnu, il n’est pas non plus considéré comme une panacée, les plus grandes attentes des « ré-utilisateurs » portant plus sur la qualité des données, la continuité des modalités techniques d’accès, l’ouverture des formats que sur la tarification elle-même, étant entendu que le consensus doit aussi être recherché en matière tarifaire ; le pragmatisme ne conduit pas forcément à la gratuité. Pour ce qui est de l’idéologie, j’en vois autant derrière le mouvement Opendata qu’ailleurs et je garde la mienne, inscrite au fronton de nos écoles publiques,
  • « Notre position » : il s’agit d’une information intéressante sur l’ensemble des activités de Libertic ; je ne suis pas certain que le volet social telle qu’elle l’envisage soit pleinement cohérent avec les objectifs poursuivi par les principaux donateurs de « Sunlight Foundation » à l’origine de l’Opendata ; parmi ceux-ci on compte Omidyar Network, Michael R. Klein, la Fondation Rockefeller,… qui agissent selon les habitudes de la société américaine, difficiles à transposer en Europe et principalement en France pour des raisons historiques et culturelles,
  • « Le Sputnik moment » : il existe dans toutes les sociétés des périodes de cristallisations rapides pendant lesquelles des éléments sous-jacents apparaissent et deviennent des repères autour desquels tout se réorganise ; il n’est pas certain que les « sputniks moments » des USA doivent aussi être ceux de toutes les sociétés ; de ce côté ci de l’Atlantique, on verrait plutôt de telles transformations résulter des crises énergétique ou démographique, ou bien encore des extraordinaires événements de début 2011 au cours desquels les peuples du nord de l’Afrique ont compris qu’ils pouvaient reprendre en main leur propre avenir.

Je conclus ces considérations en affirmant, contrairement à Libertic, qu’il n’existe aucun argument de valeur certaine qui devrait conduire à diffuser gratuitement, principalement pour un usage commercial, des données coûteuses à élaborer et à entretenir ; j’ajoute que dans le contexte actuel, prétendre que les entreprises privées financeraient les données publiques par le paiement de taxes dont la baisse ou la suppression est par ailleurs sans cesse réclamée, relève d’un subterfuge qui ne pourrait à terme que tarir les sources de données publiques de qualité, s’il était pris au pied de la lettre par les pouvoirs publics.

Parmi les données techniques, l’information géographique est un cas encore plus particulier et souvent cité ; voyons donc quelles sont ses particularités dans le champ de l’Opendata en examinant en particulier le cas d’OpenStreetmap, principal promoteur de l’Opendata pour l’information géographique.

Opendata et données géographiques publiques

Libertic ne mentionne OpenStreetMap que par deux références qui mentionnent cette plateforme, l’une de Charles Népote, de la FING sur les outils de cartographie en ligne, l’autre étant un compte-rendu d’intervention de Steve Coast, créateur d’OpenStreetMap, dans un atelier d’EPSI Platform consacré à l’information de transport public. Libertic prend position sur le plan général des données publiques alors qu’OpenStreetMap envisage seulement la question spécifique de l’information géographique ; voyons donc comment s’articulent leurs démarches respectives. Là aussi, l’aspect économique est le point autour duquel les discussions s’organisent, celle du droit d’accès étant désormais réglée.

Alors que les cartes sont déjà largement disponibles, celles de l’IGN comme celles d’autres organismes publics, que l’objectif de tous est bien de faciliter leur utilisation pour l’enseignement, la recherche et les services publics, et enfin d’informer le public, mais qu’en revanche, compte-tenu des coûts d’actualisation de ce type de données, il est demandé aux « ré-utilisateurs », éditeurs de services à caractère industriel ou commercial, de payer leur « participation au frais » sous forme d’acquisition tarifée de licence, on voit maintenant apparaître une demande de gratuité totale y compris pour les utilisations commerciales.

Comme dans le cas général discuté ci-dessus dans mes réponses à Libertic, il s’agit bien d’être pragmatique, de valoriser les données en les mettant gratuitement à portée du plus grand nombre sous une forme aisément utilisable, mais aussi de maintenir un cercle vertueux d’actualisation des données et d’amélioration de leur qualité.

Pour cela, la gratuité d’utilisation des données pour l’enseignement, la recherche, les entités publiques, la gratuité des services en ligne pour les usages « n’apportant pas d’avantage économique direct ou indirect à l’utilisateur » permettent bien d’enrichir le contenu des missions de service public et de crédibiliser la signature d’un « Géoportail des territoires et des citoyens ». Par ailleurs, les recettes apportées par la tarification des usages qui n’entrent pas dans ce cadre permettent de maintenir une actualité des données et une amélioration de la qualité qui seraient très certainement remises en cause si ces actions ne devaient leur avenir qu’à la subvention publique, elle-même en difficulté. L’annonce récente d’une hypothétique fermeture de DATA.GOV montre bien quel sort peut être réservé aux services 100% gratuits, c'est-à-dire 100% financés par les budgets publics.

On voit donc que le supplément de liberté demandé par les promoteurs de l’Opendata est en fait déjà largement là, et, qu’à vouloir trop de perfection, c’est en fait un vrai risque qui pourrait être pris par rapport à l’objectif de mettre les données à portée du plus grand nombre. Mais ce dernier objectif n’est manifestement pas le seul poursuivi par certaines composantes du mouvement Opendata; voyons donc la trajectoire qui mène d’OpenStreetmap à une entreprise multinationale.

OpenStreetmap Foundation est une association à but non lucratif de droit britannique ; son acte de naissance tire son origine à l’University College de Londres où Steve Coast a voulu s’affranchir de la dépendance à l’achat des données de l’Ordnance Survey en élaborant un système permettant d’obtenir à peu de frais des données utilisables par tous ; Steve Coast est également le dirigeant de l’entreprise Cloudmade Ltd qui accueille parfois des événements d’OpenStreetmap ; cette situation est parfaitement transparente et lisible en ligne. Cloudmade édite un site utilisant les données OpenStreetMap pour éditer des services en ligne tarifés, notamment des services de cartographie pour smartphone et des légendes cartographiques à la demande.

Loin des brumes britanniques, CloudMade prospère et constitue une entreprise classique dans le monde du web, s’appuyant sur sa communauté d’utilisateurs qui lui fournit gratuitement la matière première nécessaire à sa croissance. Elle sait aussi trouver des financements à hauteur de ses ambitions. Tout va donc bien pour elle. Toute autre entreprise peut l’imiter en s’appuyant sur les données en ligne, élaborées gratuitement par les contributeurs, et sur les licences qui les régissent.
Des données gratuites, donc, mais gratuites pour qui ?

Dans ce contexte particulier des données géographiques, il peut sembler assez incompréhensible que des citoyens refassent eux-mêmes ce qu’ils ont déjà payé par leurs impôts et auquel ils ont accès gratuitement en ligne au moyen d’un site web ; mais il s’agit de liberté individuelle et il faut reconnaître à la plateforme OpenStreetMap un intérêt pédagogique certain ; GalerieAPIGP200 plus étonnante est la démarche de certains organismes publics à vouloir parfois refabriquer des données disponibles par une simple consultation gratuite du Géoportail ou par l’utilisation gratuite des services de l’API Géoportail. Les exemples sont ici sur une première galerie et ci-dessous sur une page Facebook.


Galerie API Géoportail Facebook

Conclusions, ouverture et liberté, comment et pourquoi ?

Finalement, on arrive au constat qu’il existe aujourd’hui :

  • une offre de sources publiques de référence accessibles et réutilisables, mais sans doute encore méconnues,
  • une attente importante par rapport à des sources d’information publique de grande valeur mais pas encore publiées,
  • des outils de géolocalisation et de cartographie partagée utilisables par tous, permettant d’améliorer, compléter et valoriser de nombreuses informations thématiques,
  • un contexte technique qui évolue très rapidement en accompagnant les tendances lourdes de mondialisation et d’exigence de transparence de l’action publique.

Dans cette situation, l’Opendata a le mérite d'ouvrir de nouvelles perspectives ; alors qu’aux Etats-Unis la pérennité du site data.gov est remise en cause, c’est Etalab qui devient en France le point focal autour duquel devraient converger de nombreuses initiatives. Les producteurs publics nationaux d’information apporteront naturellement leur contribution au projet qui répondra concrètement aux attentes en matière d’ouverture de données, existantes et intéressantes, mais encore inaccessibles.

Les conditions semblent donc réunies pour progresser rapidement vers une amélioration de l’infrastructure générale de partage des informations publiques existantes ; chemin faisant, on découvrira sans doute qu’il reste encore beaucoup à faire dans le champ de l’information géographique en matière de données 3D, de très haute résolution et de services en temps réel. Quant au « pourquoi ? », faisons confiance au citoyen, si le technicien ne sait pas, le citoyen trouvera non seulement des réponses, mais aussi d’autres questions.