Trop d’information (publique) tue-t-elle l’information ?

Teaching Open Source Practices, Version 4.0

(1)

Une lecture de mes journaux habituels vient de me faire tilter sur ce que j’avais classé comme non-évènement : l’Etat lance son site data.gouv.fr.

Certains disent que c’est une avancée, d’autre disent que c’est inutile ou même toxique, suivant le principe que trop d’information tue l’information.

Qu’est-ce que ceci ?

data.gouv est un site donnant accès à de l’Open Data, c’est à dire

une information publique brute, qui a vocation à être librement accessible. La philosophie pratique de l’open data préconise une libre disponibilité pour tous et chacun, sans restriction de copyright, brevets ou d’autres mécanismes de contrôle.

Un organisme créée par l’Etat, Etalab, gère ce site. Y sont regroupées 352 000 bases de données récupérées auprès de 90 contributeurs, producteurs de données publiques : Insee, IGN, ministères, établissements publics…

Par nature, ce site donne accès à des données brutes et disparates : des résultats électoraux, les effectifs de la fonction publique, les émissions industrielles de polluants, la localisation des accidents,les 3 638 produits AOC de France, le taux d’inflation appliqué au bégonia ou la liste des centres agréés pour la collecte de sperme de chevaux.

Le Lab d’Europe 1 qualifie certaines de ces listes de loufoques ou trop brutes, mais je trouve que c’est pour le plaisir de la critique. La donnée existe, sous quel prétexte faudrait-il la filtrer ? La donnée est par essence brute, ne vaut-il pas mieux la laisser telle que plutôt que de la traiter (ce qui implique de l’interpréter) ?

C’est du moins mon opinion.

Est-ce toxique ?

Nous avons donc d’un côté des organismes publiques fournisseurs d’information gratuite, et de l’autre des opérateurs qui vont exploiter ces données.

Cela me rappelle ma découverte de ce que signifiait la philosophie de données Open Source.

C’était au Etats-Unis, dans les années 90.

The visible human project

(2)

J’avais entre mes mains un CD-ROM proposant un tour du corps humain tel que vous pouvez le voir sur le site de Anatomie Tv en cliquant sur les liens demo (c’est du flash, désolé, utilisateurs d’iPad et d’iPhone).

Mon interlocuteur m’expliquait qu’il s’agissait d’une application vendue par sa société, réalisée à partir des données publiques du projet visible human.

Ces données étaient publiques car le projet avait été financé par l’Etat, donc par les impôts, et se devaient donc d’être disponible pour tous.

Ces données ont eu de nombreuses applications, y compris la correction d’erreurs dans les descriptions d’anatomie concernant la forme d’un muscle de la région pelvienne, et la localisation de la vessie et de la prostate.

Il s’agit certes un exemple très loin de ce que permettent les données que nous trouvons aujourd’hui sur data.gouv.fr, mais nous pouvons espérer que c’est une perspective d’un avenir potentiel.

Et les politiques ?

Restons encore un peu aux États-Unis.

L’histoire commence avec la loi sur l’accès libre à l’information, dite Freedom of Information Act, de 1966. Elle répondait aux demandes de transparence des citoyens dans le contexte de la guerre du Vietnam. Elle octroyait l’accès large et ouvert à l’information non classifiée des administrations.

Malgré des aller-retours sur les droits accordés – les gouvernements Reagan et Bush ont eu tendance à restreindre cet accès tandis que le gouvernement Obama affiche sa volonté de plus de transparence – il est possible de trouver des organismes exploitant ces données.

Un exemple est le National Security Archive (NSA !), institution à but non lucratif fondée en 1985 et basée à l’Université George Washington. Elle publie sur Internet des documents déclassifiés de la CIA.

Elle vient ainsi de lancer un concours de lecteurs : trouver les 11 mots considéré par les plus « infamants » par la censure lors de la publication en 1971 des archives du Pentagone à propos de la guerre du Vietnam, en comparant avec l’édition « intégrale » des ces documents désormais disponibles.

Et pour nous, en France ?

20111207-130728.jpg

(3)

L’Open Data n’est pas une simple histoire d’informaticiens ou d’initiés. L’accès libre à l’information que cela suppose implique de nombreux enjeux. Par exemple au niveau économique :

  • des services de simple mise à disposition de données Open, sans réelle valeur ajoutée – comme les bases de données du Journal Officiel ou l’accès aux données IGN – vont avoir tendance à se retrouver en porte-à-faux ;
  • la disponibilité de données Open permettra à des opérateurs de proposer de nouveaux services – payants ou non – et des économies engendrées par l’usage de l’information.

Au niveau du citoyen, l’Open Data laisse entrevoir la possibilité d’accès libre à des informations permettant des études comme celle sur le redécoupage électoral par Regards Citoyens. Lors de la lecture, il nous appartiendra de rester vigilant sur les sources de données et leur usage, mais c’est vrai de n’importe qu’elle information que nous lisons, écoutons ou regardons.

Je passerai sur les enjeux en terme de politique, de société… Mon objectif n’est pas de les parcourir.

Nous ne sommes qu’au début de l’histoire de nos données ouvertes…

Crédit photo /// (1) Teaching Open Source Practices, Version 4.0 de opensourceway, sur Flickr /// (2) The Visible Human Project Conference, 1996, National Institutes of Health, Bethesda, Maryland USA /// (3) Étude sur le redécoupage électoral – Regards Citoyens ///
Bibliographie /// data.gouv, la transparence officielle – Le Lab Europe 1 – 5 Déc. 2011 /// OpenData & Étalab : La guerre française des licences s’achève ! – regardscitoyens.org – 19 Oct. 2011 /// OpenData : La moyenne pour un data.gouv.fr sous formats propriétaires – regardscitoyens.org – 4 Déc. 2011 /// Étude sur le redécoupage électoral – Regards Citoyens – 14 Déc. 2009 /// Un état des lieux de l’Open Data – OWNI – 9 Nov. 2011 /// Article Données ouvertes de Wikipédia en françaisContenu soumis à la licence CC-BY-SA – (auteurs) ///

Laisser un commentaire