Le Centre de données socio-politiques (CDSP) de Sciences Po vient de diffuser sur « data.gouv.fr » des jeux de données relatifs aux résultats des élections présidentielles, législatives, cantonales et régionales, de 1958 à aujourd’hui. Des informations détaillées qui faisaient jusqu’ici défaut.
Les données en Open Data jusqu’ici limitées au début des années 1990
S’il est aujourd’hui assez facile de connaître les résultats des dernières élections présidentielles commune par commune, il n’en va pas de même dès lors qu’il s’agit de remonter au scrutin ayant par exemple conduit Georges Pompidou à l’Élysée, en 1969. Depuis plusieurs années, le ministère de l’Intérieur a pourtant fait des efforts pour que les données relatives aux différents scrutins électoraux soient non seulement mises en ligne rapidement, mais également pour qu’elles soient publiées dans un format libre et ouvert, c’est-à-dire en Open Data.
De nombreux jeux de données sont ainsi proposés sur la plateforme gouvernementale « data.gouv.fr » : résultats des élections présidentielles, législatives, européennes, cantonales, municipales, régionales... Sauf que les informations disponibles ne remontent que jusqu’au début des années 1990. Il est dès lors impossible de retrouver sur ce portail les résultats détaillés relatifs par exemple au second tour de l’élection présidentielle du 19 décembre 1965, qui opposait pour rappel le général de Gaulle à François Mitterrand. Surtout, cela limite fortement les possibilités de réutilisation de ces informations, tant pour un citoyen lambda que pour des journalistes ou scientifiques qui chercheraient à faire des comparaisons dans le temps, etc.
De nouveaux jeux de données proposés grâce à la société civile
Le CDSP de Sciences Po vient toutefois de mettre en ligne plusieurs jeux de données venant mettre partiellement fin à ce problème. Après avoir effectué des vérifications, « essentiellement par des tests de cohérence (par exemple, comparaison du nombre d'exprimés et de la somme des voix pour chaque parti/candidat) », l’institution a publié ce matin sur data.gouv.fr des informations relatives aux :
- Élections présidentielles, de 1965 à 2012
- Élections législatives, de 1958 à 2012
- Élections cantonales, de 1988 à 2011
- Élections régionales, de 1986 à 2010
Le CDSP préfère être prudent et prévient que malgré ses efforts, « des erreurs peuvent subsister ». Le tout est quoi qu’il en placé sous une licence ODbL, et peut donc être réutilisé gratuitement à condition de bien en citer la source. Science Po espère d'ailleurs que ces données en Open Data seront utiles dès aujourd’hui, puisqu’un « Open Data Camp Elections » a été organisé en partenariat avec la mission Etalab (qui gère le portail data.gouv.fr). L'INA devait pour l'occasion ouvrir un corpus de « métadonnées de près de 25 000 sujets d’actualité diffusés sur 12 chaînes TV et 4 radios couvrant 10 années d’élections nationales et locales ».
Le secrétaire d’État en charge de la politique gouvernementale d’Open Data, Thierry Mandon, devait intervenir en ouverture de cet événement censé faire émerger des idées de réutilisation de ces données. Nous ne savons pas si l'intéressé a expliqué pourquoi ce sont des chercheurs qui ont dû publier ces informations publiques, et non les pouvoirs publics.