dataESR : révéler tout le potentiel des données de la recherche et l'ouvrir aux citoyens

La problématique

Le ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation (MESRI) cherche à faciliter l’accès aux données et indicateurs à ses usagers. Il souhaite aller plus loin que la seule ouverture des données et proposer un ensemble de services accompagnant les utilisateurs qui le souhaitent dans leur analyse. Mettre la donnée au service de tous pour aider à éclairer les décisions, faciliter le dialogue entre parties prenantes du système d’enseignement supérieur, de recherche et d’innovation, organiser un suivi transparent des politiques publiques et aider à la décision publique, telle est l’ambition du défi.

Le défi : développer le socle technique d’une plateforme générique d’aide à l’analyse des données pour les professionnels et le grand public

Ce défi comporte deux dimensions :

  • Améliorer l’accès aux données et indicateurs sur le système d’enseignement supérieur et contribuer à densifier la littératie des données sur l’enseignement supérieur, la recherche et l’innovation chez l’ensemble des usagers, professionnels de l’ESR et grand public
  • Faire de ce service un outil générique, ouvert et déclinable à d’autres thématiques

Le MESRI a déjà initié des travaux préparatoires à la conception de dataESR. Sur la base d’une analyse critique de ces travaux, les EIG développeront le socle technique de dataESR. En s’appuyant sur un data scientist et un développeur web expérimenté du département, ils en testeront la validité et la généricité et mettront en place des fonctionnalités répondant à un premier ensemble d’attentes des futurs utilisateurs.

3 entrepreneur•e•s recherché•e•s

  • EIG 1 : DEVOPS/SOLUTION ARCHITECT : concevoir et développer les composants de stockage, recherche/navigation et de production massive d’indicateurs à partir de données, de référentiels et de métadonnées (métadonnées textuelles et surtout règles de calcul des indicateurs)  ; assurer une fonction de coordination des travaux conduits par les différents contributeurs au projet. Expérience en matière de développement d’API.

    Mots-clés : Bases de données, Moteur d’indexation, Moteur d’analyse ; API ; Documentation dynamique ; json ; xml ; xml/rdf ; turtle ; Elasticsearch ; Python

  • EIG 2 : WEB DES DONNÉES, GESTION DE RÉFÉRENTIELS : construire le dispositif de gestion et d’exposition des référentiels de dataESR.

    Mots clés : Linked open data, SPARQL, FOAF ; OWL ; SKOS; URI; Dublin core ; API ; Triplestore

  • EIG 3 : DATA SCIENCE : développer un moteur de génération d’analyse textuelle de jeux de données, identification et adaptation d’une bibliothèque graphique au contexte de la diffusion de données publiques afin de rendre accessibles à tous les analyses les plus complexes.

    Mots clés : statistique et analyse de données, data-visualization, frameworks graphiques par exemple D3.js

Vos mentors : Yann Caradec et Emmanuel Weisenburger

Photo des mentors

Yann Caradec et Emmanuel Weisenburger co-animent le département des outils d’aide à la décision au ministère de l’Enseignement supérieur, de la Recherche et de l’Innovation. Cette structure d’une dizaine de personnes est en charge de l’ouverture des données. Elle conduit des projets data-centrés comme scanR, moteur de la recherche et de l’innovation (prix Opendata Territorial 2016 de la Gazette des Communes) ou encore la Magical Laundry (projet EIG 2017).

« Notre expérience réussie d’accueil de 2 EIG en 2017 ne peut que nous conduire à poursuivre l’aventure EIG sur dataESR. Avec Laurent et Léo, nos collègues EIG accueillis en 2017, nous avons trouvé un regard neuf et bienveillant, une capacité déterminée à faire, à transmettre et à initier, au-delà du projet même, de nouvelles pratiques ou techniques. Participer au programme EIG, c’est également bénéficier d’une ouverture enrichissante sur les autres projets du programme, d’un réseau d’experts.

Le programme EIG, c’est aussi un moyen de contracter le temps d’un projet, de l’inscrire dans l’urgence stimulante d’un sprint de 10 mois et de déboucher forcément sur un résultat dont chacun pourra être fier.

Pour dataESR, nous tenions à réaliser le cœur de projet, son socle technique, dans une configuration favorisant l’interaction directe et fluide avec l’ensemble de l’équipe, future utilisatrice de la solution. Pour nous le programme EIG était une évidence pour dataESR ! »

En savoir plus : le pitch du défi en 4 slides