SSP Datalab

Améliorer la statistique publique à l’aide de nouvelles techniques et outils de traitement de données

Voir les autres défis Postuler

L’Insee en tant que coordinateur du service statistique public (SSP) souhaite développer une plateforme ergonomique de traitement des données statistiques afin de rendre les techniques modernes plus accessibles et de mutualiser les efforts pour répondre aux défis actuels de la statistique publique.

La problématique : des outils et techniques de traitement de données difficiles d’accès et dépourvus d’environnements de test

Le service statistique public est composé de 16 services statistiques ministériels et de l’Insee (Institut national de la statistique et des études économiques) qui en assure la coordination.

Dans le contexte informationnel actuel, l’Insee est confronté à de multiples enjeux : Comment continuer à exercer la mission d’éclairage du débat public en étant plus précis, plus réactif, sur les thématiques actuelles et émergentes ? Comment être efficace dans la coordination de 16 services de statistique sans disposer d’infrastructure mutualisée ?

L’enjeu est donc d’innover dans les méthodes de traitement et d’exploitation des données à travers une plateforme mutualisée, ergonomique, sécurisée et accessible à distance.

Le défi : créer un cloud spécialisé dans les outils et techniques de traitement de données, à l’état de l’art et accessible à un public varié

Le défi consiste à créer une plateforme de centralisation d’outils de traitement de données et une communauté d’échange de bonnes pratiques à destination des services statistiques publics.

Une version provisoire de la plateforme a été mise en production en mars en soutien d’une communauté de statisticiens de l’État. Cette ouverture a permis de lancer une dynamique d’amélioration fondée sur la mise à l’épreuve rapide par les utilisateurs pour proposer des modifications pertinentes.

La plateforme repose sur l’assemblage de technologies open source et cloud native : un stockage objet pour le datalake (minIO), des services déployables à la demande (Rstudio, Jupyter) avec un orchestrateur de conteneurs (marathon et kubernetes), et des outils de gestion de la sécurité (Vault, Keycloak).

Le défi se focalisera sur l’amélioration :

  • du design de l’offre pour faciliter l’expérience utilisateur ;
  • des services de stockage et de traitement de données ;
  • de l’accompagnement des utilisateurs dans leurs démarches d’appropriation et d’amélioration de la plateforme.

La création d’une communauté de pratiques est un axe essentiel du défi. L’ambition de cette offre de service est d’améliorer la qualité des traitements de données grâce à un partage des bonnes pratiques au sein du service statistique public.

Profils recherchés

EIG 1 - Designer de services

Missions : Explorer les usages du lab, élaborer une offre de services, concevoir des interfaces, construire et animer une communauté de pratiques.

Compétences :

  • Designer de services
  • Expérience dans les démarches d’innovation et de type “lab” appréciée

EIG 2 - Data engineer

Missions : Développer l’offre de stockage et de traitement des données (valorisation et structuration des données).

Compétences :

  • Forte expérience dans l’intégration de logiciels de traitement de données et leur utilisation (par exemple, Spark)
  • Une expérience des environnements container serait un plus

EIG 3 - Développeur / développeuse full stack

Missions : Réaliser les interfaces et tester l’offre de services (en lien avec l’EIG designer).

Compétences :

  • Développeur / développeuse full stack
  • Expérience en JavaScript (pour la partie front-end) – l’EIG sera invité(e) à contribuer à la construction de la filière de développement front-end de l’Insee
  • Une expérience en Java serait appréciée, mais pas indispensable
  • Appétence pour les démarches de construction de communauté appréciées (sens de la pédagogie et de l’écoute)

Ces compétences techniques sont l’un des éléments d’appréciation d’une candidature. Les critères de sélection sont détaillés sur la page de candidature.

Webinaire

Ce défi a été présenté lors du webinaire « Open source, mutualisation d'outils et mémoire de l'administration » du mardi 19 mai. Les agents publics qui portent le défi en ont profité pour répondre à de nombreuses questions que se posaient les candidats. N'hésitez pas à en regarder la rediffusion en ligne.

Rendez-vous sur la page de présentation de l'appel à candidatures pour retrouver la liste complète des webinaires.