ArchiFiltre : assurer la mémoire des politiques sociales en transformant la gestion des archives

La problématique

Les données produites par les ministères sociaux ont statut d’archives publiques. A ce titre, leur création, leur gestion et leur sort final sont soumis à un cadre législatif et réglementaire spécifique. Une bonne gestion des archives doit permettre de contextualiser l’information, de garder une trace fiable et opposable des décisions publiques et de maîtriser les coûts induits par la gestion de l’information. La sélection des documents à conserver doit s’opérer de façon transparente et prendre en compte des critères complémentaires (cartographie des risques et des processus, perspectives / conditions de réutilisation).

Or, la généralisation des outils informatiques et la multiplication des outils de partage et de stockage contribuent à une multiplication des données non structurées, parfois redondantes, dans des formats divers à la lisibilité non garantie à long terme.

Dans ce cadre, la problématique à résoudre est de permettre aux services métiers et à l’administration des archives de disposer des informations nécessaires pour mettre en œuvre une sélection de données à un niveau macro pour des ensembles volumineux constitués de documents aux formats divers (bureautiques, messageries, etc.) et de garantir la pérennisation et la fiabilité des documents traités sur le long terme.

Le défi : mettre en œuvre des techniques de big data pour réaliser l’évaluation, la sélection et l’échantillonnage de données publiques non structurées

Répondre à cette problématique implique de traiter les besoins suivants :

  • Constituer un entrepôt de documents à plat par extraction des fichiers contenus dans des ensembles documentaires aux formats variés
  • Exploiter les métadonnées de chaque document, y compris celles liées aux caractéristiques techniques (format, poids)
  • Tracer et exploiter les informations liées à la localisation initiale des documents
  • Identifier et caractériser les liens entre les différents éléments (versions successives d’un même document, etc.)
  • Exploiter le contenu des fichiers suivant différents critères (analyse diplomatique, identification de la présence de données à caractère personnel, identification des termes clés).

Les 2 EIG

  • Jean-Baptiste Assouad: Développement

Photo de Jean-Baptiste Assouad

« Après avoir obtenu mon diplôme d’ingénieur en robotique de l’École Polytechnique Universitaire de la Sorbonne, j’ai travaillé pendant 1 an et demi pour une jeune startup Belge, Quimesis.

Je suis ensuite parti travailler sur mon propre projet entrepreneurial, une application web de conception assistée par ordinateur, pendant 1 an.

Je rejoins maintenant le projet ArchiFiltre pour apporter toutes mes compétences et expériences. »

Son profil Linkedin.

  • Emmanuel Gautier: Datascience

Photo d'Emmanuel Gautier

« Je suis né en France avec les ordinateurs personnels, les débuts du web et ses moteurs de recherche. J’ai grandi à Istanbul, La Haye puis Berne, avec les premiers ADSL, réseaux sociaux, Wikipédia et les smartphones. J’ai mûri, de nouveau en France, avec les objets connectés, l’explosion de la donnée et de l’intelligence artificielle.

À 23 ans, maintenant ingénieur et data scientist, je suis convaincu que le Numérique, utilisé à bon escient, peut créer du bien commun. En devenant Entrepreneur d’Intérêt Général, je compte y participer. »

Son profil Linkedin.

Les mentors : Anne Lambert et Chloé Moser

Photo d'Anne Lambert

Anne Lambert a rejoint le secrétariat général des ministères sociaux en juillet 2015. Elle y pilote la politique d’archivage des ministères en charge du travail, de la santé et des sports. À ce titre, elle exerce également des missions de contrôle au nom des Archives de France (Ministère de la culture).

« Je suis convaincue de l’intérêt que peuvent présenter les techniques métiers des archivistes pour l’exploitation des données produites par les administrations. Orientée vers l’évaluation et la sélection des données, ces savoir-faire contribuent à l’identification des différentes sources d’information et rend possible des traitements ultérieurs en vue de leur pérennisation et de leur réutilisation.

Le dispositif EIG doit permettre d’expérimenter les conditions de leur transposition pour l’automatisation de ces traitements sur des données non structurées. L’expertise de haut niveau des EIG constitue une opportunité pour enrichir la réflexion. Leur action s’inscrira dans une équipe projet pluridisciplinaire ouverte sur des projets nterministériels et leur permettra d’être accompagnés dans l’appréhension du contexte tout en bénéficiant d’autonomie, d’un large spectre de données tests et d’un environnement de travail adapté. »

Photo de Chloé Moser

Chloé Moser a rejoint le secrétariat général des ministères sociaux en novembre 2013 en tant qu’adjointe à la cheffe de la Mission des Archives de France auprès de ces ministères. Depuis 2016, elle est plus spécifiquement en charge des projets de gestion des données, documents et de l’archivage électronique.

« Toutes les organisations et les individus deviennent des producteurs exponentiels de données. Ces productions de données représentent évidemment une opportunité et une richesse importantes. Pour autant, on ne peut pas laisser cette production s’accroître sans raison, il faut l’accompagner, la contextualiser, la limiter parfois pour que les données produites restent pertinentes et réutilisables.

Je constate que l’archiviste est un professionnel mal connu pour accompagner les producteurs de données dans leur gestion, notamment dans le temps. Je suis persuadée que nous avons un rôle à jouer dans l’accompagnement à la production et l’organisation des données tout comme dans leur conservation et leur mise à disposition à différents publics.

ArchiFiltre sera pour nous une occasion d’allier les techniques informatiques avec notre expertise sur les documents et les données, d’apporter un peu d’archivistique dans l’appréhension et le tri des données, de techniques informatiques dans leur évaluation et leur sélection. Notre objectif ? Sauver le monde ! »

En savoir plus : le pitch du défi en 4 slides