PARTIE I. Accompagnement au changement

Author

équipe KALLM

Published

June 7, 2024

Les cas d’usages des LLMs sont variés et avant de se lancer et innover grâce aux LLMs, il est nécessaire de bien identifier le besoin qui amène l’utilisation d’un LLM. Pour quoi faire ? Pour quels usages ? Est-ce pour de la génération de texte ? Pour de la classification ? ou pour des interactions conversationnelles ? L’objectif de ce chapitre est d’accompagner la réflexion autour de l’identification du besoin et de la collecte des données, avec les différents types de cas d’usages impliquant des LLMs.

Au sein des administrations, les cas d’usage de LLM ci-dessous sont en cours d’expérimentation, soit en production.

Cas d’usage

Des LLM peuvent être utilisés pour :

  • Labelliser / classifier les textes d’un corpus traitant d’un sujet, selon certaines catégories. Des LLMS peuvent être utilisés pour labelliser des articles de presse traitant de décisions de politique monétaire, selon les catégories « décision attendue », « décision surprenante », « ne sait pas ». Ils peuvent également classer des documents de recherche clinique selon différentes thématiques et disciplines, tout en permettant une recherche sémantique avancée. Ils peuvent aussi permettre de classer des accords d’entreprise, publiés sur LégiFrance. Ces accords peuvent concerner plusieurs thématiques (télétravail, compte épargne temps, droit à la deconnexion).Ces thématiques sont déclarés par les entreprises et sont éventuellement corrigées par la Direction Générale du Travail.Le besoin est alors de détecter automatiquement les thématiques à la lecture de l’accord. Un jeu de données est disponible à l’adresse suivante : accords_publics_xx_to_2022_themes_et_texte.parquet
Institution Nom du Projet Contact Expérimentation/Production/Recherche
Ministère en charge de la santé SIRANo dgos-sirano@sante.gouv.fr Expérimentation
Banque de France Étude de l’impact des surprises monétaires sur les taux de change jean-charles.bricongne@banque-france.fr Recherche
Banque de France Anticipation d’inflation jean-charles.bricongne@banque-france.fr
olivier.debandt@banque-france.fr
Thomas.RENAULT.external@banque-france.fr
Recherche
Dares - Ministère du Travail Acccords d’entreprise THIOUNN, Conrad (DARES)
  • Identifier les thématiques traitées dans un corpus. Par exemple, des LLMs peuvent être utilisés pour identifier les thématiques développées dans le champ Commentaire d’une enquête.
Institution Nom du Projet Contact Expérimentation/Production/Recherche
Banque de France Enquête sur les Tendances régionales Farid.OUKACI@banque-france.fr
Olivier.LANTRAN@banque-france.fr
Expérimentation
LabIA DNUM LLamandement : LLM finetuné permettant d’accélerer le traitement d’amendements et projets de loi (notamment via la synthétisation des textes). Farid.OUKACI@banque-france.fr
Olivier.LANTRAN@banque-france.fr
Expérimentation
  • Faire une analyse de sentiment d’un corpus traitant d’une thématique. Par exemple, des LLMs peuvent être utilisés pour faire une analyse de sentiment (ex : positif, négatif ou neutre) d’une thématique émergeant d’un champ « Commentaire » d’une enquête et traitant d’une perception du climat des affaires.
Institution Nom du Projet Contact Expérimentation/Production/Recherche
Banque de France Enquête sur les Tendances régionales Farid.OUKACI@banque-france.fr
Olivier.LANTRAN@banque-france.fr
Expérimentation
  • Interroger une base de documents textuels (pdf, code, etc…) (retrieval augmented generation). Les documents sont découpés en paragraphes (chunks). Les réponses aux questions posées sont générées sur la base de paragraphes idoines existant dans la base. Les paragraphes qui ont servi à l’élaboration de la réponse sont indiqués en regard de celle-ci, et peuvent être consultés.
Institution Nom du Projet Contact Expérimentation/Production/Recherche
Banque de France Chatbdf Nicolas.THOMAZO@banque-france.fr
Guillaume.LOMBARDO@banque-france.fr
Alix.DECREMOUX@banque-france.fr
Passage en production prévu en décembre 2025
ANFSI IAccueil
daphne.pertsekos@gendarmerie.interieur.gouv.fr
jerome.laporte@gendarmerie.interieur.gouv.fr
jean-baptiste.delfau@gendarmerie.interieur.gouv.fr
malo.adler@gendarmerie.interieur.gouv.fr
Expérimentation depuis Octobre 2024
  • Requêter sur des bases de données codées en SQL : à une interrogation exprimée en langage naturel sur une base en SQL, un code en SQL servant à la requête est renvoyé. Par exemple, à l’interrogation « trouve-moi la date de naissance de l’individu I », un code SQL est renvoyé permettant d’effectuer la requête
Institution Nom du Projet Contact Expérimentation/Production/Recherche
Banque de France Text2SQL Guillaume.LOMBARDO@banque-france.fr Passage en production par la BCE en décembre 2024
  • Extraire des données à partir de documents textuels Par exemple, à partir de documents réglementaires extraire 15 informations-clés et stocker celles-ci dans une base de données
Institution Nom du Projet Contact Expérimentation/Production/Recherche
Banque de France Veridic Guillaume.LOMBARDO@banque-france.fr Passage en production prévu fin 2025
  • Effectuer des synthèses de documents textuels
Institution Nom du Projet Contact Expérimentation/Production/Recherche
ANFSI Synthèse de procédures judiciaires malo.adler@gendarmerie.interieur.gouv.fr Recherche
  • Aider à vérifier la conformité légale de procédures administratives
Institution Nom du Projet Contact Expérimentation/Production/Recherche
ANFSI Conformité des procédures malo.adler@gendarmerie.interieur.gouv.fr Recherche
  • Agent conversationnel
Institution Nom du Projet Contact Expérimentation/Production/Recherche

Projet mené par le LabIA de la DINUM - Albert github : Outils de déploiements des modèles Albert - Modèles Albert - Albert France Services : Projet à destination de France Service et visant à appuyer ses conseillers dans la réalisation de leurs missions. Ce projet se base principalement Albert github Albert hugging face

Pour plus de projets IA (au sens large) dans l’administration se référer au lien : https://grist.numerique.gouv.fr/o/beta-gouv-ia/9wTgwEbwqmwW/Ressources/p/1