LIRIAe

Une liseuse intelligente pour faciliter le travail des instructeurs de dossiers environnementaux.

Porteur : Ministère de la transition écologique

LIRIAe : liseuse et recherche intelligente pour les autorités environnementales

Bruno Lenzi, MTECT / CGDD / SRI / Ecolab (chef de projet / data-scientist)

Pascal Mallard, DREAL Bretagne (adjoint à la cheffe de la division évaluation environnementale)

L’irritant

Chaque année, les autorités environnementales traitent de l’ordre de 4000 dossiers de projets et plans-programmes (parcs éoliens, installations industrielles, aménagements urbains, etc), sous délai contraint et moyens humains limités. Une partie importante du temps et de la difficulté du traitement est liée à la recherche d’informations, à la vérification de leur cohérence et à la rédaction d’avis judicieux.

La bonne idée

LIRIAe est un outil d’aide à la lecture et recherche d’informations destiné à aider les auditeurs à traiter les dossiers de plusieurs centaines à quelques milliers de pages, de manière plus fluide. Une recherche intelligente (contextuelle), avec une bonne pertinence sur les enjeux environnementaux, couplée à un modèle pour la synthèse, permet d’identifier rapidement les enjeux, chiffres clés et contradictions à l’intérieur des dossiers ou vis à vis de la réglementation, et produire des suggestions de rédaction d’avis.

Il a été conçu dans le cadre de l'évaluation environnementale mais se décline assez naturellement au traitement de dossiers techniques complexes et volumineux, s’appuyant sur un corpus de normes et/ou contraintes réglementaires. Ce besoin est très récurrent au sein de l'administration. Il y a une centaine d'auditeurs qui pourraient adopter l'outil rapidement. Les instructeurs ICPE, qui ont des besoins très similaires, sont plus d'un millier d'agents.

La plupart des agents utilisent des lecteurs PDF classiques, style Acrobat, même si certains travaillent encore avec les versions papier. Prendre connaissance du dossier, naviguer entre les pièces et rechercher des informations, à l'intérieur du dossier comme dans d'autres documents de cadrage, planification, dossiers et avis similaires, peut être très difficile. On estime qu'il y a un gain potentiel de 10-20% sur les quelques semaines passées sur un dossier par agent avec une liseuse intelligente. Et un gain en pertinence par une plus grande facilité à trouver de l'information.

La stratégie de mise en marché

Une plateforme qui inclut des outils de dépôt, structuration automatique et lecture de PDFs en ligne, avec une recherche “avancée” et des étiquettes thématiques, a été développée en 2023 et est actuellement utilisée par un dizaine d’auditeurs, surtout en 2 régions pilotes.

Dans un espace de 6 mois, le développement, l’intégration et vérification de la pertinence d’une IA (avec recherche sémantique / RAG / LLM) plus adaptée à l’identification des enjeux environnementaux, peut se faire auprès de ce groupe de “testeurs”, avant une diffusion nationale (de l’ordre de 100 auditeurs). L’extension à des cas d’usages similaires, comme le travail des instructeurs d’installations classées, analyse de documents de planification et autres, qui touchent plus d’un d’un millier d’utilisateurs potentiels, est envisagée.

Le but ultime est la réduction de l’impact environnementale des projets. L’évaluation de la qualité du traitement des dossiers, quantifiée par le nombre d’enjeux traités, le temps de traitement et l’appréciation de l’auditeur peuvent être utilisées comme proxies.

Le projet bénéficiera d’initiatives et outils comme Albert, Camembert 2.0 et RAGtime, déjà incubées par allIAnce. Au delà de l'impact pour les utilisateurs, le projet est facilement déclinable à d’autres cas d’usage dans l’administration, qui impliquent le traitement de (longs) documents techniques, administratifs et réglementaires. En outre, il apportera un corpus de documents et une composante environnementale en IA transposables à plusieurs problématiques.

Les réalisations faites dans le cadre du projet seront reversées sous licence libre.

Montant

Pour les 6 mois conduisant à la mise en service, une équipe externe d’experts en NLP, développement front/back et déploiement sera mobilisée sur un forfait de 150 000€. Le MTECT mobilisera une équipe interne (porteur de projet, coordination technique et développement) et des ressources financières, pour un montant de masse salariale et prestations équivalent.