LIRIAe : Liseuse et recherche intelligente pour les autorités environnementales
Chaque année, les autorités environnementales traitent près de 4 000 dossiers autour de projets et plans-programmes tels que parcs éoliens, installations industrielles, aménagements urbains, etc, dans des délais et moyens humains contraints. Certains dossiers ne sont pas instruits, ou pas suffisamment en détail, avec des enjeux environnementaux qui pourraient être évités, réduits ou compensés. Une partie importante du temps et de la difficulté du traitement est liée à la recherche d’informations, à la vérification de leur cohérence et à la rédaction d’avis judicieux.
L’Ecolab du CGDD développe des outils d’aide à la lecture et à la recherche d’informations, avec l’appui de la DNUM/MTECT, de l’INRIA via le labIA/DINUM et d’experts métier des DREAL Bretagne et Bourgogne-Franche-Comté. Les besoins et premières fonctionnalités, décrites ci-dessous, ont été identifiés suite à des ateliers et discussions avec des auditeurs. Les retours d’expérience d’une dizaine d’utilisateurs, surtout dans les régions « pilotes », ont permis de valider et adapter les hypothèses à chaque étape et d’élargir la portée et la performance des outils.
Ces outils veulent permettre une lecture plus fluide via la consolidation de tous les documents pertinents d’un dossier, généralement composé de quelques centaines à plusieurs milliers de pages, distribuées dans plusieurs documents .pdf non normalisés. Un volet de navigation ergonomique contenant l’arborescence des titres (sections, sous-sections…) est construit automatiquement, avec la validation de l’utilisateur. Des fonctionnalités avancées de recherche à l’intérieur d’un dossier et des étiquettes automatiques facilitent l’identification des sections qui traitent d’une thématique (ex. impacts sur les milieux et paysages, faune et flore, etc.). Des notes partageables permettent de localiser les points critiques du dossier et d’avoir un processus collaboratif d’instruction et validation.
L’utilisation de techniques plus avancées d’IA permettra d’améliorer la pertinence et l’expérience utilisateur autour de la recherche d’informations, avec une formulation en langage naturel et l’identification de passages qui traitent les enjeux, même si les termes de la requête ne sont pas présents (ex. : pollution du sol). La recherche pourrait s’appliquer à des sources externes, comme un corpus de dossiers et avis des MRAe/Ae, documents de cadrage, textes de loi et autres. En utilisant des grands modèles de langue (LLMs), des synthèses et suggestions de rédaction peuvent être proposées. Ces développements permettront d’intégrer une composante environnementale aux modèles, transposable à des cas d’usages similaires, comme les dossiers d’installations classées, plans d’urbanisme, PCAET et autres.