Infos Inist

INERIS et IRSN : Une journée de formation au Text & Data Mining à l’Inist

Le 20 mars 2024, l’Inist a ouvert ses portes à trois agents de l’INERIS (Institut National de l’Environnement Industriel et des Risques) ainsi qu’à un membre de l’IRSN (Institut de Radioprotection et de Sûreté Nucléaire) pour une formation dédiée au Text & Data Mining.

Valérie Bonvallot et Léo Gaillard, du service TDM de l’Inist, ont pris en charge la présentation initiale. Ils ont exposé les principes du TDM, présenté le site Istex Objectif TDM, ainsi que les fonctionnalités de Lodex.

L’après-midi a été réservé à des travaux pratiques. Préalablement, l’équipe TDM avait constitué un corpus comprenant les rapports de l’INERIS. Les participants ont eu l’opportunité de tester différents Web services, notamment le web service « Extraction de termes » via Teeft, qui permet d’extraire les termes les plus pertinents d’un texte, ainsi que le web service « LDA – Extraction de thématiques d’un corpus », utilisé pour identifier les thèmes dominants au sein d’un ensemble de documents.

Cette formation a été initiée par le responsable de l’ingénierie documentaire de l’INERIS, démontrant ainsi leur intérêt envers l’exploration de nouvelles méthodes pour améliorer la gestion et l’exploitation de leurs ressources documentaires. Ils ont d’ailleurs récemment embauché un stagiaire spécialisé en TAL (Traitement Automatique des Langues). Le responsable de l’ingénierie documentaire de l’INERIS ainsi que le stagiaire étaient tous deux présents lors de la formation.

L’objectif de cette formation était double : d’une part, permettre aux participants de découvrir le domaine du Text & Data Mining et ses applications potentielles, et d’autre part, susciter une réflexion sur les possibilités offertes par ces technologies pour répondre aux besoins spécifiques de leur domaine d’activité.