Retour d’expérience de l’Inist aux 29e rencontres de la Société francophone de classification (SFC)
Lucas Anki et Léo Gaillard, du service Text & Data Mining de l’Inist, ont participé aux 29e rencontres de la Société francophone de classification (SFC), qui se sont déroulées du 11 au 13 septembre 2024 au Centre international de rencontres mathématiques (CIRM) à Marseille. Devant une trentaine de participants, dont des chercheurs du Portugal et du Québec, ils ont présenté leurs travaux lors d’une session de 20 minutes suivie de questions.
Le public, majoritairement composé de chercheurs en mathématiques et statistiques, a été réceptif à leur présentation intitulée « Classification de résumés d’articles scientifiques à partir de la classification des revues ». Bien que seules 20 % des interventions aient porté sur des données textuelles, c’est la méthode utilisée qui a suscité de l’intérêt pendant les questions. Pour construire un algorithme, il est essentiel de disposer d’un jeu de données d’entraînement adéquat et d’exclure les données non conformes afin d’éviter que le programme n’apprenne de manière erronée, ils ont donc répondu à des questions sur leur classifieur.
Outre leur présentation, Lucas et Léo ont pu échanger avec d’autres chercheurs et découvrir des méthodes innovantes, notamment en matière de clustering et de gestion des données manquantes, qui occupaient une place importante dans les autres interventions.