Infos Inist

Atelier pratique sur l’usage des ressources ISTEX (Toulouse)

Pour faciliter la prise en main des services et des outils de constitution, de visualisation et d’exploration d’un corpus thématique, les équipes ISTEX et l’URFIST Occitanie proposent un atelier le jeudi 2 juin à Toulouse.  Sabine BARREAUX et Pascale VIOT présenteront, sous forme de travaux pratiques encadrés, les usages du réservoir ISTEX pour la fouille de texte.

Programme

[9h-12h] Construire et valoriser un corpus spécialisé à partir du réservoir ISTEX – 30 min de présentation sur ISTEX et 2h30 de travaux pratiques dirigés

Les participants pourront découvrir les outils et services ISTEX et s’approprier les méthodes de constitution de corpus à travers des exemples de corpus réalisés par l’Inist.

Cette demi-journée proposera une approche à la fois théorique et pratique autour de l’interrogation d’ISTEX, à travers la construction d’une requête avec le démonstrateur, et l’extraction des résultats, à l’aide du service de téléchargement ISTEX-DL.

A l’issue de cette matinée, les participants sauront interroger la base ISTEX pour construire et télécharger leur propre corpus.

[13h30-14h30] Travaux pratiques sur l’exploration d’un corpus documentaire ISTEX à l’aide d’outils de visualisation de données 

Exploration d’un corpus avec LODEX

Cet atelier permettra de poursuivre la démarche de constitution de corpus initiée le matin, en explorant le corpus téléchargé avec ISTEX-DL. Il sera proposé différentes manipulations conduisant à affiner la requête, afin de limiter les étapes de post-traitement des résultats et ainsi obtenir un corpus finalisé en vue d’une utilisation dans un outil de fouille de textes.

Les tutoriels

Des corpus de démonstration à découvrir ou redécouvrir sur data ISTEX (http://data.istex.fr/)

https://corpus-specialises.corpus.istex.fr/

Ce jeu de données propose des collections de corpus spécialisés constituées par l’équipe ISTEX de l’Inist en vue d’une exploitation en traitement automatique des langues et en fouille de textes.