Nouveaux outils pour la fouille de textes : découvrez Teeft et TermSuite
Istex propose de nouveaux services dédiés à la fouille de textes.
Deux web services autonomes et interopérables sont désormais disponibles pour vous aider à indexer et analyser vos documents : Teeft et TermSuite.
Teeft : une indexation rapide des textes
Avec Teeft, vous pouvez extraire les termes les plus spécifiques de vos documents en français ou en anglais. Par défaut, l’outil identifie les 5 termes les plus représentatifs, mais vous pouvez paramétrer ce chiffre selon vos besoins. En analysant la structure grammaticale et la fréquence des mots, Teeft met en avant les éléments clés du texte, facilitant ainsi son indexation et sa compréhension.
TermSuite : une extraction terminologique pour vos corpus
Si vous travaillez avec un ensemble de documents, TermSuite est l’outil idéal. Il analyse un corpus entier et en extrait les 500 termes les plus spécifiques, permettant ainsi de dégager les thèmes principaux et de construire un vocabulaire structuré. Cet outil est particulièrement utile pour l’analyse de grands volumes de textes et la gestion de terminologies spécialisées.
Comment utiliser ces services ?
Ces deux outils sont accessibles de plusieurs manières :
- Via Lodex, la plateforme open source développée par l’Inist pour traiter et visualiser des données.
- Via IA Factory, une interface dédiée au chargement de corpus et à l’exécution d’outils TDM.
- En ligne de commande, pour les utilisateurs avancés souhaitant exploiter les services de manière automatisée.
Et découvrez le catalogue des web services ISTEX TDM pour trouver des outils d’aide à l’analyse de données et de textes.