CorHAL et Conditor : Pourquoi on en parle en ce moment à l’Inist ?
Vous avez dit CorHal ?
Corhal est un projet commun au CCSD et à l’Inist qui consistait à déployer un workflow partagé entre l’Inist et le CCSD pour alimenter Hal et mettre en place des fonctions dédiées à la suggestion de dépôts pour les chercheurs et à l’amélioration de la qualité des données de la base.
Ce workflow est constitué de textes qui proviennent de la base Conditor. Ces textes respectent 2 critères :
- Ils correspondent aux standards de Hal (libre accès, texte intégral…)
- Ils ne sont pas déjà présents dans Hal
Aujourd’hui le projet est achevé, mais ces derniers temps on reparle de Corhal à l’Inist car Claude Niederlender du service Texte et corpus Istex, responsable informatique du workflow, a automatisé la mise à jour mensuelle de la base Conditor. Les données nécessaires à HAL sont automatiquement extraites et fournies au CCSD. Cet envoi permet à quelques chercheurs-testeurs d’accéder à des propositions d’articles non déposés dans Hal en résultats de recherche dans l’archive.
A l’Inist c’est Nicolas Thouvenin, responsable du département Analyser l’information Scientifique, Pascal Cuxac, Jean-Joffrey Parentin et Claude Niederlender qui ont travaillé sur CorHAL.
Pourquoi on parle de Conditor à l’Inist ces derniers temps ?
Parce que ça valorise les webservices de TDM !
La base Conditor, opérée à l’Inist, moissonne des textes dans différentes sources internationales comme CrossRef par exemple. Ces textes sont ensuite enrichis par des webservices développés par le service Text and data mining de l’Inist pour que les métadonnées correspondent aux standards de Hal. Les webservices permettent notamment l’ajout de code RNSR, d’une classification Hal ou encore d’indiquer la présence du texte en accès ouvert.
Parce que Conditor constitue une source pour les études bibliométriques !
Le service Appui au pilotage de l’Inist va fournir des études bibliométriques à tous les instituts du Cnrs sur leur production scientifique, basé sur les données récoltées dans Conditor. Le service APIL a d’ailleurs déjà réalisé l’étude pour l’IN2P3. C’est une belle manière de mettre en valeur la base Conditor et l’outil open source Lodex développé également à l’Inist.
Pour aller plus loin, vous pouvez consultez l’article détaillant Conditor dans le site Ouvrir la science.