MNHN: DataPOC, un outil pour explorer les richesses des données produites par la recherche en sciences naturelles
Datapoc (data : données ; poc : de l’anglais proof of concept /people of collections) est une preuve de concept. Elle a été développée pour faciliter la visualisation des liens existants entre les différentes bases de données taxonomiques produites dans le cadre des activités de conservation et de recherche du Muséum national d’Histoire naturelle.
Lauréat de l’appel à projets CollEx-Persée 2018, le projet datapoc vise à évaluer la faisabilité et l’opportunité de construire un référentiel « personnes » commun à l’ensemble des services et types de collections et de données produits et gérés au Muséum national d’Histoire naturelle. Ce référentiel devrait à la fois permettre de consolider les données et les bases de données existantes*, mais aussi d’encourager les utilisateurs à croiser, lier et exploiter des données qu’il leur est difficile de rassembler aujourd’hui compte tenu de la dispersion des catalogues et des applications.
Le projet prend la forme d’une preuve de concept établie à partir d’un corpus limité de noms de naturalistes contemporains ou historiques (environ 500). Il consiste à :
- tester la performance de technologies et de méthodes de traitement et d’alignement automatique de données à partir des bases de données disponibles,
- réaliser un prototype d’interface orienté chercheur pour la visualisation humaine et la réutilisation par des machines des résultats et des données exposées,
- émettre des préconisations pour un passage à l’échelle et une industrialisation (à la fois en volume et en type de données)
Comme toute preuve de concept, cette plateforme est un démonstrateur de faisabilité. Elle a vocation à évoluer et à être améliorée. Vos retours nous intéressent! Pour toute remarque ou question, merci d’écrire à : datapoc[at]mnhn.fr