Infos Inist

Claire Nédellec incite à inventer un modèle mixte à inventer pour le TDM

Claire Nédellec(directrice de recherche à l’Inra) que nous avons accueillie en décembre dernier en Séquence de com’,  est intervenue  au Journées nationales de la science ouverte sur les enjeux posés actuellement au monde de la recherche pour réussir un mouvement « de mutualisation et de rationalisation » sur la fouille de texte, » en s’inscrivant dans une stratégie nationale et européenne de développement d’infrastructures de recherche.

Elle mentionne que les outils de TDM « ne relèvent pas de logiques de marché rentable » du fait de coûts de maintenance et d’ingénierie très élevés mais constitue un « levier d’innovation » et il y a certainement « un modèle mixte à inventer » entre académiques et industriels, « de manière non naïve ».

Pour Claire Nédellec, la communauté scientifique se trouve « à un moment clé » avec « une convergence » entre la maturité technique des outils de fouille, des avancées profitables autour du web sémantique, « une efficacité et une disponibilité des moyens de calcul ». Elle souligne à cette occasion qu' »Il faut des compétences nouvelles car il s’agit d’un traitement spécifique ».

 

Quelques chiffres pour rappel :

sur quelque 60 millions d’articles scientifiques produits et 160 millions de documents indexés, la moitié n’est jamais lue, 90 % ne sont pas cités et 80 % de ceux qui sont cités ne sont pas lus. Face à ce « gâchis énorme », le TDM peut apporter en partie une réponse, indique Claire Nédellec, directrice de recherche à l’Inra, lors des Journées nationales de la science ouverte qui se sont tenues du 4 au 6 décembre 2018 à Paris. Si les articles ne sont pas lus, c’est aussi faute d’être repérables. Or le TDM permet de « transformer les données non structurées en données lisibles par un ordinateur ».