TDM Factory : l’interface dédiée à la fouille de textes

02.12.2025

L’outil bibCheck, un service de vérification des références bibliographiques, cité dans les avancées du CNRS en matière de science ouverte.

Le 25 novembre 2025, le CNRS a publié une interview de Sylvie Rousset, directrice de la Direction des données ouvertes de la recherche, qui annonce le thème de la septième journée science ouverte et présente les avancées du CNRS dans ce domaine depuis la publication de sa feuille de route science ouverte en 2019.

Parmi les grandes réalisations, l’une des nouveautés concerne l’outil bibCheck, un service de vérification des références bibliographiques disponible sur l’interface TDM Factory, développé par l’Inist dans le cadre de l’infrastructure Istex. Pour Sylvie Rousset, cet outil propose avant tout « un usage préventif pour permettre à tous les scientifiques de vérifier leur bibliographie avant de publier un article afin d’enrayer la circulation d’une mauvaise science. »

Répondre aux besoins des chercheurs

En tant qu’unité d’appui du CNRS, l’Inist a pour mission de fournir des outils et des services permettant l’analyse, la fouille et l’enrichissement des textes scientifiques afin de répondre aux besoins des chercheurs et personnels de recherche.

C’est dans ce contexte que l’Inist opère l’infrastructure Istex, structurée en deux volets complémentaires, autonomes et compatibles, dédiés à la fouille de textes :

  • des ressources pour la fouille de textes, dont la base documentaire Istex, riche de plus de 30 millions de documents prêts à l’emploi pour vos projets d’analyse de la littérature scientifique.
  • des outils de fouille de textes basés sur l’IA, utilisables grâce au service clé en main TDM Factory et documentés sur le site Istex TDM.

Ces deux volets permettent de répondre aux besoins croissants d’exploration et de fouille de textes dans toutes les disciplines scientifiques.

Une interface intuitive

TDM Factory est une interface conçue pour offrir à l’ensemble de la communauté de l’enseignement supérieur et de la recherche (ESR) un service clé en main qui centralise et simplifie l’usage d’outils de fouille de textes.

Elle permet de transformer facilement un fichier ou un corpus scientifique en connaissances exploitables, sans compétences avancées en développement informatique ni en fouille de textes. Grâce à une interface intuitive, les utilisateurs peuvent charger leurs documents et sélectionner un outil parmi une large palette de traitements, couvrant des tâches telles que :

  • l’extraction d’informations,
  • l’enrichissement automatique de contenus,
  • la structuration et l’organisation de textes.

Les résultats sont ensuite disponibles directement en ligne, facilitant l’intégration des analyses dans les projets de recherche.

Elle garantit par ailleurs la confidentialité des données : les fichiers sont uniquement traités de manière temporaire sur les serveurs internes et ne sont jamais conservés après traitement. La plateforme est ainsi pensée pour un usage sécurisé et accessible à tous les niveaux de compétence technique.

Des outils prêts à l’emploi comme bibCheck

Plusieurs outils, appelés web-services, sont disponibles en quelques clics via TDM Factory, dont bibCheck, dédié à la vérification des références citées. Développé en partenariat avec l’IRIT (Institut de recherche en informatique de Toulouse) et Guillaume Cabanac, spécialiste de la détection automatique de publications suspectes, bibCheck permet de contrôler la fiabilité des références bibliographiques.

S’appuyant sur le problematic paper screener et en croisant les références avec Crossref ou DataCite, l’outil détecte si un article est rétracté ou si une référence semble avoir été générée par l’IA. (en savoir plus sur BibCheck : https://www.istex.fr/un-autre-web-service-autour-des-references-citees-bibcheck/)

À l’heure de la science ouverte, bibCheck constitue un outil efficace pour prévenir les erreurs et renforcer l’intégrité scientifique des publications.

Parmi les autres outils de fouille de texte développés par l’Inist, découvrez des web services tels que :

Un accompagnement pour favoriser l’appropriation

Au-delà des services et ressources, l’infrastructure Istex propose un accompagnement complet pour soutenir les projets et études liés à la fouille de textes, depuis la préparation des données jusqu’à l’analyse des résultats. Cet accompagnement comprend :

  • Des webinaires réguliers pour découvrir les services de fouille de textes,
  • Des formations dédiées pour appréhender l’infrastructure Istex et les outils TDM,
  • Des guides, tutoriels, vidéos et fiches techniques pour faciliter la prise en main,
  • Un support utilisateurs réactif pour répondre aux questions techniques et accompagner les premières analyses.

Un service clé en main

Avec lancement de l’interface TDM Factory, l’Inist poursuit le développement de la fouille textes au cœur des pratiques de science ouverte en proposant des outils ergonomiques et faciles d’utilisation, pour permettre aux utilisateurs de tous niveaux d’enrichir leur production scientifique.

Au-delà de la technologie, l’infrastructure Istex offre un ensemble complet de services, d’accompagnement et d’expertise permettant de transformer les corpus textuels en connaissances fiables et réutilisables.

 

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres