Retour sur une approche concrète du TDM

03.10.2019

Se plaçant comme un acteur fort en matière de Text and Data Mining (TDM), l’Inist a animé la formation « La fouille de textes par l’exemple à travers l’exploitation des corpus Istex » à la BULAC à Paris, en partenariat avec l’Enssib.

Durant deux jours, les 25 et 26 septembre dernier, des professionnels de la fouille de textes se sont succédé devant les 14 participants afin de leur présenter un panorama du TDM avec un double objectif : permettre une montée en compétences sur la culture TDM (sur les aspects politiques, juridiques et techniques) et donner une approche concrète au travers de « données à voir » dans des corpus ISTEX.

Le premier jour était axé sur le contenu, essentiellement autour d’ISTEX, avec d’une part l’utilisation de processus de TDM pour l’enrichissement des données ISTEX et d’autre part la méthodologie mise en place pour créer un corpus à valeur ajoutée qualifié, pertinent et normé.

La seconde journée était quant à elle plus orientée vers les outils et ou plateformes tels que GROBID, KEYTERM, GARGANTEX ou encore CORTEXT.

Conservateurs dans des services de valorisation, proches des chercheurs, les participants ont émis des retours très favorables sur cette formation.  Outre la découverte du TDM, elle leur a permis d’appréhender davantage ISTEX, une infrastructure sécurisée qui se présente comme un réservoir de qualité pour le TDM.

La formation était pilotée par Laurent Schmitt, directeur adjoint de l’Inist, et animée par plusieurs intervenants de l’Inist, de l’Enssib, de Science-Miner, de l’ISC-PIF et de LISIS.

En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
OK
Modifier les paramètres