CNRS dépasser les frontières

facilite l’accès aux résultats issus des différents champs de la recherche mondiale

LegoTAL

Partager

Le projet LegoTAL a pour objet la réalisation d’une infrastructure de text-mining, ouverte et pérenne, qui permette aux ingénieurs de l’Inist de mettre au point, d’exécuter, de gérer et de partager des chaines de traitement automatique des langues (TAL) appliquées sur des collections documentaires.

L’ensemble du dispositif comprendra donc une bibliothèque de composants interopérables, un environnement graphique de mise au point de chaines de traitements avec la capacité à traiter, entre autres, des documents issus du réservoir IStex et un accès aux ressources terminologiques de l’Inist.

Les grandes fonctionnalités attendues dans cet environnement de mise au point sont :
• L’assemblage et le paramétrage de chaines de traitements TAL impliquant tout ou partie des outils disponibles
• L’exécution des chaines de traitement
• Le stockage et le partage de chaines de traitements, le déploiement de ces chaines et leur gestion
• La gestion des exécutions
• Le formatage de données à traiter en entrée
• Le formatage et la visualisation des résultats

Techniquement, la solution s’appuiera autant que possible sur des outils « open-source ».