ISTEX – Textes & Corpus

Chercheur Professionnel de l'IST

Exploitez les ressources ISTEX dans votre projet de fouille de textes (TDM)

Avec plus de 23 millions de publications dans toutes les disciplines et dans 52 langues, ISTEX représente la plus importante source de données textuelles mise à disposition de la communauté scientifique française pour l’analyse et la fouille de textes. Notre équipe vous accompagne dans l’interrogation de ce vaste réservoir pour créer votre corpus et pour le finaliser grâce à ses services associés

De la fouille de textes en toute indépendance

Vous recherchez des données et des services compatibles pour le TDM ?

L’équipe ISTEX met à votre dispo­si­tion des publi­ca­tions en texte inté­gral centra­li­sées, homo­gé­néi­sées, enri­chies et juri­di­que­ment sécu­ri­sées, et vous permet de les inté­grer à votre projet de fouille au moyen de services performants :

Des formations adaptées

Vous souhaitez découvrir les données et les services ISTEX ?

Nous orga­ni­sons régu­liè­re­ment des ateliers pratiques sur la métho­do­lo­gie de créa­tion de corpus, en parte­na­riat avec le réseau des URFIST, avec l’ENSSIB ou avec le CNRS.
N’hésitez pas à vous inscrire pour y participer !

Nous inter­ve­nons égale­ment à la demande dans votre struc­ture pour vous présen­ter les ressources et les services ISTEX en fonc­tion de vos besoins et vos théma­tiques de recherche.

Des corpus sur mesure

Vous souhaitez vous lancer dans la création de votre propre corpus ?

Après une analyse person­na­li­sée de votre projet, nous vous aidons à construire votre requête, à explo­rer les résul­tats et à les affiner pour vous garan­tir un corpus adapté à votre cas d’usage.

Nous vous accom­pa­gnons égale­ment dans la confi­gu­ra­tion person­na­li­sée de la visua­li­sa­tion de vos données grâce à notre outil LODEX.

ISTEX
  1. Création de corpus
  2. Formation et accompagnement
  3. Visualisation des données
  4. fouille de textes

Réalisation

ISTEX-DL pour un accès facilité aux publications scientifiques

Mieux exploiter l’archive ISTEX ISTEX, c’est l’accès à 23 millions de docu­ments de litté­ra­ture scien­ti­fique dans toutes les disci­plines, pour la commu­nauté fran­çaise de l’enseignement supé­rieur et de la recherche. Au milieu de cette masse de docu­ments, comment élabo­rer des requêtes et télé­char­ger simple­ment… sans être… Lire plus
big data

Actualités

image actualité 08.02.2021

Un Corpus Gold Standard sur data.istex

L’Inist, associé au Laboratoire d’informatique fondamentale et appliquée de Tours (LIFAT), vient de mettre à disposition sur data.istex un corpus permettant d'évaluer les outils de TDM : un corpus annoté à la main pour entraîner les outils de reconnaissance d'entités nommées. Lire plus

Témoignage

Atelier démo "Construire et valoriser un corpus spécialisé à partir du réservoir ISTEX et explorer les résultats dans LODEX"

Des outils intéressants découverts. Beaucoup d’infos pratiques pour paramétrer les outils associés à ISTEX. Cela donne envie d’aller voir les collègues pour leur montrer ce que j’ai découvert

Participant à la formation « Fouille de textes à travers l’exploitation des corpus ISTEX » (avril 2021)

Contactez-nous

photographie de l'équipe

Vous souhaitez contacter notre équipe ?

Remplissez notre formulaire de contact, nous vous répondrons dans les meilleurs délais.




    Veuillez saisir une adresse e-mail valide de type vous@exemple.fr