ISTEX – Textes & Corpus

Chercheur Professionnel de l'IST

Exploitez les ressources ISTEX dans votre projet de fouille de textes (TDM)

Avec plus de 27 millions de publications dans toutes les disciplines et dans 52 langues, ISTEX représente la plus importante source de données textuelles mise à disposition de la communauté scientifique française pour l’analyse et la fouille de textes. Notre équipe vous accompagne dans l’interrogation de ce vaste réservoir pour créer votre corpus et pour le finaliser grâce à ses services associés

De la fouille de textes en toute indépendance

Vous recherchez des données et des services compatibles pour le TDM ?

L’équipe ISTEX met à votre disposition des publications en texte intégral centralisées, homogénéisées, enrichies et juridiquement sécurisées, et vous permet de les intégrer à votre projet de fouille au moyen de services performants :

Des formations adaptées

Vous souhaitez découvrir les données et les services ISTEX ?

Nous organisons régulièrement des ateliers pratiques sur la méthodologie de création de corpus, en partenariat avec le réseau des URFIST, avec l’ENSSIB ou avec le CNRS.
N’hésitez pas à vous inscrire pour y participer !

Nous intervenons également à la demande dans votre structure pour vous présenter les ressources et les services ISTEX en fonction de vos besoins et vos thématiques de recherche.

Des corpus sur mesure

Vous souhaitez vous lancer dans la création de votre propre corpus ?

Après une analyse personnalisée de votre projet, nous vous aidons à construire votre requête, à explorer les résultats et à les affiner pour vous garantir un corpus adapté à votre cas d’usage.

Nous vous accompagnons également dans la configuration personnalisée de la visualisation de vos données grâce à notre outil LODEX.

ISTEX
  1. Création de corpus
  2. Formation et accompagnement
  3. Visualisation des données
  4. fouille de textes

Réalisation

ISTEX-DL pour un accès facilité aux publications scientifiques

Mieux exploiter l’archive ISTEX ISTEX, c’est l’accès à 23 millions de documents de littérature scientifique dans toutes les disciplines, pour la communauté française de l’enseignement supérieur et de la recherche. Au milieu de cette masse de documents, comment élaborer des requêtes et télécharger simplement… sans être… Lire plus
big data

Actualités

Actualité 05.10.2023

Un premier corpus multi sources sur data.istex

Dans l'objectif d’augmenter la pertinence et la couverture chronologique du corpus Machine Translation, l'équipe Istex a ajouté des données issues d'autres ressources à des données Istex, dans la seconde version de son corpus traitant de l'histoire de la traduction automatique (voir l'article concernant le premier corpus sur la traduction automatique au fil du temps). Lire plus

Témoignage

Atelier démo "Construire et valoriser un corpus spécialisé à partir du réservoir ISTEX et explorer les résultats dans LODEX"

Des outils intéressants découverts. Beaucoup d’infos pratiques pour paramétrer les outils associés à ISTEX. Cela donne envie d’aller voir les collègues pour leur montrer ce que j’ai découvert

Participant à la formation « Fouille de textes à travers l’exploitation des corpus ISTEX » (avril 2021)

Contactez-nous

photographie de l'équipe

Vous souhaitez contacter notre équipe ?

Remplissez notre formulaire de contact, nous vous répondrons dans les meilleurs délais.




    Veuillez saisir une adresse e-mail valide de type vous@exemple.fr






    En poursuivant votre navigation, sans modifier vos paramètres, vous acceptez l'utilisation et le dépôt de cookies destinés à mesurer la fréquentation du site grâce au logiciel Matomo.
    OK
    Modifier les paramètres