ISTEX-DL pour un accès facilité aux publications scientifiques

Date de la réalisation : 4 novembre 2020

big data
Toujours dans le but de faciliter l’accès aux publications scientifiques, l’application ISTEX-DL (ISTEX DOWNLOAD), spécialisée dans l’extraction de corpus, a bénéficié d’améliorations afin de répondre aux demandes des utilisateurs.

Mieux exploiter l’archive ISTEX

ISTEX, c’est l’accès à 23 millions de docu­ments de litté­ra­ture scien­ti­fique dans toutes les disci­plines, pour la commu­nauté fran­çaise de l’enseignement supé­rieur et de la recherche. Au milieu de cette masse de docu­ments, comment élabo­rer des requêtes et télé­char­ger simple­ment… sans être informaticien ?

C’est pour répondre à cette ques­tion que l’application ISTEX-DL a été créée en 2017.

En effet, jusqu’alors, extraire un corpus de docu­ments ISTEX suppo­sait une certaine pratique de l’informatique, les solu­tions propo­sées étant l’utilisation de mois­son­neurs – utili­taires en ligne de commande – ou l’emploi de la fonc­tion « extract », fonc­tion du moteur de recherche de l’API ISTEX se para­mé­trant direc­te­ment dans l’URL d’interrogation.

La créa­tion de l’application ISTEX-DL a permis à tous les ayants droit d’exploiter l’archive ISTEX pour en extraire un corpus de docu­ments adapté à ses besoins, et ce sans connais­sance infor­ma­tique particulière.

Découvrez la vidéo de présen­ta­tion d’ISTEX-DL sur la chaine YouTube de l’unité

Quoi de neuf dans cette version ?

L’application ISTEX-DL a évolué vers une inter­face plus ergo­no­mique, plus proche de la charte ISTEX, et elle est dotée de nouvelles fonctionnalités.

La prin­ci­pale nouveauté est le dépas­se­ment des limites dans la taille des requêtes simples ou complexes (plus aucune limite !) et dans le nombre de docu­ments à télé­char­ger (jusqu’à 100 000 documents !)

Parmi les autres nouvelles fonc­tion­na­li­tés proposées :

  • Choix du nombre de docu­ments et du mode de tri (perti­nence et qualité) ;
  • Affichage d’un échan­tillon du corpus afin de véri­fier les premiers résultats ;
  • Usage person­na­lisé des formats d’export : choix dans les exports possibles en fonc­tion des usages et télé­char­ge­ment des données au format direc­te­ment compa­tible avec vos outils de trai­te­ments ou de visualisation ;
  • Extraction rapide de gros volumes ;
  • Possibilité de parta­ger le corpus.

Ces nouvelles fonc­tion­na­li­tés et les modi­fi­ca­tions appor­tées avec cette version sont expli­quées de façon détaillées dans le blog Istex : ISTEX-DL se met sur son 4.21 et sort le grand jeu

Pour faire quoi ?

ISTEX-DL permet ainsi de télé­char­ger faci­le­ment du texte inté­gral dans l’archive ISTEX. Il est aussi possible de récu­pé­rer l’ensemble de sa biblio­gra­phie, de faire une recherche docu­men­taire dans les archives et d’obtenir tous les docu­ments, d’extraire des gros volumes de docu­ments pour des appli­ca­tions de text mining…

A chacun son utili­sa­tion en fonc­tion de ses besoins.

Prochainement, des tutoriels ISTEX-DL

Et pour vous aider avec la prise en main de l’ap­pli­ca­tion et décou­vrir en détail, toutes les fonc­tion­na­li­tés, des tuto­riels sont en cours de réali­sa­tion, mise en ligne prochai­ne­ment dans notre rubrique dédiée.

La nouvelle version d’ISTEX-DL est en ligne : https://dl.istex.fr/

N’hésitez pas à faire part de vos retours, www.istex.fr/contact ou via la liste users (users @ listes.istex.fr sans espace). L’équipe ISTEX est à votre dispo­si­tion pour répondre à toute question.

ISTEX-DL se met sur son 4.21 et sort le grand jeu