Un thésaurus de paléoclimatologie pour répondre à une question d’actualité

17 janvier 2023

Fruit d’une collaboration entre paléoclimatologues et experts du service Ingénierie terminologique de l’Inist, un thésaurus de paléoclimatologie a été créé. Il décrit et structure pour la première fois environ 2000 concepts de la discipline, en français et en anglais.

L’équipe d’ingénieurs spécia­li­sés en termi­no­lo­gie scien­ti­fique de l’Institut travaille régu­liè­re­ment sur des thésau­rus liés à l’actualité. Après le thésau­rus créé à l’occasion des 150 ans du tableau de Mendeleïev en 2019, le thésau­rus COVID-19 en 2020 et le thésau­rus sur la science ouverte en 2021, c’est au tour du paléo­cli­mat d’avoir fait l’objet d’une étude termi­no­lo­gique.

Un besoin scientifique

L’idée de ce thésau­rus est née en 2019 après une réflexion avec des cher­cheurs du domaine, avec l’objectif d’offrir à la commu­nauté scien­ti­fique un voca­bu­laire de réfé­rence. En effet, inexis­tant jusqu’alors, il faci­lite le partage des connais­sances, des données et des produc­tions scien­ti­fiques en paléo­cli­ma­to­lo­gie qui, rappe­lons-le, est l’étude des climats passés et de leurs varia­tions au fil du temps.

De la constitution d’un corpus à la publication du thésaurus

Pour sa créa­tion, la première étape a consisté en l’élaboration d’un corpus de réfé­rences biblio­gra­phiques et d’articles  issus des bases de données WOS, Scopus et de la plate­forme Istex.

Au total, le corpus comp­tait près de 40 000 docu­ments, couvrant la période 1890–2020.

Une extrac­tion termi­no­lo­gique a ensuite été effec­tuée avec l’outil TermSuite. Après une première sélec­tion parmi plus de 140 000 termes, une liste de 7000 termes a été établie sur laquelle sept cher­cheurs en paléo­cli­ma­to­lo­gie ont travaillé.

Ils ont procédé à l’examen et au choix de termes préfé­ren­tiels avec correc­tion et vali­da­tion des concepts créant ainsi un thésau­rus de 2000 entrées concep­tuelles hiérar­chi­sées sous une tren­taine de top-concepts.

Le thésau­rus a été enrichi avec des défi­ni­tions avant l’étape finale de struc­tu­ra­tion et de publi­ca­tion sur la plate­forme Loterre.

Tous les concepts sélec­tion­nés ont été traduits en fran­çais et ils ont été alignés avec les systèmes inter­na­tio­naux d’organisation des connais­sances, notam­ment Wikipédia. À ce jour, 600 de ces concepts ont été enri­chis avec des définitions.

Des perspectives

Plusieurs pers­pec­tives d’utilisation ont été défi­nies pour ce thésaurus :

  1. Partage des connais­sances, en four­nis­sant une ressource acces­sible, consul­table et télé­char­geable libre­ment en ligne : https://skosmos.loterre.fr/QX8 ;
  2. Contribution à une unifor­mi­sa­tion des termes utili­sés et régler les problèmes de poly­sé­mie et d’homonymie;
  3. Référentiel pour indexer les jeux de données de la recherche déposés dans des entrepôts ;
  4. Outil d’enseignement, pour mieux explo­rer et parta­ger les connais­sances, notam­ment dans le cadre du web sémantique.

Un poster

Afin de présen­ter le travail mis en œuvre dans ce projet, un poster a été réalisé et présenté à l’occasion de la 7e édition des jour­nées « Climat et Impacts » qui s’est tenue du 23 au 25 novembre 2022 à l’université Paris-Saclay.

Poster : Un nouveau thésau­rus de paléo­cli­ma­to­lo­gie : créa­tion et pers­pec­tives d’utilisation

Voir le poster dans HAL : https://hal.archives-ouvertes.fr/hal-03895146v1

 

Accéder au thésau­rus de paléoclimatologie…