Paleosaurus : un vocabulaire normé en paléoclimatologie

image actualité
06.04.2020

Le projet, baptisé « Paleosaurus », vise à conce­voir un voca­bu­laire normé en paléo­cli­ma­to­lo­gie afin de mieux lier les corpus disci­pli­naires, à déve­lop­per une métho­do­lo­gie pour créer des Plans de Gestion de Données (DMP) compa­tibles avec les contraintes de la disci­pline et à travailler sur un exemple concret d’application en créant la première base de données rela­tive aux loess.

L’Inist avait parti­cipé au prin­temps 2019 à la soumis­sion d’une réponse à l’appel à projet ANR Flash « Science ouverte », en parte­na­riat avec l’Université Paris-Saclay et le Laboratoire des Sciences du Climat et de l’Environnement (LSCE – unité mixte de recherche CEA, CNRS et Université de Versailles Saint-Quentin).

L’ANR n’a fina­le­ment pas retenu ce projet, mais l’Inist et ses parte­naires, convain­cus de son intérêt, ont décidé d’entre­prendre ce travail sur leurs ressources propres, avec des contraintes tempo­relles un peu relâchées.

Une visio­con­fé­rence qui s’est tenue en février 2020 a permis à chacun de renou­ve­ler son accord et a lancé le début des travaux.

Dans une première phase, les services Ingénierie Terminologique et ISTEX Textes et Corpus ont colla­boré pour consti­tuer un corpus de plus de 7000 docu­ments extraits d’ISTEX, qui a été chargé dans une instance Lodex pour validation.

Ce corpus va servir à faire une première extrac­tion termi­no­lo­gique, à l’aide de l’outil TermSuite. Cette phase vient d’être lancée.

La phase suivante consis­tera à soumettre les termes extraits à nos parte­naires spécia­listes de paléo­cli­ma­to­lo­gie du LSCE, pour vali­da­tion, structuration.

Le corpus sera égale­ment enrichi avec des réfé­rences plus récentes (publiées après 2000) four­nies par les spécia­listes de biblio­mé­trie de l’Université de Saclay.