STAGE EVoCSPa - Élaborer un vocabulaire contrôlé bilingue pour les sciences du patrimoine

Date de mise à jour de l’offre

CNRS - Laboratoire PPSM :

Le laboratoire PPSM agit dans le cadre de ce stage comme laboratoire porteur du Domaine de recherche et d’innovation majeur Patrimoines matériels innovation, expérimentation et résilience (DIM PAMIR). Le DIM PAMIR constitue à l’échelle de l’Île-de-France un réseau de recherche dédié à l’étude des sciences du patrimoine. Il fait dialoguer les sciences humaines et sociales (histoire, archéologie, histoire de l’art) et la paléontologie, avec les sciences de la nature (physique, chimie, sciences de la vie et de la Terre) et les sciences de la donnée (mathématiques, statistiques, informatique). Il s’attache à étudier le patrimoine sous tous ses angles, à renforcer la dynamique de collaboration entre les équipes de recherche et les acteurs socio-économiques, et à accompagner la structuration du champ. Le stage proposé s’inscrit dans le projet OBISPA, qui vise à définir des méthodes de mesure de l’interdisciplinarité en sciences du patrimoine à partir d’approches bibliométriques.

Description de la mission

Les objectifs de ce stage sont de : construire un vocabulaire contrôlé bilingue en sciences du patrimoine interrogeable par une chaîne de traitement pour créer des requêtes bibliographiques ; faire de la veille documentaire
La construction du vocabulaire contrôlé s’appuiera sur l’extraction de mots-clés issus des titres, résumés et mots-clés du corpus mis au point dans le cadre du projet OBISPA (voir ci-après) et sur des entretiens avec des spécialistes des sciences du patrimoine. Il devra être organisé en catégories de façon à pouvoir être interrogé par un code pour créer automatiquement ou semi-automatiquement des requêtes bibliographiques. Les missions de l’étudiant·e sont les suivantes: faire un état de l’art des vocabulaires en sciences du patrimoine existants ; construire un vocabulaire contrôlé bilingue de mots-clés en sciences du patrimoine ; proposer une chaîne de traitement requêtant le vocabulaire contrôlé pour faire de la veille bibliographique ; évaluer les résultats de la chaîne de traitement ; rédiger un rapport rendant compte des résultats obtenus.
Pour réaliser ce travail, l’étudiant·e s’appuiera sur les outils utilisés et développés par les membres du projet OBISPA, à savoir : Zotero pour accéder au corpus ; les codes Python et Javascript développés par les bibliothécaires sous forme de notebooks Jupyter pour analyser le corpus augmenté (analyse lexicale et analyse des réseaux de citation) ; Jupyter notebook pour développer un code Python requêtant le vocabulaire contrôlé ; Git pour déposer le code développé ; les bases bibliographiques Google Scholar, Hal, Scopus et Web of Science pour faire des requêtes bibliographiques.
Pour mener ce travail, le/la stagiaire travaillera avec les membres du projet OBISPA (DIM PAMIR, bibliothèques du Muséum national d’histoire naturelle, de Sorbonne Université, de l’Université Paris-Saclay et de d’Université Versailles-Saint-Quentin) et s’appuiera sur leur expertise.
Contexte : le projet OBISPA réunit des bibliothécaires spécialisé·es en bibliométrie et des scientifiques travaillant sur les sciences du patrimoine. Il vise à définir des méthodes de mesure de l’interdisciplinarité en sciences du patrimoine à partir d’approches diverses (analyse lexicale, analyse des réseaux de collaboration, analyse des citations, etc.). Dans un 2e temps, il vise à augmenter le corpus et à l’analyser, et à créer une chaîne de traitement pour faciliter le repérage des publications

Profil recherché

Le/la candidat·e doit présenter une formation en humanités numériques et en sciences de l’information, une formation en informatique est un plus.

Compétences et qualités recherchées
Savoirs généraux, théoriques et disciplinaires :
- Connaissance des techniques documentaires, notamment en recherche et veille documentaire ;
- Connaissance des vocabulaires contrôlés ;
- Connaissance des outils numériques et de leurs usages ;
- Connaissance de Python ;
- Connaissance de Git ;
- Intérêt pour la bibliométrie ;
- Intérêt pour le patrimoine culturel et naturel ;
- Bonnes capacités rédactionnelles.
Compétences comportementales :
- Sens relationnel ;
- Capacité d’adaptation et d’initiative ;
- Capacité d’analyse ;
- Rigueur et curiosité intellectuelle.

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    CNRS - Laboratoire PPSM
  • Secteur d’activité de la structure
    Enseignement - Formation - Recherche
  • Effectif de la structure
    De 21 à 50 salariés
  • Site internet de la structure
    https://ppsm.ens-paris-saclay.fr
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    4 avenue des sciences
    91190 GIF SUR YVETTE
  • Accès et transports
    Arrêt Le Guichet (RER B) puis arrêt Moulon (bus 9) ou Arrêt Massy-Palaiseau (RER B, RER C) puis arrêt Moulon (bus 91.06C, 91.06B, 91.10)