STAGE Data Science/Analyse de données textuelles

Date de mise à jour de l’offre

SORBONNE UNIVERSITE (via partenaire CY Cergy Paris Université pour Sorbonne Université 19753486000105) :

CY Cergy Paris Université assure l'ensemble des activités, des droits et des obligations de l'université de Cergy-Pontoise, de l'Université Paris-Seine, et de l'Ecole internationale des sciences du traitement de l'informatique qu'elle intègre. Elle partage et coordonne des compétences avec les établissements composantes.

Description de la mission

L'IDHN (Institut des humanités numériques) est une structure fédérative en Humanités numériques (HN) qui a été créée en 2017 en lien avec le Domaine d'intérêt Majeur (DIM) Sciences du texte et connaissances nouvelles (STCN) porté par Sorbonne Université et dont CY Cergy Paris Université est membre fondateur et partenaire. Elle regroupe des chercheurs de 4 laboratoires: « Lexiques, Textes, Discours, Dictionnaires » (LT2D), « Mobilités, Réseaux, Territoires, Environnement » (MRTE), Agora et « Équipes Traitement de l'Information et Systèmes » (ETIS), depuis 2017, et même avant par les collaborations entre les chercheurs de ces laboratoires, l’analyse des discours numériques a été au centre des préoccupations, en particulier en contexte électoral.
Plusieurs projets ont ainsi été développés depuis 2014 :
- #Polititweets,
https://repository.ortolang.fr/api/content/comere/v3.1/cmr-polititweets.html corpus de
tweets politiques provenant de “comptes influents”;
- #Idéo2017: https://ideo2017.ensea.fr, plateforme d’analyse lors des élections
présidentielles 2017;
- #Cicero, plateforme d’analyse de vidéos présentée au salon CNRS innovatives en 2019:
https://25images.msh-lse.fr/innovatives-shs_2019/video/projet-cicero/fr
- PolitiQuiz, https://www.politiquiz.fr, quiz politique basé sur les analyses de corpus et
l’utilisation de différentes technologies.
L’IDHN souhaite étoffer son équipe mobilisée sur les élections présidentielles 2022 (7 personnes pour l’instant), et cherche un-e stagiaire avec des compétences en IA et en analyse de données textuelles.

En collaboration avec l’équipe impliquée dans le projet, la personne recrutée contribuera à la mise en place d’outils d’analyse et de visualisation des résultats. A partir de critères d’analyse bien connus dans l’état de l’art (classifications, clusterisations, calculs de spécificités, n-gram, extraction de connaissances etc), il s’agira de contribuer aux choix pertinents en matière d’analyse en temps réel de la campagne, tout en anticipant sur le portage de ces analyses sur une ou plusieurs plateformes web qui serviront de tableau de bord en temps réel de l’analyse des discours produit dans et sur la campagne (corpus à préciser).

Profil recherché

- Vous êtes passionné et intéressé par le monde de la recherche.
- Vous avez des bases en Python et en machine learning (Sklearn, Tensorflow ou Pytorch).
- Vous avez déjà réalisé un ou plusieurs projets (personnel ou scolaire) en intelligence
artificielle.
- Vous avez idéalement une connaissance dans le domaine du NLP, traitement d’image ou
traitement vidéo.
- Expérience : 6 mois minimum (dont projets étudiants, projets tuteurés, projets personnels).

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    SORBONNE UNIVERSITE (via partenaire CY Cergy Paris Université pour Sorbonne Université 19753486000105)
  • Secteur d’activité de la structure
    Enseignement - Formation - Recherche
  • Effectif de la structure
    Plus de 250 salariés
  • Site internet de la structure
    https://www.u-cergy.fr
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    Institut des humanités numériques (FED 4284) Tour des Chênes, 7ème étage, bureau 719
    33 boulevard du Port
    95011 CERGY
  • Accès et transports
    RER A direction Cergy-le-haut, arrêt Cergy-Préfecture ou RER C arrêt Pontoise (prendre ensuite le bus) - Bus depuis Pontoise, lignes 30, 42, 44, 45, 56, 57 arrêt Cergy-Préfecture