STAGE développement de méthodes d’apprentissage statistiques pour la détection de dégradations matérielles sur le réseau haute tension

Date de mise à jour de l’offre

Eurobios :

La PME Eurobios, via sa branche Calcul Scientifique (Eurobios Scientific Computing Branch, ESCB) est spécialisée dans le développement d’outils et de solutions dans le domaine de la simulation, de la modélisation et de l’optimisation. Dans le contexte de gestion des actifs, Eurobios propose aux entreprises une approche originale, dite hybride, combinant modélisations physiques et méthodes d’apprentissage statistique. Eurobios Scientific Computing Branch recrute une ou un stagiaire maîtrisant les algorithmes d’estimation et d’apprentissage statistique. La personne recrutée travaillera dans un environnement scientifique de premier plan (collaboration avec centres de R&D en France et à l’International, Laboratoires de Recherche Universitaires) sur des sujets de pointe en traitement statistique de données et data mining. Elle bénéficiera du support d’une équipe pluridisciplinaire et travaillera sous l’autorité directe du directeur technique du Département ESCB.

Description de la mission

Dans son projet avec RTE, Eurobios étudie les phénomènes de vieillissement des lignes
aériennes sur l’ensemble du territoire français. L’objectif est de développer un outil d’aide à la décision pour
définir un classement des câbles pour les remplacer selon leur état de dégradation. Diverses bases de
données intégrant des informations sur le patrimoine des lignes aériennes, des actions de maintenance et de
l’open data sont utilisées. Le point de vue actuel ne permet pas de prendre en compte une évolution des
conditions externes ainsi que les événements intervenant ponctuellement sur la ligne puisqu’il ne permet que de
décrire un contexte général de vécu. Cela peut produire certaines incohérences, notamment la traduction d’un
lien événement-observation pouvant être anachronique. L’objectif de ce stage est de mettre en place un modèle
prédictif en prenant en compte un certain nombre d’événements passés jusqu’à un instant t et de prévenir
l’apparition de défaut à l’instant t + h. Dans la littérature, plusieurs modèles prédictifs peuvent répondre à nos
besoins pour la prédiction de la durée de vie d’une ligne. Ces modèles sont présentés sous deux types:
1. modèles dynamiques à espace d’état (state space model), modèles de Markov cachés (HHM) et modèles de systèmes dynamiques linéaires (LDS),
2. modèle de survie (modèles proportionnels de Cox, forêts aléatoires)
Le premier type modélise l’évolution de la dégradation d’une ligne au cours du temps en travaillant avec des variables cachées. Ces modèles offrent un cadre puissant et flexible pour une très large gamme de phénomènes dynamiques. En appliquant ces modèles, plusieurs difficultés peuvent apparaître comme : travailler avec des données en grande dimension, sélectionner la variable à modéliser et le lien avec la variable cachée, la prise en compte de la variabilité des covariables au cours du temps.
Le deuxième type de modèle est très répandu en analyse de survie. Il utilise soit un estimateur du maximum de
vraisemblance partielle pour calculer les coefficients du modèle, soit des méthodes de machine learning
classiques adaptées à l’analyse de survie.
L’une des contributions du stage est de comparer/modifier ces deux classes de modèle pour trouver le
meilleur modèle prédictif d’identification des événements d’intérêt (e.g. impact de foudre, vent fort, corrosion, etc.), de consolider les données temporelles ainsi que de calibrer le paramètre décrivant l’horizon temporel de prédiction.

Profil recherché

La personne recrutée sera idéalement un ou une étudiant(e) en dernière année d’école d’ingénieur ou en Master 2. De solides notions en statistiques sont exigées : méthodes de statistiques paramétriques (régressions, modèle de mélange), d’apprentissage supervisé (forêts aléatoires, méthodes à noyaux...) et non supervisé (K-moyennes, détection d’anomalies, ...). La maîtrise des langages Python et/ou R est requise. Des connaissances de méthodes de chaîne de Markov, méthode de survie seront appréciées.
La rémunération sera fonction de la formation du stagiaire dans la fourchette de 1000€ à 1300€ bruts mensuels.
Suivant les résultats du stage et ses aspirations, le ou la stagiaire pourra se voir proposer une suite des travaux
sous la forme
1) soit d’une embauche en tant qu’ingénieur R&D au sein de l’équipe ESCB,
2) soit d’une bourse de thèse CIFRE,
3) soit d’une participation à la création d’une start-up.

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    Eurobios
  • Secteur d’activité de la structure
    Emploi - Économie - Innovation - Numérique
  • Effectif de la structure
    De 11 à 20 salariés
  • Site internet de la structure
    https://www.eurobios.com
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    Campus de l'ENS Cachan
    Pavillon des jardins 61 avenue du Président Wilson
    94235 CACHAN
  • Accès et transports
    RER B Bagneux, bus RATP 184 et 187 depuis Paris