STAGE Offre de stage en NLP pour diminuer l'empreinte carbone du bâtiment

Date de mise à jour de l’offre

SustainEcho :

SustainEcho est une jeune entreprise qui développe une plateforme d'automatisation des études d'Analyse du Cycle de Vie des bâtiments directement à partir des métrés et autres documents quantitatifs grâce à de l'intelligence artificielle.

Description de la mission

1 Contexte du problème

SustainEcho est une start-up développant un logiciel SaaS permettant aux entreprises de la construction
de calculer automatiquement l’empreinte carbone d’un bâtiment. Le principal défi technique traitée par
SustainEcho est de réaliser automatiquement le lien entre fichiers non structurées récapitulant les matériaux du
bâtiment et les bases de données carbone existantes. Cela permet aux constructeurs de connaître l’empreinte
carbone de leur bâtiment et de visualiser les améliorations possibles.
Pour répondre à ce défi, l’équipe Machine Learning de SustainEcho développe des algorithmes de classification reposant sur l’état de l’art du traitement naturel du langage (NLP). L’amélioration continue des
performances des algorithmes de classification repose sur l’amélioration continue de ces algorithmes en lien
avec les derniers développements de l’état de l’art. La spécialisation des algorithmes pour les données propres chaque utilisateur est une piste prometteuse.
Dans ce contexte, SustainEcho propose un sujet de stage de recherche de Master 2 sur les méthodes de
classification en Natural Language Processing. Ce sujet soulève plusieurs sous-problématiques importante
pour l’équipe de Machine Learning : la faible quantité de données disponible pour certaines classes, la gestion
des mots rares (long queue), et la spécificité de certaines approches. Objectifs du stage

2 Objectif principal

L’objectif du stage est de développer un algorithme de classification de séquences textuelles, qui répond
de manière spécifique en fonction de l’historique des requêtes. A ce jour, les méthodes de systèmes de
recommandation sont extensivement développées dans le domaine du e-commerce. Cependant, elles utilisent
principalement des modèles de retargeting, qui ne sont pas directement transposables au cas de phrases. De
leur côté, les méthodes de classification classiques ne permettent pas de prendre en compte le contexte de
l’objet classifié.
3.2 Objectif secondaire
De façon secondaire, on pourra s’intéresser à un objectif de parcimonie en terme de temps d’inférence et de
mémoire utilisée par le modèle de prédiction.

Profil recherché

Tu cherches un stage de fin d’étude d’école d’ingénieur ou de master Machine Learning.
Tu es expert.e en Machine Learning (notamment en Deep Learning)
Tu aimes passer du temps à résoudre des problèmes pratiques qui demandent de solides bases théoriques
Tu sais produire du code propre pour la production
Tu aimes résoudre des problèmes importants
Tu es rigoureux

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    SustainEcho
  • Secteur d’activité de la structure
    Logement - Bâtiment
  • Effectif de la structure
    De 0 à 10 salariés
  • Site internet de la structure
    https://www.sustainecho.com
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    292 Rue Saint-Martin
    75003 PARIS 3E ARRONDISSEMENT
  • Accès et transports
    Ligne 3 et 11 du métro parisien