STAGE Data Scientist (H/F) Adaptation de domaine et transport optimal

Date de mise à jour de l’offre

Quantmetry :

Quantmetry est un pure player de l'Intelligence Artificielle qui apporte à ses clients des solutions d'IA, de bout en bout, de la construction de l'algorithme jusqu'au déploiement opérationnel des modèles, pour les aider à valoriser et garder la maîtrise de leurs données. A titre d'exemple, nous intervenons auprès des directions data, industrielles, financières et marketing sur des problématiques, entre autres, de Pricing, connaissance client, stratégie commerciale, transformation SI.

Description de la mission

Préalable
Quantmetry propose ci-dessous le volet R&D d’une offre de stage. Tout stagiaire entrant chez Quantmetry, outre le travail de R&D qui lui est proposé et pour lequel il sera encadré, aura aussi pour objectif de participer à certaines missions de conseil chez des clients variés, lui permettant d’aborder le monde du consulting.
Les missions de conseil pour découvrir le métier de consultant en Data Science consisteront à apprendre à :
- Élaborer des besoins métiers;
- Définir des principes et méthodes de collecte et de traitement de données;
- Sélectionner les modèles ou techniques les plus adaptées à un projet (Computer Vision, Time Series, NLP, classic Machine Learning...) au regard de l’architecture-cible;
- Mettre en application des techniques d’industrialisation d’algorithmes par la conception de modèles robustes, intelligibles, et un code proprement architecturé ;
- Restituer des analyses, résultats ou produits obtenus auprès d’interlocuteurs métiers

Contexte
Le machine learning est bâti sur une hypothèse rarement remise en cause, à savoir : les données sont indépendantes et identiquement distribuées. C’est l’hypothèse implicite et sous-jacente à toutes les techniques de séparation train/test et de validation croisée. Toutefois en pratique, cette hypothèse est rarement vérifiée. En effet, les données sont des signaux envoyés par un monde en constante évolution. A ce titre, les données n’échappent pas à la règle : elles évoluent dans le temps également, plus ou moins rapidement. C’est un vrai problème pour la mise en production de modèles prédictifs, car le jeu d’entraînement est souvent éloigné dans le passé, rendant le modèle obsolète pour prédire aujourd’hui. L’adaptation de domaine est la science qui cherche à résoudre ce problème [1,2] (voir [3] pour une vulgarisation en français) : sachant un jeu de données labellisées (X, Y) et un jeu de prédiction non-labellisé Z, comment transformer X pour qu’il ressemble le plus possible à Z et corriger l’obsolescence du modèle ?

Plusieurs outils implémentent des solutions d’adaptation de domaine, et plus largement de transport optimal. Certaines sont disponibles en accès libre, en particulier :
- libTLDA [4], développé par l’université de Delft (Pays-Bas)
- salad [5, 6], développé par l’université de Tubingen (Allemagne)
- POT [7], développé par l’université Nice Sophia-Antipolis et l’Université Bretagne-Sud

Profil recherché

Nous recherchons une personne dynamique et curieuse, qui saura s'intégrer et faire progresser notre ambitieuse expertise Data Science !
Savoir-être
- Autonome
- Travail en équipe
- Proactif
Data Science
- Machine Learning
- Expérience en Deep Learning (stage, projet et/ou cours)
Engineering
- Python
- Bonnes pratiques de développement logiciel

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    Quantmetry
  • Secteur d’activité de la structure
    Emploi - Economie - Innovation - Numérique
  • Effectif de la structure
    De 51 à 250 salariés
  • Site internet de la structure
    https://www.quantmetry.com
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    52 Rue d'Anjou
    75008 PARIS 8E ARRONDISSEMENT
  • Accès et transports
    Métro