Stage 6 mois - Ingénieur.e recherche en data science - Paris

Date de mise à jour de l’offre

SUBSTRA :

Substra Foundation est une organisation de recherche indépendante, dédiée à l’exploration d’approches de la data science collaborative, responsable et de confiance. Elle se consacre notamment aux projets suivants : HealthChain et MELLODDY : deux projets de recherche sous forme de consortiums d’acteurs publics et privés, impliquant la mise en oeuvre d’apprentissage machine distribué dans des conditions de préservation de la confidentialité des données de chaque partenaire Framework Substra : projet open source qui permet l'orchestration sécurisée, traçable et distribuée de tâches de machine learning dans un cadre protecteur de la confidentialité des données Assessment data science responsable et de confiance : projet open source qui permet aux entreprises d’évaluer leur niveau de maturité et de se former aux pratiques de data science responsable et de confiance

Description de la mission

Un nouvel espace émerge au croisement entre expansion de l'IA dans les organisations et les systèmes automatiques, et inquiétudes du public sur les données privées, la transparence et la robustesse des algorithmes.
Ce sont deux tendances puissantes qui commencent déjà à se percuter. Comment les réconcilier, les conjuguer ensemble ? Des solutions techniques et organisationnelles nouvelles sont indispensables pour cela, pour accorder un cadre de confiance qui manque aujourd’hui, pour rendre possible des collaborations nouvelles, prometteuses et sûres entre les entreprises, les institutions publiques et les citoyens.
C’est en se posant ces questions et en y travaillant que nous avons, à partir de début 2019, commencé à imaginer l’intérêt qu’il y aurait à explorer ce thème et élaborer un outil qui soit à destination des praticiens, utile et actionnable dès que possible.
Plus d’une année plus tard, ponctuée de cinq ateliers participatifs et d’innombrables échanges, tests avec des cobayes, présentations, nous avons en conséquence créé un référentiel d’évaluation de la Data Science Responsable de Confiance :

une évaluation des approches responsables et de confiance de la data science ;
à destination des organisations, pour évaluer leur maturité ;
composée d’une trentaine de points d’évaluation regroupés en 5 sections thématiques ;
qui fournit en sortie un score synthétique sur 100 points (maximum théorique), sachant qu’à la date d’aujourd’hui 50/100 est un niveau de maturité très avancé ;
qui se complète de ressources techniques pour chaque point d’évaluation, constituant de bons points d’entrée pour les organisations qui souhaitent s’y former.

Nous souhaitons continuer avec toi à renforcer ce référentiel d’évaluation en y apportant des ressources supplémentaires, des guides techniques et des approches pédagogiques permettant à n’importe quel Data Scientist d’élever son niveau de maturité sur ces domaines.

Tes principales missions consisteront à :
- Identifier des ressources techniques autour de différents sujets (Privacy Enhancing Technologies, Fairness Metrics, Differential Privacy, …)
- Proposer des notebooks, des tutoriels techniques autour des différents sujets du référentiels
- Contribuer à l’étude et aux simulations numériques de mesures de la contribution à la performance d’un modèle prédictif de différents datasets sur lesquels le modèle a été entraîné de manière distribué

Profil recherché

Tu es en école d’ingénieurs et tu recherches un stage de six mois.
Tu as un profil technique, mais tu as également une fibre entrepreneuriale.
Tu es rigoureux, tu as un très bon esprit d’analyse et tu n’as pas peur d’aller en profondeur sur tes sujets.
Tu aimes le travail collaboratif : tu partages tes idées et tes difficultés, mais également tu écoutes et intègres celle des autres. Tu donnes et recherches les feedbacks.
L’Open Source t’intéresse, voire tu contribues déjà à un ou plusieurs projets.
Intelligence Artificielle, Machine Learning, Blockchain... tu es curieux de tous ces sujets bien au-delà des simples buzz words...
Data Science de confiance, Data Privacy, IA éthique et responsable ces notions résonnent en toi.
Travailler dans une petite équipe à taille humaine répartie sur différents sites ne te fait pas peur !
Tu parles et écris couramment l’anglais.

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    SUBSTRA
  • Secteur d’activité de la structure
    Enseignement - Formation - Recherche
  • Effectif de la structure
    De 0 à 10 salariés
  • Site internet de la structure
    https://www.substra.ai
  • Type de stage ou contrat
    Stage d'immersion en milieu professionnel dans le cadre de la formation professionnelle continue
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    33 Rue Berger
    75001 PARIS 1ER ARRONDISSEMENT
  • Accès et transports
    Métro Châtelet Les Halles