STAGE PLATEFORME DATA/SCIENCE

Date de mise à jour de l’offre

Imagine, Institut des maladies génétiques :

Créé à l’initiative des chercheurs et médecins de l’Hôpital Necker – Enfants malades, l’Institut hospitalo-universitaire (IHU) des maladies génétiques Imagine développe des programmes scientifiques fondés sur une continuité entre recherche fondamentale, recherche clinique et soins innovants sur les maladies génétiques et les prédispositions génétiques aux maladies fréquentes, de l’enfance à l’âge adulte. Imagine a pour ambition d’accélérer la recherche en l’organisant au plus près du malade afin d’apporter les solutions diagnostiques et thérapeutiques attendues par les patients et leurs familles.

Description de la mission

La dysmorphologie est l’étude des dysmorphies causées par différents syndromes poly-malformatifs souvent d’origine génétiques. Dans ce cadre nous avons mis en place une photothèque comprenant 240.000 images issues de consultation de dysmorphologie pédiatrique, et ce pour plus de 17.000 patients.

Autour de cette base de données est monté un projet d’intelligence artificielle dont les deux axes principaux seront l’assistance au diagnostic et la description phénotypique des images [1]. Un outil tel que Face2gene [2] montre la pertinence de l’application du machine learning à la reconnaissance de syndromes polymalformatifs. Néanmoins notre approche s’éloigne de cet outil sur différents aspects à la fois réglementaires et en termes d’applications médicales.

Par ailleurs notre équipe a mis en place à l'Hôpital Necker l’entrepôt de données Dr Warehouse. Cet entrepôt permet d’accéder à plus de 5 millions de documents pour plus de 670.000 patients passés par les services de l'Hôpital Necker [3]. Nous sommes en mesure d’extraire les concepts issus de ses documents pour procéder à un phénotypage à haut débit [4] ainsi que de retrouver les patients similaires relativement à ces concepts extraits [5].

Objectifs du projet
La première étape de notre projet est d’être en mesure de générer au besoin des jeux de données d’images d'intérêt parmi les 240.000 disponibles. Les images dans cette photothèque sont de qualité extrêmement hétérogène et incluent un grand nombre d’éléments parasites ou perturbateurs (main du pédiatre, visage des parents,...). Il conviendra donc de mettre en place des méthodes adaptées à ce contexte pour sélectionner automatiquement dans la photothèque des images exploitables pour différents projets ultérieurs.
D’autre part, les concepts extraits de Dr Warehouse vont permettre d’annoter automatiquement les images à partir des concepts phénotypiques issus des comptes rendus de patients, ce qui permettra d’initier un travail de phénotypage à partir des images directement.
Approche proposée
Faire un état de l’art des méthodes de reconnaissance de visage de face et de profil, ainsi que de membres, adaptables aux images issues de la dysmorphologie [6].
Mise en place de 3 modèles de machine learning avec pour but la reconnaissance et l’extraction de descripteurs pour :
- Visages de face
- Visages de profil
- Mains
Calcul de ratios biométriques sur ces images.

Profil recherché

PRE-REQUIS

- Python et/ou R
- Machine learning appliqué à l’analyse d’image (openCV,...)
- SQL
- Maîtrise de l’anglais

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    Imagine, Institut des maladies génétiques
  • Secteur d’activité de la structure
    Enseignement - Formation - Recherche
  • Effectif de la structure
    De 51 à 250 salariés
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    24 boulevard du Montparnasse
    75015 PARIS 15E ARRONDISSEMENT
  • Accès et transports
    Montparnasse