STAGE Morphologie des galaxies par apprentissage profond supervisé / supervised deep learning

Date de mise à jour de l’offre

Centre National de la Recherche Scientifique - Institut d'Astrophysique de Paris :

Unité mixte de recherche CNRS & Sorbonne Université (UMR 7095)

Description de la mission

Il s'agit de déterminer par apprentissage automatique les types et autres caractéristiques morphologiques d'un nouveau catalogue de galaxies proches, MorCat. Il est extrait du grand relevé CCD du ciel « Sloan Digital Sky Survey » (SDSS), dans 5 filtres (ugriz), et contient les ~20 000 galaxies les plus brillantes (g≤15.5) de la calotte polaire de l’hémisphère nord galactique.
Des réseaux de neurones convolutifs ont été entraînés sur un sous-échantillon de ~4500 galaxies pour lesquels les type de Hubble et 16 paramètres de forme ont été mesurés visuellement (Baillard et al. 2011 ; de Lapparent et al. 2011). Les réseaux sont constitués de modules de convolution de type Inception (utilise par Google pour la reconnaissance de forme dans les images ; Szegedy et al. 2014), puis de couches complètement connectées, et d'une couche finale de « Softmax ». Ces réseaux existants et les outils de diagnostic seront à la disposition de la/du stagiaire (codes Python - TensorFlow). L'architecture du réseau pourra être modifiée en vue d'optimiser sa sensibilité aux caractéristiques morphologiques recherchées, permettant ainsi à l'étudiant-e de se familiariser avec TensorFlow.
Les étapes à mettre en œuvre lors du stage sont l'enrichissement de la base d'entraînement par augmentation de données (en perturbant les images par rotation, miroir, changement de résolution), ainsi que la modification des réseaux afin de les rendre invariants par rotation des images (Dieleman et al. 2015). Des échantillons d'images simulées de galaxies seront également disponibles pour tester les performances des réseaux.
La connaissance de la morphologie pour l'ensemble du catalogue MorCat rendra possible des analyses statistiques sans précédent concernant les galaxies proches : fonctions de luminosité et de masse par type, corrélations spatiales par type, répartition des types au sein de la toile cosmique.
Plus d'informations
http://www2.iap.fr/users/lapparent/stages/morcat_deeplearn.html

Profil recherché

Nature du travail demandé :
Modélisation

Pré-requis :
programmation en Python

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    Centre National de la Recherche Scientifique - Institut d'Astrophysique de Paris
  • Secteur d’activité de la structure
    Enseignement - Formation - Recherche
  • Effectif de la structure
    De 51 à 250 salariés
  • Site internet de la structure
    http://www.iap.fr
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 2 mois et jusqu'à 4 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    98 bis Boulevard Arago
    Institut d'Astrophysique de Paris
    75014 PARIS 14E ARRONDISSEMENT
  • Accès et transports
    Denfert-Rochereau