STAGE Organisation de Compétitions en Intelligence Artificielle

Date de mise à jour de l’offre

UNIVERSITE DE PARIS XI PARIS SUD :

UNIVERSITE DE PARIS XI PARIS SUD, Etablissement publique national à caractère scientifique, culturel et professionnel, a débuté son activité en octobre 1975.

Description de la mission

Le Laboratoire de Recherche en Informatique (LRI) de l’Université Paris-Sud (Paris-Saclay) cherche un stagiaire pour travailler à l’organisation d’une compétition en Intelligence Artificielle (IA) avec de la plateforme Codalab. CodaLab Compétitions est une plateforme open source hébergée par l’Université Paris-Saclay https://competitions.codalab.org/ permettant de gérer des compétitions impliquant la soumission de résultats ou de logiciels. La plupart des compétitions hébergées sur Codalab sont des compétitions d’apprentissage automatique (Sciences des Données). A dater de Juin 2019, Codalab dépassait les 40 000 utilisateurs, 1000 compétitions (300 publiques) avec plus de 300 soumissions par jour.

Cette proposition se concentre sur l'IA basée sur les données. La recherche proposée vise à réduire le besoin d’expertise humaine dans la mise en œuvre d’algorithmes de reconnaissance de formes et de modélisation, dans divers domaines d’application (médecine, ingénierie, sciences sociales, physique), en utilisant de multiples modalités (images, vidéos, texte, séries temporelles, questionnaires). La compétition organisée par le stagiaire se fera préférablement avec soumission de code qui sera testé à l'aveugle sur la plateforme. Le choix des données se fera en concertation avec les encadrants du stage. Le stagiaire sera responsable de créer un kit de démarrage avec un exemple de solution du problème posé et d’implémenter la compétition sur Codalab.

Reconnaissant qu’il n’existe pas d'apprentissage automatique sans données de bonne qualité, le stagiaire consacrera une partie de son temps à la collecte et la préparation appropriées des données. Il adoptera de bonnes pratiques pour réduire les problèmes de biais et de non reproductibilité par manque de données. Il devra respecter confidentialité des données, et, le cas échéant, remplacer les données réelles par des données synthétiques réalistes ou offusquer les données pour en protéger les aspects confidentiels. Cela facilitera l'élargissement de l'accès aux données confidentielles ayant une valeur commerciale ou personnelle.

Un aspect complémentaire de cette recherche visera à transformer la compétition scientifique ou industrielle organisée en un «patron» simplifié, en utilisant des données de substitution (par exemple synthétiques), et en incluant des solutions prêtes à l'emploi. Ce patron permettra à d’autres utilisateurs sans expertise particulière en IA de créer des compétitions similaires.

Profil recherché

Nous recherchons un candidat ayant une formation en apprentissage automatique, probabilités et statistiques, optimisation, modélisation scientifique, traitement et contrôle du signal (ou au moins un sous-ensemble de ces sujets, le cas échéant). Le candidat doit avoir la capacité de travailler sur des problèmes interdisciplinaires, une solide formation en mathématiques et une expérience ou un fort désir de travailler sur des problèmes pratiques. De bonnes compétences en programmation sont également nécessaires, préférablement en Python. Une expérience avec TensorFlow et/ou PyTorch est préférable. Une expérience dans l'informatique GPU/TPU est un atout.

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    UNIVERSITE DE PARIS XI PARIS SUD
  • Secteur d’activité de la structure
    Enseignement - Formation - Recherche
  • Effectif de la structure
    Plus de 250 salariés
  • Site internet de la structure
    https://www.u-psud.fr
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    Laboratoire de Recherche en Informatique
    Bat 660 Claude Shannon Université Paris Sud Rue Noetzlin
    91190 GIF SUR YVETTE
  • Accès et transports
    En voiture : A6A, A6B ou A10 ; ou N118 Tranports en commun : RER Ligne B4 jusqu'à Orsay-Ville + bus 7, arrêt Moulon Le Guichet + bus 9, arrêt IUT - Pôle d'Ingénierie (batiment 650)