Stage Master 2 - Nouvelles approches bioinformatiques pour capturer la diversité du transcriptome.

Date de mise à jour de l’offre

Institut de Biologie Intégrative de la Cellule - I2BC - UMR 9198 CEA, CNRS, Université Paris Sud :

L’Institut de Biologie Intégrative de la Cellule (U2BC) UMR 9198 est une unité mixte de recherche (CEA, CNRS, Université Paris Sud) constitué de plus de 70 équipes de recherches réparties dans 5 départements de recherche , 14 plateformes technologiques (http://www.i2bc.paris-saclay.fr/). L’équipe Séquence, structure et fonction des ARN est une équipe de bioinformatique. Nous sommes particulièrement intéressés par les nouvelles données de séquençage d'ARN à très haut débit qui permettent d'appliquer des approches d'apprentissage automatique et de "big data" pour comprendre l’évolution et les mécanismes d’action des ARN.

Description de la mission

L'étude du transcriptome connaît aujourd'hui une révolution dans précédent avec le développement des technologies RNA-seq qui permettent non seulement de quantifier l'expression des gènes mais aussi de détecter de nouveaux transcrits variants. Cependant, aucun algorithme n'est encore en mesure de capturer la diversité phénoménale des isoformes de transcription. Il y a plus de 500.000 banques de RNA-seq disponibles dans le domaine public, et chaque banque contient des milliers de transcrits différents qui résultent des variations de chaque génome individuel et des mécanismes de maturation des ARN. Bien que ces variations puissent être très importantes fonctionnellement, la plupart sont ignorées par les protocoles bioinformatiques actuels.

Dans ce projet, notre laboratoire fait équipe avec deux groupes de bioinformatique à l'INRIA Lille et à l'INSERM Montpellier pour créer une nouvelle génération de logiciels d'analyse RNA-seq utilisant des structures d'indexation en k-mer permettant des analyses particulièrement performantes. Sur cette base, nous développerons des outils permettant de comparer directement les banques au niveau des k-mer et d'extraire tout évènement significatif indépendamment de son origine (génomique, transcriptomique/ post-transcriptomique). Nous utiliserons nos programmes pour analyser des jeux de données publiques (notamment de cancer) ou produites par nos collaborateurs afin d'identifier de nouveaux biomarqueurs ayant échappé à tous les cribles préalable

Profil recherché

L'équipe possède une solide expérience des méthodes bioinformatiques pour l'analyse du génome et du transcriptome non codant et de l'application de ces méthodes pour la découverte de nouveaux mécanismes biologiques. L'institut I2BC offre des installations bioinformatiques et un environnement scientifique de haut niveau au sein de l'Université Paris-Saclay. Nous bénéficions également de l'appui de la plateforme bioinformatique eBio et de structures locales de calcul scientifique tels que le cloud IFB et le CDS (Center for Data Science).



Le/la candidat(e) possédera une bonne capacité à développer des pipelines Unix et à réaliser des briques sensibles en C ou Python.

Il/elle sera capable d'acquérir une connaissance en approfondie des enjeux de la transcriptomique et sera fortement motivé(e) par la possibilité de découvrir de nouveaux biomarqueurs de maladies humaines.

Niveau de qualification requis

Bac + 4/5 et +
  • Employeur
    Institut de Biologie Intégrative de la Cellule - I2BC - UMR 9198 CEA, CNRS, Université Paris Sud
  • Secteur d’activité de la structure
    Enseignement - Formation - Recherche
  • Effectif de la structure
    Plus de 250 salariés
  • Site internet de la structure
    http://www.i2bc.paris-saclay.fr/
  • Type de stage ou contrat
    Stage pour lycéens et étudiants en formation initiale
  • Date prévisionnelle de démarrage
  • Durée du stage ou contrat
    Plus de 4 mois et jusqu'à 6 mois
  • Le stage est-il rémunéré ?
    Oui
  • Niveau de qualification requis

    Bac + 4/5 et +
  • Lieu du stage
    I2BC Université Paris Sud - Bâtiment 400
    91405 ORSAY
  • Accès et transports
    RER B - Orsay VIlle