Partagez sur
Stage Master 2 - Nouvelles approches bioinformatiques pour capturer la diversité du transcriptome.
Date de mise à jour de l’offre
Institut de Biologie Intégrative de la Cellule - I2BC - UMR 9198 CEA, CNRS, Université Paris Sud :
L’Institut de Biologie Intégrative de la Cellule (U2BC) UMR 9198 est une unité mixte de recherche (CEA, CNRS, Université Paris Sud) constitué de plus de 70 équipes de recherches réparties dans 5 départements de recherche , 14 plateformes technologiques (http://www.i2bc.paris-saclay.fr/). L’équipe Séquence, structure et fonction des ARN est une équipe de bioinformatique. Nous sommes particulièrement intéressés par les nouvelles données de séquençage d'ARN à très haut débit qui permettent d'appliquer des approches d'apprentissage automatique et de "big data" pour comprendre l’évolution et les mécanismes d’action des ARN.
Description de la mission
L'étude du transcriptome connaît aujourd'hui une révolution dans précédent avec le développement des technologies RNA-seq qui permettent non seulement de quantifier l'expression des gènes mais aussi de détecter de nouveaux transcrits variants. Cependant, aucun algorithme n'est encore en mesure de capturer la diversité phénoménale des isoformes de transcription. Il y a plus de 500.000 banques de RNA-seq disponibles dans le domaine public, et chaque banque contient des milliers de transcrits différents qui résultent des variations de chaque génome individuel et des mécanismes de maturation des ARN. Bien que ces variations puissent être très importantes fonctionnellement, la plupart sont ignorées par les protocoles bioinformatiques actuels.
Dans ce projet, notre laboratoire fait équipe avec deux groupes de bioinformatique à l'INRIA Lille et à l'INSERM Montpellier pour créer une nouvelle génération de logiciels d'analyse RNA-seq utilisant des structures d'indexation en k-mer permettant des analyses particulièrement performantes. Sur cette base, nous développerons des outils permettant de comparer directement les banques au niveau des k-mer et d'extraire tout évènement significatif indépendamment de son origine (génomique, transcriptomique/ post-transcriptomique). Nous utiliserons nos programmes pour analyser des jeux de données publiques (notamment de cancer) ou produites par nos collaborateurs afin d'identifier de nouveaux biomarqueurs ayant échappé à tous les cribles préalable
Dans ce projet, notre laboratoire fait équipe avec deux groupes de bioinformatique à l'INRIA Lille et à l'INSERM Montpellier pour créer une nouvelle génération de logiciels d'analyse RNA-seq utilisant des structures d'indexation en k-mer permettant des analyses particulièrement performantes. Sur cette base, nous développerons des outils permettant de comparer directement les banques au niveau des k-mer et d'extraire tout évènement significatif indépendamment de son origine (génomique, transcriptomique/ post-transcriptomique). Nous utiliserons nos programmes pour analyser des jeux de données publiques (notamment de cancer) ou produites par nos collaborateurs afin d'identifier de nouveaux biomarqueurs ayant échappé à tous les cribles préalable
Profil recherché
L'équipe possède une solide expérience des méthodes bioinformatiques pour l'analyse du génome et du transcriptome non codant et de l'application de ces méthodes pour la découverte de nouveaux mécanismes biologiques. L'institut I2BC offre des installations bioinformatiques et un environnement scientifique de haut niveau au sein de l'Université Paris-Saclay. Nous bénéficions également de l'appui de la plateforme bioinformatique eBio et de structures locales de calcul scientifique tels que le cloud IFB et le CDS (Center for Data Science).
Le/la candidat(e) possédera une bonne capacité à développer des pipelines Unix et à réaliser des briques sensibles en C ou Python.
Il/elle sera capable d'acquérir une connaissance en approfondie des enjeux de la transcriptomique et sera fortement motivé(e) par la possibilité de découvrir de nouveaux biomarqueurs de maladies humaines.
Le/la candidat(e) possédera une bonne capacité à développer des pipelines Unix et à réaliser des briques sensibles en C ou Python.
Il/elle sera capable d'acquérir une connaissance en approfondie des enjeux de la transcriptomique et sera fortement motivé(e) par la possibilité de découvrir de nouveaux biomarqueurs de maladies humaines.
Niveau de qualification requis
Bac + 4/5 et +
Les offres de stage ou de contrat sont définies par les recruteurs eux-mêmes.
En sa qualité d’hébergeur dans le cadre du dispositif des « 100 000 stages », la Région Île-de-France est soumise à un régime de responsabilité atténuée prévu aux articles 6.I.2 et suivants de la loi n°2204-575 du 21 juin 2004 sur la confiance dans l’économie numérique.
La Région Île-de-France ne saurait être tenue responsable du contenu des offres.
Néanmoins, si vous détectez une offre frauduleuse, abusive ou discriminatoire vous pouvez la signaler
en cliquant sur ce lien.
-
EmployeurInstitut de Biologie Intégrative de la Cellule - I2BC - UMR 9198 CEA, CNRS, Université Paris Sud
-
Secteur d’activité de la structureEnseignement - Formation - Recherche
-
Effectif de la structurePlus de 250 salariés
-
Site internet de la structurehttp://www.i2bc.paris-saclay.fr/
-
Type de stage ou contratStage pour lycéens et étudiants en formation initiale
-
Date prévisionnelle de démarrage
-
Durée du stage ou contratPlus de 4 mois et jusqu'à 6 mois
-
Le stage est-il rémunéré ?Oui
-
Niveau de qualification requis
Bac + 4/5 et + -
Lieu du stageI2BC Université Paris Sud - Bâtiment 400
91405 ORSAY -
Accès et transportsRER B - Orsay VIlle