Utilisation des champs de Markov pour le nommage d'embryons d'ascidie

The offer description be low is in French

Level of qualifications required : Graduate degree or equivalent

Fonction : Internship Research

About the research centre or Inria department

Le centre Inria d'Université Côte d'Azur regroupe 42 équipes de recherche et 9 services d’appui. Le personnel du centre (500 personnes environ) est composé de scientifiques de différentes nationalités, d’ingénieurs, de techniciens et d’administratifs. Les équipes sont principalement implantées sur les campus universitaires de Sophia Antipolis et Nice ainsi que Montpellier, en lien étroit avec les laboratoires et les établissements de recherche et d'enseignement supérieur (Université Côte d’Azur, CNRS, INRAE, INSERM ...), mais aussi avec les acteurs économiques du territoire.

Présent dans les domaines des neurosciences et biologie computationnelles, la science des données et la modélisation, le génie logiciel et la certification, ainsi que la robotique collaborative, le Centre Inria d’Université Côte d’Azur est un acteur majeur en termes d'excellence scientifique par les résultats obtenus et les collaborations tant au niveau européen qu'international.

Context

La biologie du développement vise à comprendre la dynamique de la formation des tissus ou des organes au sein d'un organisme.  Pour étudier le développement, de nombreux organismes modèles sont utilisés. La plupart d'entre eux sont des animaux, comme le nématode C. elegans ou la drosophile. Chacun de ces modèles a sa propre spécificité, qui peut le rendre plus adapté à l'observation et/ou à l'analyse. Par exemple, le nématode C. elegans est transparent, ce qui le rend idéal pour l'observation au microscope optique, et il a un développement stéréotypé remarquable, chaque adulte ayant exactement le même nombre de cellules somatiques, chaque cellule ayant son homologue chez les autres individus. En d'autres termes, chaque cellule peut être identifiée par un nom (Sulston, 1983).  Cette dernière propriété permet non seulement d'effectuer des comparaisons cellulaires dans les études de population, mais aussi d'agréger différents types de cellules.

En ce qui concerne les vertébrés, les souris sont généralement le modèle de prédilection. Cependant, en tant que proches parents des vertébrés, les tuniciers sont également largement utilisés comme modèles pour étudier le développement embryonnaire, les ascidies étant le groupe le plus important parmi les tuniciers. Les embryons de certaines espèces d'ascidies sont transparents, ce qui les rend aptes à l'observation microscopique.  Enfin, le développement des embryons d'ascidies (dans les premiers stades) est stéréotypé au niveau cellulaire, comme le nématode C. Elegans, et ce, même d'une espèce à l'autre. Cette stéréotypie a permis le développement de nomenclatures (Kofold, 1893 ; Castle, 1896 ; Conklin, 1905) à partir d'observations en microscopie optique, qui fournissent des noms non ambigus pour les cellules embryonnaires pendant les premiers stades du développement.

Afin d’agréger des informations (par exemple d’expression génique) par cellule, il est donc nécessaire de pouvoir « nommer » les cellules d’un embryon à un instant quelconque. Ce projet vise à inférer les noms des cellules d’un embryon (issu d’une image 3D) à partir d’une base d’embryons en développement (issus de séries temporelles d’images 3D) déjà nommés (Guignard, 2020). Si le nombre de cellules est représentatif du stade de développement, il n’existe pas une exacte correspondance entre les cellules de deux embryons ayant le même nombre de cellules, à cause de l’hétérochronie des divisions (l’ordre temporel des divisions cellulaires est différent d’un embryon à l’autre). Par contre, il est possible de quantifier une similarité entre les cellules de deux embryons (Malandain, 2024), avec laquelle on peut estimer des probabilités empiriques de nommage pour chaque cellule. Par ailleurs, un embryon peut être représenté comme un graphe (les cellules étant les nœuds, les arêtes étant les adjacences entre cellules), ce qui introduit naturellement des probabilités conjointes entre les noms de deux cellules adjacentes.

Assignment

Ce stage a pour but de construire un champ de Markov dans un cadre Bayésien sur le graphe défini par l’embryon étudié, pour attribuer des noms aux cellules. La vraisemblance et l’a priori (interactions entre cellules voisines sur le graphe) seront inférés par une analyse statistique de la base de données d’embryons annotés. Le nommage des différentes cellules sera obtenu par l’optimisation du modèle par recuit simulé. Pour ce faire, la contrainte d’unicité de la cellule pour un nom donné sera préservée par une dynamique de type Kawasaki.

Main activities

Développer un code (python) pour nommer un embryon 3D (représenté sous forme de graphe) à partir d'une base d'embryons annotés.

Développer un cadre d'évaluation de cet outil.

Skills

  • Compétences informatiques : programmation (python), traitement d'images/bibliothèques graphiques
  • Anglais écrit et parlé

Benefits package

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés : 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Participation mutuelle (sous conditions)

Remuneration

Gratification selon temps de présence