Ingénieur de recherche - Analyse statistique de données médicales longitudinales

Type de contrat : CDD

Contrat renouvelable : Oui

Niveau de diplôme exigé : Thèse ou équivalent

Fonction : Ingénieur scientifique contractuel

Contexte et atouts du poste

Vous travaillerez dans le cadre du projet REWIND (pRecision mEdecine WIth longitudinal Data), un projet multicentrique (Paris, Bordeaux, Lyon, Grenoble, Nice) financé par l'Investissement d'avenir PEPR Santé Numérique. Le projet se concentrera sur le développement de nouvelles approches mathématiques et statistiques pour l'analyse de données longitudinales multimodales et multi-échelles. Ces modèles seront conçus, mis en œuvre sous forme de prototypes, puis transférés sur une plateforme facile à utiliser et bien documentée où les chercheurs de diverses communautés, en particulier les médecins, seront en mesure d'analyser leurs données. Le projet permettra le développement d'une nouvelle génération de systèmes d'aide à la décision, qui aideront les cliniciens au chevet du patient à prendre des décisions plus éclairées. Ils contribueront au développement de la médecine de précision dans plusieurs domaines clés.

Dans ce cadre, vous travaillerez au sein de deux équipes : HeKA (Inria-Inserm-Université Paris Cité) et ARAMIS (Inria, CNRS, Inserm et Sorbonne Université). HeKA est situé sur le Campus PariSanté (https://parisantecampus.fr), tandis que le laboratoire ARAMIS est situé à l'Institut du Cerveau de Paris (https://institutducerveau-icm.org). Alors que HeKA vise à développer des méthodes, des modèles et des outils pour créer, évaluer et valider des systèmes de santé apprenants, le laboratoire ARAMIS est dédié au développement de nouvelles approches informatiques pour l'analyse de grands jeux de données cliniques et de neuro-imagerie.

Vous serez fortement impliqué dans les aspects scientifiques du travail, tels que la discussion des questions méthodologiques et l'interprétation des résultats. Vous interagirez localement avec les doctorants, les postdoctorants et les ingénieurs. Vous participerez aux communications et aux publications résultant de l'utilisation du logiciel.

Mission confiée

Le laboratoire ARAMIS développe le logiciel libre Leaspy [1,2,3] (https://leaspy.readthedocs.io/en/stable/, https://github.com/aramis-lab/leaspy), une bibliothèque Python pour l'analyse statistique des données longitudinales, en particulier des données médicales qui se présentent sous la forme d'observations répétées de patients à différents temps. Leaspy permet aux utilisateurs d'adapter facilement divers modèles à des études cliniques à grande échelle constituées de scores cliniques, d'évaluations cognitives, de mesures physiologiques ou de données dérivées de l'imagerie. Leaspy vise à recombiner ces séries pour reconstruire la trajectoire spatio-temporelle à long terme de l'évolution de la maladie. Chaque patient peut alors être positionné par rapport à la trajectoire moyenne du groupe, en termes de différences temporelles et spatiales. Les observations futures, ainsi que les trajectoires des patients virtuels, peuvent alors être simulées. Leaspy est distribué gratuitement à la communauté scientifique et compte des utilisateurs dans le monde entier. Il a été utilisé pour produire des publications médicales à fort impact qui ont fait progresser la compréhension des maladies neurodégénératives telles que la maladie d'Alzheimer, la démence fronto-temporale et la sclérose latérale amyotrophique [4,5,6,7].

  1. Schiratti, S. Allassonnière, O. Colliot, S. Durrleman: ‘A Bayesian mixed-effects model to learn trajectories of changes from repeated manifold-valued observations’, The Journal of Machine Learning Research, 18:1-33, 2017E.
  2. Poulet, S. Durrleman: ‘Multivariate disease progression modeling with longitudinal ordinal data’, Statistics in Medicine, 42(18), 3164-3183, 2023
  3. Fournier, S. Durrleman: ‘A Multimodal Disease Progression Model for Genetic Associations with disease Progression Model for Genetic Associations with Disease Dynamics’, International Conference on Medical Image Computing and Computer-Assisted Intervention’, (pp. 601-610), Springer Nature Switzerland, 2023
  4. Maheux, I. Koval, J. Ortholand, C. Birkenbihl, D. Archetti, V. Bouteloup, …, S. Durrleman: ‘Forecasting individual progression trajectories in Alzheimer’s disease’, Nature Communications, 14(1), 761, 2023
  5. Ortholand, P.F. Pradat, S. Tezenas du Montcel, S. Durrleman : ‘Interaction of sex and onset site on the disease trajectory of amyotrophic lateral sclerosis’, Journal of Neurology, 270(12), 5903-5912, 2023
  6. Di Folco, R. Couronné, I. Arnulf, G. Mangone, S. Leu-Semenescu, P. Dodet, …, S. Durrleman : ‘Charting disease trajectories from isolated REM sleep behavior disorder to Parkinson’s disease’, Movement Disorders, 39(1), 64-75, 2024
  7. Moulaire, P.E. Poulet, E. Klockgether, …, S. Durrleman : ‘Temporal dynamics of the scale for the assessment and rating of ataxia in spinocerebellar ataxias’, Movement Disorders, 38(1), 35-44, 2023

Principales activités

Vous serez en charge du développement de nouvelles fonctionnalités (implémentation de nouveaux modèles, algorithmes, métriques, visualisations), de la maintenance du logiciel, du support aux utilisateurs et de l'animation de la communauté. De plus, vous présenterez le logiciel lors de conférences scientifiques internationales et autres événements (organisés, par exemple, par Inria, ICM, CNRS...). Enfin, vous contribuerez à des études médicales ambitieuses en utilisant Leaspy sur de grandes bases de données de patients, en contribuant à l'interprétation des résultats et en fournissant une assistance aux utilisateurs (internes au laboratoire et collaborateurs externes).

Compétences

Doctorat ou master + expérience dans le domaine de l'analyse statistique
Solides compétences en programmation en Python
Une expérience de travail avec Git/GitHub sur des projets open-source serait un plus
Excellentes compétences relationnelles et de communication pour interagir avec les utilisateurs et les membres du laboratoire
Bonnes compétences rédactionnelles (documentation, site web, articles scientifiques).

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale