2020-02913 - Ingénieur data science collaboration Inria - AP-HP Entrepôt de données de Santé (EDS)
The offer description below is in French

Contract type : Fixed-term contract

Level of qualifications required : Graduate degree or equivalent

Other valued qualifications : Thèse

Fonction : Temporary scientific engineer

About the research centre or Inria department

Le centre de recherche Inria Saclay – Île-de-France, créé en 2008, accueille 450 scientifiques et 60 membres des services d’appui à la recherche. Les scientifiques sont organisés en 28 équipes de recherche dont 23 sont communes avec des partenaires du plateau de Saclay.

Le centre Inria Saclay - Île-de-France est un acteur essentiel de la recherche en sciences du numérique sur le plateau de Saclay. Il porte les valeurs et les projets qui font l’originalité d’Inria dans le paysage de la recherche : l’excellence scientifique, le transfert technologique, les partenariats pluridisciplinaires avec des établissements aux compétences complémentaires aux nôtres, afin de maximiser l’impact scientifique, économique et sociétal d’Inria.

 

Context

L’équipe Parietal a été fortement impliquée dans le pilotage de la crise sanitaire du Covid-19 au sein de l’AP-HP. Cette implication a été matérialisée par un travail intense sur plus de 2 mois avec l'Entrepôt de Données de Santé (EDS) de l’AP-HP. L’équipe a mis en place des outils logiciels en Python servant à la réalisation d’un dashboard web qui était quotidiennement transmis au sein de l’AP-HP. L’objectif de ce poste d'ingénieur à l’interface entre data science et recherche clinique est de poursuivre ce travail entre Inria et l'EDS de l'AP-HP.

Ce poste est financé par Inria dans le cadre d'une action de développement technologique de 3 ans.

Cette video parle du travail réalisé et donne les bases du projet: https://www.youtube.com/watch?v=9uuFGByFSok

Voici une autre communication sur le suet : https://www.inria.fr/fr/scikiteds

Le poste sera localisé à mi-temps entre Inria Saclay sur le campus de l'école Polytechnique et le site de l'EDS de l'AP-HP dans le 12ème à Paris.

Assignment

La librairie Python développé durant la crise Covid s’appuie sur la base SQL “CoronaOmop” (de type postgres ou pyspark/HIVE)  au format standard OMOP. Ce schéma de base de données est un standard du monde médical  permettant la potentielle réutilisation du code à grande échelle, y compris sur le Health Data Hub. La librairie et le dashboard sont basés sur le stack de Python scientifique Numpy, Scipy, Pandas, Matplotlib, Plotly et scikit-learn.

La librairie est testée avec pytest et l’intégration continue se fait avec Gitlab-CI.

La librairie est documentée avec sphinx.

Objectifs:

> Reprise et généralisation sur la base OMOP des librairies développées pour CoronaOmop. L’objectif est de mettre le code en open-source (utilisation par les hôpitaux ayant standardisé leurs données au format OMOP)

> Création de briques logicielles transversales pour la data-quality / data management / enrichissement de données (ex : pipelines NLP/validateur des extractions, outil d’annotation de données)

> Développer des briques de visualisation de données pour Cohort360 sur la base OMOP (sankey plot, pyramide des âges…). Ce travail sera orienté recherche et soin.

> Développer des briques d’exploration de données pour le pilotage

En termes de code déjà publique qui servira de base:

> le code de la librairie covid19-python développée par l'équipe Inria

> le framagit « inter-CHU » très animé par Nicolas Paris (mais pas que) : https://framagit.org/interchu   (Suzanna ou Omop Mapper : https://framagit.org/interchu/omop-omop-back )

> le GitHub EDS qu’il conviendra de consolider :  https://github.com/EDS-APHP 

 

Main activities

Principales activités (5 maximum) :

  • Analyser les besoins de l'AP-HP
  • Proposer des solutions logiciels
  • Développer des programmes en Python et possiblement web
  • Tester, modifier jusqu’à valider les outils développés
  • Animer une communauté d’utilisateurs médecins

Skills

Compétences techniques et niveau requis :

  • Python
  • Git
  • Numpy, Scipy, Scikit-Learn, Matplotlib, Pandas
  • SQL

Langues : Français et Anglais courant

Benefits package

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Remuneration

Rémunération selon expérience