2020-03161 - Ingénieur Full Stack (H/F)
The offer description below is in French

Contract type : Civil Servants Mobility (EU) or Fixed-term contract

Level of qualifications required : Graduate degree or equivalent

Fonction : Support functions

Level of experience : From 5 to 12 years

Context

Depuis juillet 2018, un ambitieux plan national pour la science ouverte est mis en oeuvre. Il vise notamment à faciliter un accès sans entrave à l’ensemble des publications scientifiques, à développer la structuration, le partage et la circulation des données de la recherche, à ouvrir les codes, … Pour suivre la mise en oeuvre de cette politique publique prioritaire, la communauté de la science ouverte fédérée par le Comité pour la science ouverte a souhaité développer des outils de suivi adaptés comme le baromètre de la science ouverte (https://ministeresuprecherche.github.io/bso/). Publié pour la première fois en décembre 2019, il permet d’estimer la part des publications d’affiliation française librement accessibles à un moment donné. Ce monitoring permet par exemple d’ajuster au plus près des situations spécifiques des différents champs disciplinaires les actions mise en oeuvre dans le cadre du plan national.

En 2020, confronté à la crise sanitaire COVID-19, le Comité pour la science ouverte a souhaité la production d’un Baromètre santé de la science ouverte (BSSO), un outil de monitoring de l’ouverture des publications scientifiques et plus généralement de la transparence des recherches dans le domaine de la santé.

Le projet de Baromètre santé de la science ouverte vise à proposer un service de monitoring de l’ouverture et de la transparence de la recherche en santé via une analyse des publications et de leur degré d’ouverture d’une part et d'objets plus spécifiques au domaine de la santé comme les essais cliniques et les études observationnelles d’autre part. Il s’agira de produire d’ici à la fin de 2021 les données ainsi que leur infrastructure de production mais également une interface web attractive et conviviale permettant de les explorer dont les principes seront repris ensuite dans le baromètre de la science ouverte dont la couverte générale dépasse les seules thématiques liées à la santé.

Ce projet s’appuie en partie sur les principes, les données et le stack technologique du Baromètre de la science ouverte (https://github.com/MinistereSupRecherche/bso) mais également de scanR, moteur de la recherche et de l’innovation (https://scanr.enseignementsup-recherche.gouv.fr/). Pour s’alimenter en données,  le projet procédera donc par moissonnage de flux de données (publications, essais cliniques et études observationnelles), intégration au sein du datalake commun aux données sur la recherche au terme d’un processus de transformation et d’enrichissement (alignement vers des référentiels de personnes ou de structures, enrichissements sémantiques, …), consommation des données par une interface de Front office.

Le stack technologique est centrée autour des technologies classiques de développement web (HTML/CSS/JS/REACT) en front end, de Python pour le back end (Flask pour les API), des algorithmes de traitement (Word embeddings, Transformers en NLP) et de MongoDB pour les données et enfin du moteur de recherche Elasticsearch. Le déploiement des services utilise Docker et Kubernetes sur le cloud OVH.

Au niveau opérationnel, le projet mobilisera, outre l’ingénieur Full Stack, un datascientist https://github.com/MinistereSupRecherche/bso). Une équipe de conception et de développement externe prendra en charge le design et le développement front end. Enfin, l’équipe pourra mobiliser des scientifiques experts des domaines de santé (recherche médicale, essais cliniques et des études observationnelles) et de la science ouverte.

 

Assignment

La mission portera essentiellement sur le back-end et sur la construction d’une nouvelle source ouverte décrivant les essais cliniques et les études observationnelles. A partir de différentes sources exposées de différentes manières, il s’agira de constituer une information riche, fiable et mise à jour en permanence sur les essais cliniques et les études observationnelles. Il faudra donc modéliser ces objets (essais cliniques et études observationnelles), les implémenter en base et concevoir et développer la gestion de leurs flux entrants et sortants (API, processus de qualification et de nettoyage, leur d’enrichissement).

En fonction de la charge constatée, l’ingénieur.e full stack étendra sa contribution à d’autres domaines couverts par le baromètre santé de la science ouverte.

 

 

Skills

  • Savoir développer dans un langage back-end (de préférence Python),
  • Etre familier avec les bibliothèques de manipulation de données (Pandas, ..) et frameworks API (Flask ou autre),
  • Avoir des connaissances en gestion et mise en place des bases de données SQL (Postgres ou autre) et NoSQL (MongoDB ou autre),
  • Avoir des connaissances sur Elasticsearch,
  • Avoir un intérêt pour les technologies d’IA en NLP,
  • Savoir comprendre des implémentations de service réseaux (HTTP, REST, etc..),
  • Connaitre des pratiques de mise en production des services (Docker, Kubernetes etc)
  • Etre familier avec les bonnes pratiques de programmation (documentation, test unitaire et d'intégration, contrôle des sources (Git),
  • Etre savoir travailler en autonomie,
  • Savoir gérer les priorités,
  • Etre curieux.
 

 

Benefits package

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale