2020-02996 - [ZENITH] Expert Pytorch au sein de l’équipe Pl@ntNet

Type de contrat : CDD

Contrat renouvelable : Oui

Niveau de diplôme exigé : Bac + 5 ou équivalent

Autre diplôme apprécié : Jeune diplomé

Fonction : Ingénieur scientifique contractuel

Niveau d'expérience souhaité : Jusqu'à 3 ans

A propos du centre ou de la direction fonctionnelle

Le centre Inria Sophia Antipolis - Méditerranée compte 34 équipes de recherche, ainsi que 8 services d’appui à la recherche. Le personnel du centre (500 personnes environ dont 320 salariés Inria) est composé de scientifiques de différentes nationalités (250 personnes étrangères sur 50 nationalités), d’ingénieurs, de techniciens et d’administratifs. 1/3 du personnel est fonctionnaire, les autres sont contractuels. La majorité des équipes de recherche du centre sont localisées à Sophia Antipolis et Nice dans les Alpes-Maritimes. Quatre équipes sont implantées à Montpellier et deux équipes sont hébergés l'une à Bologne et l'autre à Athènes. Inria est membre fondateur d’Université Côte d'Azur et partenaire de l’I-site MUSE porté par l’Université de Montpellier.

Contexte et atouts du poste

La personne recrutée travaillera au sein de l’équipe de recherche et développement de la plateforme Pl@ntNet, constituée d’ingénieurs, de chercheurs en informatique et de botanistes travaillant dans deux laboratoires: le laboratoire de recherche en informatique de Montpellier (LIRMM, équipe Inria ZENITH) et le laboratoire mixte de recherche AMAP. L’équipe Pl@ntNet est pionnière au niveau mondial dans l’application des technologies de l’IA appliquée à la biodiversité.

Le poste se déroulera en particulier dans le cadre d'une action exploratoire de l'Inria dont l'objectif est la prédiction du statut de conservation des espèces. Actuellement, cela se fait espèce par espèce via un processus manuel qui exige une forte expertise et prend beaucoup de temps. L'objectif de l'action exploratoire est d'inférer le statut de conservation d'un grand nombre espèces conjointement en combinant apprentissage profond, apprentissage statistique et modélisation écologique. L'action exploratoire sera menée par une équipe constituée d'un doctorant financé par le projet, de chercheurs permanents de l'Inria, du LIRMM, de l'IMAG et d'AMAP (Alexis Joly, Joseph Salmon, Maximilien Servajean, Pierre Bonnet) et de l'ingénieur visé par ce recrutement. 

Mission confiée

La mission sera principalement le développement d'un framework Pytorch facilitant l'expérimentation à grande échelle de modèles d'apprentissage profond dans le contexte de l'action exploratoire décrite ci-dessus. Nous devrons mobiliser de très grands ensembles de données à partir desquels il faudra calculer des modèles coûteux pour atteindre le grain nécessaire des modèles de distribution. De tels ensembles de données ne sont pas toujours facilement disponibles et résultent souvent de différents protocoles de compilation de données, y compris de plusieurs niveaux d'organisation biologique, avec des niveaux d'exhaustivité variables. Le traitement et l'analyse de ces données volumineuses et disparates nécessitera de mener les expériences sur de grandes infrastructures de calcul en particulier le supercalculateur Jean Zay du Genci. 

Principales activités

Refonte du framework Pytorch existant: nettoyage du code, amélioration de la modularité, tests unitaires, intégration continue,  documentation automatisée (e.g. sphinx) + doc utilisateurs, (ii) choix du mode de diffusion (choix de licence, dépôt APP)

Développement de nouveaux data loaders en fonction des besoins du d'action exploratoire (rasters, occurrences, phylogeny, interfaçage web service: TRY, EoL, GBIF, ToL, UICN)

Développement et expérimentation d'une mode d'apprentissage multi-noeuds (+expérimentation sur supercalculateur Jean-Zay)

Extension du module d’apprentissage à des modèles autres que feedforward (en particulier siamese networks, adversarial networks, metric learning), à de nouvelles métriques, à de nouvelles fonctionnalités de visualisation

Amélioration de la reproductibilité des expérimentations (log des seeds, log de la version du code, hash des données, DOI, etc.)

Dissémination: démonstrateur web, présentation dans des conférences scientifiques (démonstrateurs, papiers, etc.), rédaction d’articles

Compétences

  • Compétences techniques et niveau requis :
    • Très bonne connaissance de Pytorch
    • Expérience solide de développement en Python 
    • Connaissances solides en machine learning et deep learning
  • Langues : Français / Anglais
  • Compétences relationnelles : Autonomie, curiosité intellectuelle, aptitude au travail collaboratif et interdisciplinaire.

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Rémunération

A partir de 2562 euros brut mensuel (selon diplome et expérience)