2020-02773 - Doctorant F/H [ZENITH] thèse en deep learning & apprentissage statistique appliquée à la conservation de la biodiversité

Type de contrat : CDD

Contrat renouvelable : Oui

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Doctorant

A propos du centre ou de la direction fonctionnelle

« Le centre Inria Sophia Antipolis - Méditerranée compte 34 équipes de recherche, ainsi que 8 services d’appui à la recherche. Le personnel du centre (500 personnes environ dont 320 salariés Inria) est composé de scientifiques de différentes nationalités (250 personnes étrangères sur 50 nationalités), d’ingénieurs, de techniciens et d’administratifs. 1/3 du personnel est fonctionnaire, les autres sont contractuels. La majorité des équipes de recherche du centre est localisée à Sophia Antipolis et Nice dans les Alpes-Maritimes. Quatre équipes sont implantées à Montpellier et deux équipes sont hébergées l'une à Bologne et l'autre à Athènes. Inria est membre fondateur d’Université Côte d'Azur et partenaire de l’I-site MUSE porté par l’Université de Montpellier. »

Contexte et atouts du poste

Ce travail thèse se déroulera dans le cadre d’une action exploratoire financée par l’Inria avec la collaboration de l’université de Montpellier (laboratoires LIRMM et IMAG), de l’université de Grenoble Rhône-Alpes (laboratoire LECA) et du CIRAD (laboratoire AMAP). La thèse sera co-dirigée par Alexis Joly (Directeur de recherche Inria, HDR en informatique, co-responsable de la plateforme Pl@ntNet) et François Munoz (Pr. À l'Univ. De Grenoble, HDR en écologie). Des échanges scientifiques réguliers seront organisés dans le cadre de l’action exploratoire avec Joseph Salmon (Pr. à l'Univ. Montpellier, HDR en informatique), Maximilien Servajean (Maitre de conférence à l’UMPV, chercheur en informatique) et Pierre Bonnet (CIRAD, botaniste co-responsable de la plateforme Pl@ntNet)

Mission confiée

La thématique applicative sera la prédiction du statut de conservation des espèces qui est un challenge majeur en écologie. A l’heure actuelle, la détermination des ces statuts se fait espèce par espèce, un processus qui nécessite une forte expertise et beaucoup de temps. Notre hypothèse est qu'il pourrait être possible de déduire conjointement l'état de conservation d’un très grand nombres d'espèces en combinant apprentissage profond, apprentissage statistique et modélisation écologique.  Les récentes  cyberinfrastructures et les nouvelles sources de données offrent en fait des possibilités de mobiliser et d'intégrer des quantités massives de données biologiques qui n'ont jamais été analysées conjointement. En particulier, les données d'occurrence des espèces peuvent être combinées avec divers rasters environnementaux et géographiques (bioclimatique, type de sol, télédétection) afin de dériver des modèles de distribution et d’évolution temporelle des espèces à l'échelle continentale et de permettre des projections en fonction de scénarios d'évolution du climat et de l'utilisation des sols. Des collections complémentaires de spécimens numérisés à grande échelle peuvent être combinées avec des données sur les caractéristiques des espèces et la phylogénie pour déduire la niche écologique des espèces pour lesquelles il existe très peu ou pas de données d'occurrence. Pour apprendre ces relations complexes et faire face à l'hétérogénéité des données, nous nous appuierons principalement sur des modèles d'apprentissage profond et des méthodologies associées telles que transfer learning, domain adaptation, multi-task learning, meta-learning, régularisation adversariale. Des problèmes connus comme difficiles devront êtres abordés dans la thèse, en particulier le biais des données, le fort déséquilibre des classes et le manque de données d’absence. 

Principales activités

Bibliographie, questionnement, définition de nouvelles méthodes, développement logiciel en python, expérimentations d'apprentissage profond à grande échelle, publication des résultats dans des revues scientifiques internationales, participation à des conférences intenationales, rédaction de la thèse.

Compétences

  • une formation solide en apprentissage statistique est indispensable
  • une connaissance du langage python est nécessaire
  • des connaissances préalables en écologie seraient un plus
  • des connaissances préalables en apprentissage profond seraient un plus

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Rémunération

Durée: 36 mois
Localisation: Sophia Antipolis, France
Rémunération: 1982€ brut mensuel (année 1 & 2) et 2085€ brut mensuel (année 3)