Doctorant F/H Modélisation statistique et apprentissage automatique pour le suivi de la biodiversité végétale

Type de contrat : CDD

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Doctorant

A propos du centre ou de la direction fonctionnelle

L’Inria est l’Institut national de recherche en sciences du numérique, dont le centre Inria d’Université Côte d’Azur fait partie. Avec une forte expertise en informatique et mathématiques appliquées, les projets de recherche du centre Inria d’Université Côte d’Azur touchent toutes les dimensions des sciences et technologies du numérique, et génèrent de l’innovation. Implanté principalement à Sophia Antipolis, mais également à Nice ou Montpellier, il regroupe 47 équipes de recherche et neuf services d’appui. Il est présent dans les domaines de l’intelligence artificielle, la science des données, la sécurité des systèmes informatiques, la robotique, l’ingénierie de réseaux, la prévention des risques naturels, la transition écologique, la biologie numérique, les neurosciences computationnelles, les données de santé… Le Centre Inria d’Université Côte d’Azur est un acteur majeur en termes d'excellence scientifique par les résultats obtenus et les collaborations tant au niveau européen qu'international.

Contexte et atouts du poste

Le projet européen BEAGLE (“Biodiversity methods for advanced monitoring at large scales”) vise à transformer le suivi de la biodiversité à grande échelle grâce à l’intégration de données issues de capteurs, de plateformes participatives, de télédétection et d’ADN environnemental.

Dans ce cadre, Inria et Pl@ntNet recrutent un·e doctorant·e pour développer de nouvelles méthodes de modélisation statistique et d’apprentissage automatique appliquées au suivi de la biodiversité végétale et des habitats.

La thèse sera réalisée au sein d’Inria à Montpellier, en interaction étroite avec Pl@ntNet, plateforme de référence pour l’analyse automatisée de données de biodiversité végétale et la science participative. Le ou la doctorant·e évoluera dans un environnement interdisciplinaire associant sciences des données, écologie, télédétection et bioinformatique, dans le cadre d’un consortium européen rassemblant des acteurs majeurs du monitoring de la biodiversité.

Les travaux s’appuieront sur des jeux de données massifs combinant observations participatives, données environnementales, imagerie et données géospatiales.

Mission confiée

L’objectif de la thèse est de développer des méthodes robustes de modélisation statistique et d’apprentissage profond pour l’analyse de données de biodiversité à grande échelle.

Les travaux porteront notamment sur :

  • la modélisation de la distribution des espèces végétales et des habitats ;
  • l’intégration de données multimodales et multi-sources ;
  • la prise en compte des biais liés aux données opportunistes et participatives ;
  • l’estimation et la propagation des incertitudes dans les chaînes de traitement ;
  • la production d’indicateurs spatiaux et temporels de biodiversité adaptés aux besoins des politiques publiques environnementales.

Une attention particulière sera portée à l’évaluation de la qualité et de la confiance des prédictions, enjeu central du projet.

Principales activités

 

  • Développer des méthodes d’apprentissage profond et d’apprentissage statistique pour l’analyse de données écologiques multimodales ;
  • Concevoir des modèles probabilistes et spatio-temporels appliqués au suivi de la biodiversité ;
  • Intégrer des données hétérogènes à grande échelle (observations participatives, données environnementales, imagerie, télédétection, etc.) ;
  • Développer des approches de calibration, d’estimation de confiance et de quantification d’incertitude ;
  • Évaluer les performances des modèles et analyser leur robustesse ;
  • Valoriser les travaux sous forme de publications scientifiques et de contributions open source ;
  • Participer aux échanges scientifiques avec les partenaires du consortium européen.

 

 

Compétences

 

  • Solides bases en apprentissage automatique, statistiques et science des données ;
  • Bon niveau en programmation scientifique, notamment en Python ;
  • Connaissances en écologie, biodiversité ou modélisation écologique appréciées ;
  • Connaissances en apprentissage profond et analyse de données multimodales ;
  • Connaissances en modélisation probabiliste, géomatique ou traitement de données spatiales appréciées ;
  • Sensibilité aux problématiques de qualité des données, biais d’échantillonnage et estimation d’incertitude ;

 

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Rémunération

Rémunération brute mensuelle : 2300€