Doctorant F/H Diffusion pour l'apprentissage de politiques de manipulation en robotique

Type de contrat : CDD

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Doctorant

Contexte et atouts du poste

Dans le cadre d'un parternariat entre Inria et le groupe La Poste, notre équipe cherche à tirer parti des nouvelles techniques d'intelligence artificielle générative pour permettre à un robot de saisir et manipuler des sacs de courrier, de taille et de poids variable. Cet objectif est complexe car les sacs combinent de nombreux défis : ils sont souples, n'ont pas de forme définie, et sont le plus souvent organisés en tas (et non pas empilés comme des boites).

Nous souhaitons nous appuyer sur les techniques de diffusion [1] qui permettent d'apprendre des politiques conditionnées par des images à partir de démonstrations. Ces techniques s'appuient sur des idées similaires à celles utilisées pour générer des images (Dall-E, MidJourney, etc.) mais pour générer des trajectoires.

L'objectif de cette thèse sera de (1) évaluer les techniques actuelles dans ce contexte et (2) proposer des améliorations des techniques de diffusion pour leur permettre d'être plus performante (apprentissage avec moins d'exemples, meilleure généralisation, prise en compte des contraintes de la tâche et du robot, etc.).

[1] Chi C, Feng S, Du Y, Xu Z, Cousineau E, Burchfiel B, Song S. Diffusion policy: Visuomotor policy learning via action diffusion. arXiv preprint arXiv:2303.04137. 2023. https://arxiv.org/abs/2303.04137 https://www.youtube.com/watch?v=w-CGSQAO5-Q

Mission confiée

Cette thèse sera principalement dirigée par Jean-Baptiste Mouret et Serena Ivaldi. Elle sera centrée sur des contributions en machine learning applicable à la robotique, qui seront principalement publiées dans les grandes conférences de robotique (ICRA/IROS/CoRL/RSS) et de machine learning (NeurIPS, ICLR, ICML, ...).

Les expériences sur robot réel auront lieu avec le robot Tiago++ (PAL Robotics), avec le support des ingénieurs de recherche de l'équipe.

La thèse sera coordonnée avec les autres travaux de l'équipe, qui exploitent des techniques similaires pour des applications différentes.

Principales activités

Activités principales :

  • lire et comprendre les articles scientifiques pertinents
  • proposer des nouvelles techniques et des nouveaux algorithmes
  • implémenter les algorithmes 
  • évaluer les algorithmes sur des jeux de données expérimentaux
  • écrire des articles scientifiques sur les résultats
  • présenter le travail dans des conférences scientifiques

Compétences

Compétences techniques et niveau requis :

  • Très bon niveau en machine learning
  • Très bon niveau en python (et notamment pytorch / numpy / etc.)
  • Connaissance en robotique appréciées

Langues :

  • la langue principale de l'équipe est l'anglais et toutes les communications (écrites et orales) sont en anglais.

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Rémunération

2100 € brut/mois la 1ère année