Doctorant F/H Diffusion pour l'apprentissage de politiques de manipulation en robotique
Type de contrat : CDD
Niveau de diplôme exigé : Bac + 5 ou équivalent
Fonction : Doctorant
Contexte et atouts du poste
Dans le cadre d'un parternariat entre Inria et le groupe La Poste, notre équipe cherche à tirer parti des nouvelles techniques d'intelligence artificielle générative pour permettre à un robot de saisir et manipuler des sacs de courrier, de taille et de poids variable. Cet objectif est complexe car les sacs combinent de nombreux défis : ils sont souples, n'ont pas de forme définie, et sont le plus souvent organisés en tas (et non pas empilés comme des boites).
Nous souhaitons nous appuyer sur les techniques de diffusion [1] qui permettent d'apprendre des politiques conditionnées par des images à partir de démonstrations. Ces techniques s'appuient sur des idées similaires à celles utilisées pour générer des images (Dall-E, MidJourney, etc.) mais pour générer des trajectoires.
L'objectif de cette thèse sera de (1) évaluer les techniques actuelles dans ce contexte et (2) proposer des améliorations des techniques de diffusion pour leur permettre d'être plus performante (apprentissage avec moins d'exemples, meilleure généralisation, prise en compte des contraintes de la tâche et du robot, etc.).
[1] Chi C, Feng S, Du Y, Xu Z, Cousineau E, Burchfiel B, Song S. Diffusion policy: Visuomotor policy learning via action diffusion. arXiv preprint arXiv:2303.04137. 2023. https://arxiv.org/abs/2303.04137 https://www.youtube.com/watch?v=w-CGSQAO5-Q
Mission confiée
Cette thèse sera principalement dirigée par Jean-Baptiste Mouret et Serena Ivaldi. Elle sera centrée sur des contributions en machine learning applicable à la robotique, qui seront principalement publiées dans les grandes conférences de robotique (ICRA/IROS/CoRL/RSS) et de machine learning (NeurIPS, ICLR, ICML, ...).
Les expériences sur robot réel auront lieu avec le robot Tiago++ (PAL Robotics), avec le support des ingénieurs de recherche de l'équipe.
La thèse sera coordonnée avec les autres travaux de l'équipe, qui exploitent des techniques similaires pour des applications différentes.
Principales activités
Activités principales :
- lire et comprendre les articles scientifiques pertinents
- proposer des nouvelles techniques et des nouveaux algorithmes
- implémenter les algorithmes
- évaluer les algorithmes sur des jeux de données expérimentaux
- écrire des articles scientifiques sur les résultats
- présenter le travail dans des conférences scientifiques
Compétences
Compétences techniques et niveau requis :
- Très bon niveau en machine learning
- Très bon niveau en python (et notamment pytorch / numpy / etc.)
- Connaissance en robotique appréciées
Langues :
- la langue principale de l'équipe est l'anglais et toutes les communications (écrites et orales) sont en anglais.
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
- Sécurité sociale
Rémunération
2100 € brut/mois la 1ère année
Informations générales
- Thème/Domaine : Robotique et environnements intelligents
- Ville : Villers lès Nancy
- Centre Inria : Centre Inria de l'Université de Lorraine
- Date de prise de fonction souhaitée : 2024-10-01
- Durée de contrat : 3 ans
- Date limite pour postuler : 2024-06-28
Attention: Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti.
Consignes pour postuler
Sécurité défense :
Ce poste est susceptible d’être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST). L’autorisation d’accès à une zone est délivrée par le chef d’établissement, après avis ministériel favorable, tel que défini dans l’arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l’annulation du recrutement.
Politique de recrutement :
Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap.
Contacts
- Équipe Inria : LARSEN
-
Directeur de thèse :
Mouret Jean-baptiste / jean-baptiste.mouret@inria.fr
L'essentiel pour réussir
Le/la candidat(e) idéal(e) a un master en machine learning ou en robotique. Il/Elle est passionné(e) par les avancées du machine learning et veut appronfondir ce sujet. L'expérience en robotique est un plus mais pas nécessaire.
A propos d'Inria
Inria est l’institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l’interface d’autres disciplines. L’institut fait appel à de nombreux talents dans plus d’une quarantaine de métiers différents. 900 personnels d’appui à la recherche et à l’innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'efforce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.