Doctorant F/H Jeux répétés et apprentissage séquentiel : vers des algorithmes équitables et performants

Type de contrat : CDD

Niveau de diplôme exigé : Bac + 5 ou équivalent

Autre diplôme apprécié : Master en mathématiques/mathématiques appliquées

Fonction : Doctorant

A propos du centre ou de la direction fonctionnelle

Le centre de recherche Inria de Saclay a été créé en 2008. Sa dynamique s’inscrit dans le développement du plateau de Saclay, en partenariat étroit d’une part avec le pôle de l’Université Paris-Saclay et d’autre part avec le pôle de l’Institut Polytechnique de Paris . Afin de construire une politique de site ambitieuse, le centre Inria de Saclay a signé en 2021 des accords stratégiques avec ces deux partenaires territoriaux privilégiés.

Le centre compte 40 équipes-projets , dont 32 sont communes avec l’Université Paris-Saclay ou l’Institut Polytechnique de Paris. Son action mobilise plus de 600 personnes, scientifiques et personnels d’appui à la recherche et à l’innovation, issues de 54 nationalités.

Le centre Inria Saclay - Île-de-France est un acteur essentiel de la recherche en sciences du numérique sur le plateau de Saclay. Il porte les valeurs et les projets qui font l’originalité d’Inria dans le paysage de la recherche : l’excellence scientifique, le transfert technologique, les partenariats pluridisciplinaires avec des établissements aux compétences complémentaires aux nôtres, afin de maximiser l’impact scientifique, économique et sociétal d’Inria.

Contexte et atouts du poste

La thèse se place à l'intersection des jeux répétés et de l'apprentissage statistique, et ce dans le but de développer des algorithmes robustes et équitables.


Beaucoup d'algorithmes d'apprentissage fonctionnent séquentiellement (robotique, agent conversationnel, applications avec interactions humaines etc). La théorie des jeux fournit un cadre d'analyse des interactions, duquel peuvent être tirés des algorithmes simples et robustes à appliquer, notamment dans un cadre multi-agents. Il est alors possible de fournir des algorithmes avec des garanties théoriques qui permettent de s'assurer du bon fonctionnement des algorithmes implémentés en pratique.

La théorie des jeux répétés date de la moitié du 20e siècle, elle est particulièrement adéquate pour l'étude de l'apprentissage séquentiel. Ainsi, les jeux répétés asynchrone en sont une extension directe; de même pour la théorie de l'approchabilité, et les algorithmes de matching. Les outils qu'elle a développés seront mis au contact d'autres parties des mathématiques, pour répondre à de nouvelles questions. En particulier, nous nous intéresserons à développer des algorithmes équitables et/ou robustes aux manipulations stratégiques pour différentes applications, incluant les réseaux de télécommunication cognitifs, les algorithmes d'appariement et les algorithmes de prédiction.

Mission confiée

Nous considèrerons trois problèmes largement indépendants.
Axe 1: on cherchera ainsi à développer la théorie des jeux en temps continus asynchronisés, de manière à obtenir des algorithmes simples et robustes, directement applicables au problème de bandits à plusieurs joueurs. Motivé par les réseaux de télécommunications, le problème de bandits à plusieurs joueurs s'est beaucoup développé récemment. Cependant, les différentes solutions proposées prennent difficilement en compte l'asynchronicité des dispositifs utilisés en pratique. A travers une nouvelle formulation mathématique d'asynchronicité, nous souhaitons développer des algorithmes simples et robustes pour ce problème.

Axe 2: la théorie des jeux répétés est également un cadre d’analyse pertinent pour étendre la théorie de l’apprentissage équitable. D’une part, nous nous intéresserons à la théorie de l’approchabilité de Blackwell afin de développer des algorithmes séquentiels de prédiction avec des garanties d'équitabilité. Les travaux récents de Chzhen, Giraud et Stoltz ont déjà permis d'avancer dans cette direction. Le but de cet axe serait d'étendre les résultats existants à des notions plus fortes d'équité, ce qui nécessite de revisiter la méthode d'approchabilité de Blackwell.

Axe 3: d’autre part, nous étudierons des algorithmes d'apprentissage séquentiels pour des problèmes d’appariement, et en particulier dans le contexte d'appariements équitables. L'apprentissage séquentiel d'appariement s'est fortement développé ces dernières années. Cependant, ces travaux récents ne se sont pas intéressés à la notion d'équité dans les appariements, qui est une notion pourtant importante et considérée dans la littérature économique (sans notion d'apprentissage). Le but de cet axe serait donc de lier ces deux pans de la littérature: l'apprentissage séquentiel sur des problèmes d'appariement et les appariements équitables.

Compétences

  • Théorie des jeux
  • Apprentissage séquentiel
  • Master en mathématiques/mathématiques appliquées

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle
  • Possibilité de télétravail et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle

Rémunération

2100€ brut / mois