2018-00819 - Analyse intelligente de trajectoires dans des espaces de grande taille

Type de contrat : CDD de la fonction publique

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Doctorant

Contexte et atouts du poste

Dans le cadre d’un partenariat entre les équipes Mnemosyne et Flowers nous travaillons avec la société Ubisoft, pour étudier l'usage de l'apprentissage automatique dans le domaine du jeu video.

Contexte:
Un système intelligent doit pouvoir analyser l'état et la dynamique de son environnement
(incluant lui-même), afin de résoudre efficacement des problèmes. Cela implique parfois de
manipuler et d’apprendre des séquences d’états dans des espaces de très grande taille, ce
qui est un défi majeur pour les techniques d'Intelligence Artificielle et d'apprentissage
automatique actuelles.
Ceci est particulièrement vrai dans le domaine des jeux vidéo où les espaces de jeux sont
dotés d'environnements de plus en plus riches et où la diversité croissante des actions
potentielles des joueurs et des agents artificiels rend l'espace des possibles de plus en plus
large. L'exploration systématique de ces espaces étant le plus souvent impossible, un
premier défi est de proposer des heuristiques permettant de les explorer "intelligemment",
c'est à dire avec le meilleur ratio entre le temps passé et l'information récoltée. S'il devient
abordable en mode off-line, ce processus d'apprentissage permet de construire des
représentations, parfois appelées modèles du monde, qui peuvent être ensuite exploitées
pour proposer des réponses adaptées on-line.
Par ailleurs, une autre problématique actuelle est de fournir des explications et justifier ses
décisions, ce qui est important pour des systèmes interagissant avec des humains
utilisateurs ou concepteurs de l'environnement considéré.

Mission confiée

Projet :
Nous souhaitons développer de nouveaux algorithmes d’apprentissage ayant des aspects
non supervisés et semi-supervisés, permettant d’analyser des ensembles de trajectoires
dans des espaces de très grande taille. Le but est de comprendre à la fois comment ces
trajectoires se répartissent en différentes familles pour exploiter certaines contingences liant
les variables de ces espaces et comment elles visent à atteindre certaines régions de
l’espace pouvant correspondre à des buts.
Dans le domaine d’application visé, l’analyse de parties de jeu video, l’enjeu essentiel
consiste à être capable de mieux comprendre l’organisation générale des phases de jeu et
de ses buts, mais aussi, pour chaque joueur, de caractériser son profil et sa stratégie de jeu
afin de pouvoir personnaliser le contenu qui lui sera proposé online.
Nous proposons ici de réaliser de tels profilages de manière automatique, en associant des
méthodes de Machine Learning permettant de traiter des séries temporelles (en particulier
en utilisant des réseaux de neurones récurrents), et des modèles de systèmes
motivationnels en lien direct avec les neurosciences et la psychologie pour mieux analyser
les aspects semi-supervisés.
Disposant d'un corpus de parties d'un joueur (sous la forme de suites d'états dont les
niveaux de description seront à définir), nous étudierons comment ces techniques peuvent
permettre d'analyser ce corpus pour:
• comprendre les "règles du jeu" et pouvoir apprendre à prédire certaines actions
du joueur
• prédire, pour un joueur donné et en fonction de son historique, les zones de
l’environnement qu’il est susceptible d’explorer et les performances associées
• comprendre les évolutions du joueur (l'évolution de son apprentissage)
• proposer des typologies de profils de joueur permettant de générer des classes
plus fines que les profils classiquement considérés

Principales activités

Programme de travail :
- Etat de l’art de modèles de traitement de séquences (eg LSTM, ESN) et de modèles
de systèmes motivationnels pour l’exploration de grands espaces de données.
- Interaction avec le partenaire industriel, pour la mise en forme de différents corpus de
parties de plusieurs joueurs.
- Développement de modèles pour l’apprentissage et l’extraction de séquences
temporelles dans les parties, dans des espaces de grande taille.
- Développement de modèles pour l’apprentissage et l’analyse des évolutions des
apprentissages.
- Synthèse de ces travaux pour l’analyse des modes de comportements des joueurs.
Propositions de pistes d’adaptation de jeu exploitant ces connaissances.

Compétences

Compétences recherchées :
Une formation initiale en informatique, des compétences et des expériences préalables en
machine learning et en traitement de données sont fortement souhaitées. Un intérêt pour les
neurosciences et la modélisation bio-inspirée est un plus.

Avantages sociaux

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Sécurité sociale
  • Congés payés
  • Aménagement du temps de travail
  • Installations sportives