2018-00808 - Offre Post-doctorant : Analyse PAC-bayésienne des réseaux de neurones artificiels (H/F)

Type de contrat : CDD de la fonction publique

Niveau de diplôme exigé : Thèse ou équivalent

Fonction : Post-Doctorant

A propos du centre ou de la direction fonctionnelle

A propos du centre ou de la direction fonctionnelle

Le centre de recherche Inria Lille – Nord Europe, créé en 2008, compte 360 personnes dont 305 scientifiques répartis dans 16 équipes de recherche. Reconnu pour son implication forte dans le développement socio-économique sur le territoire du Nord – Pas-de-Calais, le centre de recherche Inria Lille – Nord Europe poursuit une démarche de proximité avec les grandes entreprises et les PME. En favorisant ainsi les synergies entre chercheurs et industriels, Inria participe au transfert de compétences et d’expertises dans les technologies numériques et donne accès aux meilleures recherches européennes et internationales au bénéfice de l’innovation et des entreprises notamment en région.

Contexte et atouts du poste

L'équipe MODAL est active à la fois dans les communautés de la statistique et de l'apprentissage automatique. L'un des principaux sujets de recherche est formuler des justifications théoriques aux procédures d'apprentissage. A cette fin, une partie de l'équipe (réunie autour des chercheurs Pascal Germain et Benjamin Guedj) est spécialisée dans la théorie PAC-bayésienne, qui permet d'exprimer des garanties statistiques sur la qualité des algorithmes d'apprentissage. Ces garanties sont exprimés comme des bornes supérieures probabilistes de la perte de généralisation, connues sous le terme «bornes de généralisation». Ces bornes possèdent deux caractéristiques attrayantes: (i) elles sont calculables à partir de la perte d'entraînement, c'est-à-dire sans s'appuyer sur un ensemble de test ; (ii) on peut concevoir des algorithmes efficaces pour les optimiser.

Notez que la date de début de ce post-doctorat de 18 mois peut être reportée au début de l'année 2019 en fonction de la disponibilité des candidats.

Mission confiée

La personne recrutée se joindra à un récent projet de collaboration initié par deux chercheurs de l'équipe MODAL (Pascal Germain et Benjamin Guedj) avec trois collègues du Laboratoire Hubert Curien à l'Université Jean Monnet de Saint-Étienne (Emilie MorvantAmaury Habrard et Rémi Emonet). L'objectif principal est de contribuer à la compréhension théorique des succès de l'apprentissage de représentation - et en particulier des réseaux de neurones profonds - à l'aide de la théorie de l'apprentissage statistique PAC-bayésienne. Entre autres, la recherche menée impliquera de dériver des bornes de généralisation pour les réseaux de neurones, de valider empiriquement la capacité de ces bornes d'agir en tant que critères de sélection du modèle (elles nous permettront idéalement de nous débarrasser de l'ensemble de validation) et potentiellement de proposer de nouvelles méthodologies d'apprentissage basées sur la théorie développée. Ainsi, la recherche menée couvrira à la fois les aspects théoriques et pratiques.

La personne recrutée travaillera avec les chercheurs, les étudiants et les collaborateurs de MODAL. Elle participera aussi à la rédaction des articles de recherche. Les frais de voyage pour la participation à des conférences et à des manifestations scientifiques connexes sont couverts dans les limites du barème en vigueur.

Pour une meilleure connaissance du sujet de recherche proposé :

Ces articles donnent un aperçu de la théorie PAC-bayésienne telle que pratiquée par Pascal Germain et ses collaborateurs:

Diverses approches PAC-bayésiennes sont présentées dans le matériel du dernier «workshop» de la conférence NIPS portant sur le sujet :

Finally, one can refer to these research papers that study neural networks with the help of the PAC-Bayesian theory:

 

Principales activités

Recherche scientifique :

  1. Contribuer à l'analyse statistique des réseaux de neurones artificiels.
  2. Mener des expériences empiriques pour évaluer les performances des algorithmes d'apprentissage et des critèeres de sélection de modèles obtenus de l'analyse théorique.
  3. Collaborer avec d'autres chercheurs, doctorants et stagiaires.
  4. Rédiger des rapports de recherches et soumettre des articles scientifiques.

Compétences

  • Apprentissage automatique et statistique
  • Préparation de documents scientifiques (la connaissance de LaTeX est essentielle)
  • Expérience pratique des réseaux de neurones artificiels (la connaissance de pyTorch et/ou Tensorflow est un atout appréciable)

Avantages sociaux

  • Restauration subventionnée
  • Transports publics remboursés partiellement

Rémunération

2653€ brut par mois