Ingénieur développeur de la bibliothèque skrub

Type de contrat : CDD

Niveau de diplôme exigé : Thèse ou équivalent

Fonction : Personnel des fonctions support (IT)

Corps d'accueil : Ingénieur de Recherche (IR)

Niveau d'expérience souhaité : De 3 à 5 ans

Contexte et atouts du poste

Dans le cadre de la stratégie d’accélération IA et en particulier dans l’axe « développer des infrastructures numériques de pointe et stimuler les partenariats public-privé et accroître l'impact de la recherche en IA », Inria a proposé la mise en œuvre d’un projet d’accélération visant à soutenir la mise en place et le développement d’une plateforme souveraine ouverte et interopérable de librairies logicielles de l’IA pour les entreprises françaises, et son passage à l’échelle européenne.

Cette initiative est une des priorités d’Inria dans le cadre de l’élaboration de la stratégie d’accélération IA et dans l’objectif de contribuer à la souveraineté technologique française et à l’impact économique sur le tissu industriel français.

L’impact attendu de ces mesures sur l’industrie française est notamment de permettre à l’ensemble des entreprises françaises mais également aux acteurs publics et institutionnels d’accélérer leur transformation numérique à l’aide de l’IA, sans être dans une relation captive avec les acteurs dominants, de par la disponibilité d’un socle technologique générique et d’un ensemble de dispositifs de transfert associés.

Dans le cadre de cette ambition, la mise en œuvre de la mesure repose sur le développement et la diffusion d’une suite cohérente de plateformes de logiciels pour l’IA et les données reposant sur trois actions : L'action 1 se concentre sur l'interopérabilité des données, proposant une architecture basée sur les standards du Web. Inria apporte dans ce cadre Corese, une bibliothèque logicielle open source qui implémente et étend les standards du Web de données. L'action 2, le "Data Wrangling," aborde la préparation des données, visant à réduire le temps manuel nécessaire dans les projets de science des données. Cette action s’articule autour de skrub, une bibliothèque visant à accroître la productivité des phases amont de l’apprentissage statistique en intégrant des aspects de préparation, d’exploration, de visualisation et d’exploitation des données. L'action 3 se focalise sur l'apprentissage et l'exécution de modèles, en optimisant la bibliothèque Scikit-learn pour faciliter l'analyse des données. Ces actions partageront des outils, des standards et des concepts pour former un ensemble cohérent. Les outils seront développés de manière ouverte, permettant l'utilisation de modules spécifiques par des acteurs externes.

Ce projet, nommé P16, est en cours d’une structuration qui aura deux volets principaux :

  • Un volet visant à l’industrialisation des logiciels vis-à-vis de l’écosystème industriel et économique, à leur diffusion dans ce monde et à assurer, par le développement de produits et de services, la pérennité économique du projet après la phase initiale subventionnée.
  • Un volet dirigé vers la communauté académique en IA visant d’une part à faciliter et accélérer l’industrialisation de résultats de recherches vers la partie industrielle et d’autre part à diffuser largement les réalisations de P16 vers le monde académique et en particulier vers le monde de la formation en IA.

Le poste proposé est celui d’Ingénieur développeur de la bibliothèque skrub dans le cadre du volet académique.

 

Mission confiée

  1. Développement de la bibliothèque skrub
  2. Planification et phasage des développements
  3. Collaboration avec les équipes connexes

Principales activités

  1. Développement de la bibliothèque skrub :
    • Concevoir, développer et maintenir des fonctionnalités de la bibliothèque skrub en utilisant des pratiques de développement logiciel robustes.
    • Participer à l’expérimentation d’algorithmes de pointe en apprentissage statistique sur des données non structurées.
    • Optimiser les performances et la qualité du code en explorant différentes implémentations.
    • Documenter le code et les APIs de la bibliothèque.
  2. Planification et phasage des développements :
    • Participer à la planification des tâches, organisation de sprints etc.
    • Définir des jalons de livraison et s’assurer de leur respect.
  3. Collaboration avec les équipes connexes :
    • Collaborer avec d'autres équipes techniques au sein du projet P16 pour assurer l'intégration harmonieuse de la bibliothèque skrub avec d'autres composants logiciels.
    • Participer à des réunions de coordination et de planification avec les équipes connexes pour aligner les objectifs et les efforts de développement.

Compétences

  • Solide expérience en Python, avec une excellente connaissance des bibliothèques telles que scikit-learn, pandas, numpy, matplotlib et scipy.
  • Compétences avancées en manipulation de données et en analyse statistique, avec une compréhension approfondie des méthodes d'apprentissage.
  • Capacité démontrée à travailler sur des projets de recherche et de développement logiciel de manière collaborative.
  • Connaissances solides en pratiques d’ingénierie logicielle, y compris le contrôle de version et les tests.
  • Excellentes compétences en communication, permettant une collaboration efficace avec les équipes internes et externes.

Formation et expérience :

  • Thèse en informatique, mathématiques appliquées, méthodes numériques, apprentissage statistique ou domaine connexe.
  • Expérience pertinente dans des projets similaires, de préférence dans le contexte de la recherche en intelligence artificielle et données.

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale