2020-03153 - Ingénieur IA : knowledge graph and linked data
The offer description below is in French

Contract type : Fixed-term contract

Level of qualifications required : Graduate degree or equivalent

Fonction : Temporary scientific engineer

About the research centre or Inria department

Le centre Inria Sophia Antipolis - Méditerranée compte 34 équipes de recherche, ainsi que 7 services d’appui à la recherche. Le personnel du centre (500 personnes environ dont 320 salariés Inria) est composé de scientifiques de différentes nationalités (250 personnes étrangères sur 50 nationalités), d’ingénieurs, de techniciens et d’administratifs. 1/3 du personnel est fonctionnaire, les autres sont contractuels. La majorité des équipes de recherche du centre est localisée à Sophia Antipolis et Nice dans les Alpes-Maritimes. Quatre équipes sont implantées à Montpellier et deux équipes sont hébergées l'une à Bologne et l'autre à Athènes. Inria est membre fondateur d’Université Côte d'Azur et partenaire de l’I-site MUSE porté par l’Université de Montpellier.

Context

Dans le cadre d’un partenariat entre l’équipe de recherche Wimmics (https://team.inria.fr/wimmics/)  et la coopérative Mnémotix (https://www.mnemotix.com/) s’inscrivant dans le contexte du 3IA Côte d’Azur (https://3ia.univ-cotedazur.eu/), la mission consiste à poursuivre le développement de la bibliothèque sémantique open source CORESE (https://project.inria.fr/corese/) en vue de son industrialisation. Le poste sera exercé dans les locaux de INRIA Sophia Antipolis, au sein de l’équipe Wimmics. Quelques déplacements ponctuels pour rencontrer les partenaires peuvent être prévus.

Assignment

La plateforme sémantique CORESE consiste en une base de triplets (triple store) et une interface de requêtes implémentant les standards du Web Sémantique (RDF, RDFS, SPARQL) et proposant de nombreuses fonctionnalités innovantes, fruit de plusieurs années de recherches en IA symbolique et ingénierie des connaissances. 

Avec l’aide de son architecte et principal développeur, la personne recrutée reprendra le développement de cette bibliothèque open source afin de la porter aux standards actuels de l’industrie et de développer sa communauté. Elle sera également en étroite collaboration avec les ingénieur•e•s de l’équipe Wimmics qui exploitent CORESE dans divers projets de recherche. Enfin une collaboration rapprochée avec l’équipe de la coopérative Mnémotix, et en particulier le titulaire de la chaire 3IA “affiliate”, fournira un terrain plus directement ancré dans les problématiques de production.

Plus particulièrement, l’évolution du code sera pilotée par la levée des verrous technologiques identifiés et relevés par le consortium à l’origine de ce projet d’industrialisation. La liste suivante pose les grandes lignes des axes à développer sur les 2 premières années, et sera affinée au cours du projet:

  • Persistance et indexation de gros graphes de connaissances (knowledge graph) pour leur traitement dans des algorithmes d’IA (raisonnement, apprentissage)
  • Modèles de représentation, d’indexation et algorithmes de raisonnement passant à l’échelle pour le traitement intelligent de gros graphes de connaissances et de leurs ontologies.
  • Gestion de l’évolution et de temporalité de grands graphes de connaissances et de leurs ontologies pour l’efficacité et pour l’exploitation et l’analyse en IA de ces évolutions.
  • Méthode d’IA pour la génération (semi-)automatique de patrons et connecteurs d’import et d’export vers d’autres formats et sources classiques afin de supporter l’hétérogénéité des données en entrée des méthodes d’IA
  • Méthodes d’IA (apprentissage, raisonnement) pour la génération d’alignements et de règles et contraintes de validation et le nettoyage des données pour en assurer la qualité.

La mission comprend également un objectif d’augmentation du nombre de contributeurs et usagers de CORESE. Le code source est actuellement publié sur un dépôt Github, et une partie du temps de travail devra être dédiée à l’amélioration de la documentation, la gestion des tickets, et plus généralement l’animation de la communauté autour du projet CORESE (liste de diffusion, annonces de nouvelles versions, recueil des besoins et suggestions, etc.).

Main activities

Principales activités:

  • Analyser et tester le code actuel, et conduire des benchmarks
  • Conception et architecture des évolutions selon les grandes lignes précédentes
  • Développement et tests du code
  • Rédiger la documentation
  • Animer une communauté de contributeurs et usagers

Activités complémentaires:

  • Organiser des temps de formation ou de présentation à la communauté
  • Préparer des démonstrations
  • Diffuser les actualités du projet

Skills

Compétences techniques et niveau requis :

  • Java, niveau confirmé ou expert
  • Maîtrise des standards du web sémantique (RDF, OWL, SPARQL) 
  • Maîtrise des principaux types de bases de données
  • Bonnes notions sur les bases de graphes (RDF et/ou Property Graphs, etc.)

Langues :

  • Anglais 
  • Français

Compétences relationnelles :

  • Travail en équipe
  • Autonomie
  • Capacité de vulgarisation
  • Travail sur projet ouvert et open source

Compétences additionnelles appréciées :

  • Bonnes notions de l’architecture Web et de ses standards
  • Bonnes notions de logique formelle
  • Langages d’inférences
  • Passage à l’échelle et gros volumes de données

Benefits package

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale