Ingénieur Python NLP pour une application de fact-checking
Contract type : Fixed-term contract
Level of qualifications required : Graduate degree or equivalent
Fonction : Temporary scientific engineer
About the research centre or Inria department
Le centre de recherche Inria de Saclay a été créé en 2008. Sa dynamique s’inscrit dans le développement du plateau de Saclay, en partenariat étroit d’une part avec le pôle de l’Université Paris-Saclay et d’autre part avec le pôle de l’Institut Polytechnique de Paris. Afin de construire une politique de site ambitieuse, le centre Inria de Saclay a signé en 2021 des accords stratégiques avec ces deux partenaires territoriaux privilégiés.
Le centre compte , dont 27 sont communes avec l’Université Paris-Saclay ou l’Institut Polytechnique de Paris. Son action mobilise plus de 600 personnes , scientifiques et personnels d’appui à la recherche et à l’innovation, issues de 54 nationalités.
Context
Inria est une institution publique qui promeuve la contribution de la science à la société : il forme des scientifiques et produit des connaissances. Radio France, grande institution du service public, premier groupe radiophonique de France, est structuré autour de 4 missions : informer, éduquer, cultiver, divertir.
L’importance croissante de la désinformation et la nécessité de disposer rapidement de vérifications d’informations qui circulent sur les médias ont fait émerger un projet de collaboration autour de la détection automatique des infox.
Depuis 2022, nous développons StatCheck, un système de vérification des faits spécialisé dans les médias français. Nous avons développé StatCheck dans le cadre d'une collaboration entre des chercheurs en informatique et des journalistes de Radio France.
StatCheck se compose de 3 composants principaux :
1. Un pipeline pour l'exploration, le nettoyage et l'indexation de données statistiques de haute qualité, notamment de l'INSEE et d'Eurostat.
2. Un moteur de recherche sur les données récupérées.
3. Un pipeline pour détecter à partir du texte les affirmations et les entités statistiques dignes d'être vérifiées, affirmations qui peuvent ensuite être vérifiées à l'aide du moteur de recherche.
Plus d'informations sur StatCheck: https://team.inria.fr/cedar/projects/statcheck/
Assignment
L'ingénieur sera chargé de :
- améliorer notre moteur de recherche sur les données statistiques en ajoutant un chatbot qui pourrait traiter des requêtes plus complexes ;
- aider nos collaborateurs de RadioFrance sur les demandes liées à la base de code ;
- maintenir la base de code existante.
Main activities
Principales activés (5 maximum) : maintenir la base de code existante; améliorer les modules existants ; implémenter de nouvelles fonctionnalités
Activités complémentaires (3 maximum) : aider à la publication d'un article de recherche si les résultats le permettent
Skills
Compétences techniques et niveau requis : bonnes compétences en programmation
Langues : Français, Anglais
Benefits package
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail et aménagement du temps de travail
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
Remuneration
Selon expérience
General Information
- Theme/Domain :
Data and Knowledge Representation and Processing
Software engineering (BAP E) - Town/city : Palaiseau
- Inria Center : Centre Inria de Saclay
- Starting date : 2025-02-01
- Duration of contract : 12 months
- Deadline to apply : 2025-02-01
Warning : you must enter your e-mail address in order to save your application to Inria. Applications must be submitted online on the Inria website. Processing of applications sent from other channels is not guaranteed.
Instruction to apply
Defence Security :
This position is likely to be situated in a restricted area (ZRR), as defined in Decree No. 2011-1425 relating to the protection of national scientific and technical potential (PPST).Authorisation to enter an area is granted by the director of the unit, following a favourable Ministerial decision, as defined in the decree of 3 July 2012 relating to the PPST. An unfavourable Ministerial decision in respect of a position situated in a ZRR would result in the cancellation of the appointment.
Recruitment Policy :
As part of its diversity policy, all Inria positions are accessible to people with disabilities.
Contacts
- Inria Team : CEDAR
-
Recruiter :
Balalau Oana-denisa / oana.balalau@inria.fr
The keys to success
Pour réaliser ce projet, nous recherchons de façon urgente un(e) ingénieur(e) avec une très bonne expertise en matière programmation en Python, développement collaboratif et multiversion (Git), et idéalement des connaissances en : technologies Web, intelligence artificielle (IA), en particulier traitement de langage naturel (NLP).
Les travaux se dérouleront dans l’équipe CEDAR (Inria et LIX, CNRS et Ecole Polytechnique). Il seront encadrés par Ioana Manolescu (DR Inria), responsable de l’équipe CEDAR, et par Oana Balalau (Starting Faculty Inria). Depuis 2013, l’équipe développe une expertise reconnue dans les techniques de gestion de contenus (données, texte etc.) pour le data journalisme et la vérification journalistique.
About Inria
Inria is the French national research institute dedicated to digital science and technology. It employs 2,600 people. Its 200 agile project teams, generally run jointly with academic partners, include more than 3,500 scientists and engineers working to meet the challenges of digital technology, often at the interface with other disciplines. The Institute also employs numerous talents in over forty different professions. 900 research support staff contribute to the preparation and development of scientific and entrepreneurial projects that have a worldwide impact.