Ingénieur Python NLP pour une application de fact-checking
Type de contrat : CDD
Niveau de diplôme exigé : Bac + 5 ou équivalent
Fonction : Ingénieur scientifique contractuel
A propos du centre ou de la direction fonctionnelle
Le centre de recherche Inria de Saclay a été créé en 2008. Sa dynamique s’inscrit dans le développement du plateau de Saclay, en partenariat étroit d’une part avec le pôle de l’Université Paris-Saclay et d’autre part avec le pôle de l’Institut Polytechnique de Paris. Afin de construire une politique de site ambitieuse, le centre Inria de Saclay a signé en 2021 des accords stratégiques avec ces deux partenaires territoriaux privilégiés.
Le centre compte , dont 27 sont communes avec l’Université Paris-Saclay ou l’Institut Polytechnique de Paris. Son action mobilise plus de 600 personnes , scientifiques et personnels d’appui à la recherche et à l’innovation, issues de 54 nationalités.
Contexte et atouts du poste
Inria est une institution publique qui promeuve la contribution de la science à la société : il forme des scientifiques et produit des connaissances. Radio France, grande institution du service public, premier groupe radiophonique de France, est structuré autour de 4 missions : informer, éduquer, cultiver, divertir.
L’importance croissante de la désinformation et la nécessité de disposer rapidement de vérifications d’informations qui circulent sur les médias ont fait émerger un projet de collaboration autour de la détection automatique des infox.
Depuis 2022, nous développons StatCheck, un système de vérification des faits spécialisé dans les médias français. Nous avons développé StatCheck dans le cadre d'une collaboration entre des chercheurs en informatique et des journalistes de Radio France.
StatCheck se compose de 3 composants principaux :
1. Un pipeline pour l'exploration, le nettoyage et l'indexation de données statistiques de haute qualité, notamment de l'INSEE et d'Eurostat.
2. Un moteur de recherche sur les données récupérées.
3. Un pipeline pour détecter à partir du texte les affirmations et les entités statistiques dignes d'être vérifiées, affirmations qui peuvent ensuite être vérifiées à l'aide du moteur de recherche.
Plus d'informations sur StatCheck: https://team.inria.fr/cedar/projects/statcheck/
Mission confiée
L'ingénieur sera chargé de :
- améliorer notre moteur de recherche sur les données statistiques en ajoutant un chatbot qui pourrait traiter des requêtes plus complexes ;
- aider nos collaborateurs de RadioFrance sur les demandes liées à la base de code ;
- maintenir la base de code existante.
Principales activités
Principales activés (5 maximum) : maintenir la base de code existante; améliorer les modules existants ; implémenter de nouvelles fonctionnalités
Activités complémentaires (3 maximum) : aider à la publication d'un article de recherche si les résultats le permettent
Compétences
Compétences techniques et niveau requis : bonnes compétences en programmation
Langues : Français, Anglais
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail et aménagement du temps de travail
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
Rémunération
Selon expérience
Informations générales
- Thème/Domaine :
Représentation et traitement des données et des connaissances
Ingénierie logicielle (BAP E) - Ville : Palaiseau
- Centre Inria : Centre Inria de Saclay
- Date de prise de fonction souhaitée : 2025-02-01
- Durée de contrat : 12 mois
- Date limite pour postuler : 2025-02-01
Attention: Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti.
Consignes pour postuler
Sécurité défense :
Ce poste est susceptible d’être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST). L’autorisation d’accès à une zone est délivrée par le chef d’établissement, après avis ministériel favorable, tel que défini dans l’arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l’annulation du recrutement.
Politique de recrutement :
Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap.
Contacts
- Équipe Inria : CEDAR
-
Recruteur :
Balalau Oana-denisa / oana.balalau@inria.fr
L'essentiel pour réussir
Pour réaliser ce projet, nous recherchons de façon urgente un(e) ingénieur(e) avec une très bonne expertise en matière programmation en Python, développement collaboratif et multiversion (Git), et idéalement des connaissances en : technologies Web, intelligence artificielle (IA), en particulier traitement de langage naturel (NLP).
Les travaux se dérouleront dans l’équipe CEDAR (Inria et LIX, CNRS et Ecole Polytechnique). Il seront encadrés par Ioana Manolescu (DR Inria), responsable de l’équipe CEDAR, et par Oana Balalau (Starting Faculty Inria). Depuis 2013, l’équipe développe une expertise reconnue dans les techniques de gestion de contenus (données, texte etc.) pour le data journalisme et la vérification journalistique.
A propos d'Inria
Inria est l’institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l’interface d’autres disciplines. L’institut fait appel à de nombreux talents dans plus d’une quarantaine de métiers différents. 900 personnels d’appui à la recherche et à l’innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'efforce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.