Ingénieur(e) en Traitement automatique de la parole : Assistance pilotage de projet et Extraction d’information linguistique pour les centres d’appels d’urgence

Type de contrat : CDD

Contrat renouvelable : Oui

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Ingénieur scientifique contractuel

Niveau d'expérience souhaité : De 3 à 5 ans

Contexte et atouts du poste

Ce poste concerne le groupe de recherche Parole&Audio d’Inria Défense&Sécurité. Il est composé d’une dizaine de personnes, réparties majoritairement sur les sites Inria de Paris et Grenoble. Ce groupe développe des recherches principalement en détection du locuteur, de la langue parlée et de deepfakes audio. Il s’intéresse également à la transcription de la parole ainsi qu’à l’extraction d’informations de plus haut niveau, comme les entités nommées.

La spécificité du groupe de recherche Parole&Audio est de s’intéresser à des problématiques relevant de besoins exprimés par différents services de l’état autour des questions de Défense et de Sécurité, et de placer les potentiels opérateurs au cœur des travaux qui sont menés, que cela soit dans le cadre de travaux de recherche appliquée ou plus fondamentaux.

Le poste proposé s’insère dans un projet financé dans le cadre de l’Agence Nationale de la Recherche (ANR), qui démarre début 2025. Le projet est dédié aux CTA (Centre de Traitement de l’Alerte) au sein des CODIS (Centre Opérationnel Départemental d’Incendie et de secours). Les CTAs sont des centres d’appel d’urgence chargés principalement de recevoir, authentifier et enregistrer les demandes de secours, de réorienter les demandes de secours au centre « 15 » si nécessaire et de répercuter les demandes de secours vers les Centres d’Incendie et de Secours (C.I.S) territorialement compétents pour assurer les premiers secours.

Ce projet vise à déterminer dans quelle mesure les technologies modernes de traitement automatique du langage peuvent aider à sécuriser les opérateurs des centres d’appels d’urgence face à des biais cognitifs, comme l’effet tunnel ou le biais de confirmation, en attirant l’attention de l’opérateur sur de potentielles erreurs ou faiblesses tout en laissant celui-ci seul juge de la situation et seul preneur de décision.

Le consortium est composé d’Inria Défense&Sécurité (qui est le coordinateur), le SDIS (Service Départemental d’Incendie et de Secours) 31, le LIA (Avignon université), l’IRIT (Université de Toulouse) et AnthroPi. La chaire LIAvignon (www.liavignon.fr), à l’origine du projet, ainsi que plusieurs SDIS et d’autres acteurs nationaux sont également associés au projet).

Mission confiée

La personne recrutée aura deux missions principales, d’égale importance :

  • Aux côtés des autres chercheurs du groupe, d’intervenir au sein du sous-projet « Cohérence linguistique ». Celui-ci consiste à extraire des échanges vocaux les informations clés et vérifier la cohérence de celles-ci. L’objectif est de vérifier si une information saisie par l’opérateur a une correspondance dans l’échange vocal de celui-ci, avec le requérant ou un autre acteur. La réalisation de cet objectif sollicite notamment des éléments de transcription automatique de la parole, d’extraction de l’information linguistique pertinente, de traitement de celle-ci pour chacune des sources (conversations, fiches d’appel, corpus variés) et des éléments de traitement de la cohérence entre informations linguistiques.
  • Seconder le coordonnateur scientifique dans l’animation du projet. Il s’agit notamment d’aider à l’organisation et l’animation des différentes réunions techniques du consortium, de suivre les avancées de chaque sous-projet et de proposer les actions d’ajustement nécessaires au bon déroulé du projet.

Une thèse de doctorat (dédié au sous-projet « cohérence linguistique » et menée en collaboration entre le LIA et l’Inria) et deux  membres du groupe parole et audio, dont le coordinateur du projet, sont directement impliqués dans ce projet.

Le poste sera prioritairement implanté au sein des locaux d’Inria situé à Grenoble MinaTech. Une localisation au centre Inria Paris, rue Barrault, est toutefois possible (d’autres options pourront être évoquées le cas échéant).

Des déplacements en France sont à prévoir

Compétences

Compétences et connaissances techniques souhaitées :

  • Expérience en ingénierie informatique
  • Maitrise de Python et des environnements de programmation de méthodes de deep-learning
  • Connaissance pratique d’outils comme Pytorch, Keras ou Scikit-learn
  • Intérêt marqué pour la recherche appliquée
  • Connaissances en apprentissage automatique de manière générale et dans les approches neuronales (deep learning) en particulier.
  • Expérience en traitement automatique de la parole souhaitable, dont la connaissance de plateformes open-source comme Kaldi ou Speechbrain
  • Bénéficier d’une expérience de la recherche de type Doctorat sera un atout apprécié
  • Expérience de la conduite de projet et/ou appétence pour ce thème

Compétences comportementales attendues :

  • Autonomie et créativité
  • Avoir des capacités d’analyse et de synthèse
  • Savoir travailler en équipe
  • Être force de proposition
  • Avoir une capacité d’anticipation et de conviction
  • Avoir un esprit d’initiative et une curiosité d’esprit

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle

Rémunération

Selon baréme réglementaire, expérience professionnelle et diplôme.

De 2692 euros bruts par mois à 3400 euros bruts par  mois.