Stage en caractérisation de scènes et d’événements acoustiques pour le résumé automatique d’enregistrement de parole
Contract type : Internship
Level of qualifications required : Master's or equivalent
Other valued qualifications : de M2 en IA, mathématiques, mathématiques appliquée ou informatique ou équivalent, avec une forte motivation pour la recherche appliquée.
Fonction : Internship Research
Context
En traitement automatique de la parole, l’apport de modèles auto supervisés permettant d’extraire du signal des représentations condensées de l’information (embeddings) n’est plus à démontrer. Ces modèles ont autorisé la mise au point d’applications variées, comme la transcription, la traduction ou le résumé automatique d’un enregistrement de parole, avec un niveau de performance très élevé. Ils ont également mené à la création de systèmes capables de répondre à une requête d’n utilisateur en générant un texte adapté.
L’objectif du stage proposé est d’ajouter dans un tel système les informations non verbales pouvant être extraites de l’enregistrement audio, liées notamment à la scène acoustique et les événements sonores.
Assignment
Le stage propose différents objectifs dont :
- Réaliser un état de l’art des approches existantes en caractérisation de scènes et détection d’événements acoustiques
- Mettre en œuvre une sélection de ces approches et évaluer leur performance.
- Evaluer la capacité d’un grand modèle de langage (LLM) à utiliser les informations non verbales, nativement et en intégrant les résultats de l’étape précédente, pour produire un résumé cohérent.
Le stage comprendra une partie expérimentale importante, comprenant l’évaluation, le finetuning et l’entraînement de systèmes de traitement de l’audio.
Le stage se déroulera au centre Inria Paris Sorbonne, rue Barrault, Paris 13, au sein d’un groupe de recherche spécialisé sur la parole et l’audio, composé d’une dizaine de chercheuses et chercheurs.
Ce stage est ouvert à des étudiantes étudiants de M2 en IA, mathématiques, mathématiques appliquée ou informatique ou équivalent, avec une forte motivation pour la recherche appliquée.
Skills
Compétences attendues :
- Programmation Python
- Pratique d’une librairie type Pytorch, Keras, Scikit-learn
- Connaissances pratiques en apprentissage automatique
- Maîtrise de l’anglais
- Des connaissances en traitement automatique de la parole et/ou en traitement du signal constitueront un plus.
Benefits package
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés déterminés en fonction de la durée du stage
- Possibilité de télétravail (après 2 mois d'ancienneté)
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des oeuvres sociales d'Inria)
- Accès à la formation professionnelle
General Information
- Town/city : Paris
- Inria Center : Siège
- Starting date : 2025-03-01
- Duration of contract : 6 months
- Deadline to apply : 2025-02-28
Warning : you must enter your e-mail address in order to save your application to Inria. Applications must be submitted online on the Inria website. Processing of applications sent from other channels is not guaranteed.
Instruction to apply
Defence Security :
This position is likely to be situated in a restricted area (ZRR), as defined in Decree No. 2011-1425 relating to the protection of national scientific and technical potential (PPST).Authorisation to enter an area is granted by the director of the unit, following a favourable Ministerial decision, as defined in the decree of 3 July 2012 relating to the PPST. An unfavourable Ministerial decision in respect of a position situated in a ZRR would result in the cancellation of the appointment.
Recruitment Policy :
As part of its diversity policy, all Inria positions are accessible to people with disabilities.
Contacts
- Inria Team : MIS-DEFENSE
-
Recruiter :
Arunraja Emilie / emilie.arunraja@inria.fr
About Inria
Inria is the French national research institute dedicated to digital science and technology. It employs 2,600 people. Its 200 agile project teams, generally run jointly with academic partners, include more than 3,500 scientists and engineers working to meet the challenges of digital technology, often at the interface with other disciplines. The Institute also employs numerous talents in over forty different professions. 900 research support staff contribute to the preparation and development of scientific and entrepreneurial projects that have a worldwide impact.