Doctorant F/H Analyse automatique de la capacité humaine à collaborer lors de conversations dyadiques et de groupe, en vue d’applications éducatives.
Type de contrat : CDD
Contrat renouvelable : Oui
Niveau de diplôme exigé : Bac + 5 ou équivalent
Fonction : Doctorant
Contexte et atouts du poste
Dans le cadre de l'ANR PRME SINNet,
L'objectif de cette thèse est d'étudier les approches qui hybrident les modèles neuronaux et symboliques. Ces méthodes seront dédiées à l'analyse du niveau de collaboration entre les participants dans les conversations (par exemple, l'analyse et la gestion des malentendus) à travers leurs expressions verbales. Nous nous concentrerons sur des applications éducatives telles que l'analyse de la dynamique de la classe et de l'engagement des étudiantes et étudiants, ainsi que sur des systèmes conversationnels destinés à aider les étudiantes et étudiants en difficulté, ou les aider à acquérir des compétences sociales, conformément aux lignes directrices éthiques définies en (1).
Mission confiée
Les travaux sur le dialogue utilisant des approches de traitement automatique des langues (TAL) et d'apprentissage profond pour la prédiction d’actes de dialogue ou l'analyse de sentiments intègrent les aspects conversationnels en capturant les dépendances contextuelles entre les énoncés à l'aide de réseaux de neurones récurrents (RNN) ou de réseaux de neurones convolutifs (CNN) pour l'apprentissage supervisé (Bapna et al., 2017). Les travaux plus récents intègrent la dynamique des échanges entre locuteurs et locutrices ; dans (Hazarika et al., 2018), la dynamique intra-locuteurs et intra-locutrices est modélisée à l'aide d'une GRU (Gated Recurrent Unit). D’autres manières de modéliser les conversations à travers des structures plus complexes que des enchaînements plats de séquences d’énoncés sont également explorées, en tirant parti d'architectures neuronales hiérarchiques (Chapuis et al., 2020) ou en utilisant des graphes dans les architectures neuronales (Ghosal et al., 2019). Les aspects conversationnels et les dépendances contextuelles entre les étiquettes peuvent aussi être modélisées en utilisant des décodeurs séquentiels et des mécanismes d’attention pour la classification d’actes de dialogue pour le TAL (Colombo et al., 2020). En ce qui concerne les architectures neuronales pour la génération de comportement des agents, plusieurs études ont essayé d’intégrer des processus collaboratifs. Ces études portent sur la génération de comportements non-verbaux d'agents liés à des positionnement interpersonnels (Dermouche & Pelachaud, 2016) et les architectures LSTM (Long-Short-Term-Memory) y sont utilisées comme des boîtes noires, afin de modéliser les dynamiques interactionnelles entre locuteurs et locutrices.
Bien que les architectures neuronales existantes (CNN, RNN, Transformers) soient extrêmement prometteuses pour la modélisation de la dynamique entre locuteurs et locutrices et de la structure séquentielle de la conversation, leur suivi de l'état d'un locuteur ou d’une locutrice dans la conversation se limite à la détection d’opinions, des émotions et des actes de dialogue au niveau du tour de parole. Les approches neuronales susmentionnées sont très efficaces, mais elles nécessitent beaucoup de données. Il existe de nombreux cas d'utilisation où la quantité de données disponibles n'est pas suffisante pour pouvoir utiliser ces méthodes, en particulier lorsqu'il s'agit d'apprentissage profond ; c'est notamment le cas dans les contextes éducatifs, où les données en jeu sont assez confidentielles, en particulier lorsque des enfants sont impliqués, car les données sont considérées comme des données personnelles et sont donc soumises à la RGPD (https://gdpr-info.eu/).
La linguistique computationnelle nous fournit d'autres approches symboliques et logiques pour l'analyse automatique de conversations. Ces approches s'appuient sur de petites quantités de données et se concentrent sur des phénomènes spécifiques, tels que la gestion des implications/des informations implicites dans les dialogues (Breitholtz, 2020) ainsi que de divers contextes (Rebuschi, 2017). La Segmented Discourse Representation Theory (SDRT, Asher et Lascarides, 2003) est l'un des cadres les plus utilisés pour l'analyse du dialogue parmi les approches formelles et hybrides du dialogue. Une autre méthode consiste à proposer une hybridation des graphes de connaissances pour modéliser les normes sociales et les grands modèles de langues (Kim et al., 2023).
L'objectif de cette thèse est d'étudier les approches qui hybrident les modèles neuronaux et symboliques. Ces méthodes seront dédiées à l'analyse du niveau de collaboration entre les participants dans les conversations (par exemple, l'analyse et la gestion des malentendus) à travers leurs expressions verbales. Nous nous concentrerons sur des applications éducatives telles que l'analyse de la dynamique de la classe et de l'engagement des étudiantes et étudiants, ainsi que sur des systèmes conversationnels destinés à aider les étudiantes et étudiants en difficulté, ou les aider à acquérir des compétences sociales, conformément aux lignes directrices éthiques définies en (1).
Supervision :
Directrice de thèse : Chloé Clavel, directrice de recherche équipe ALMAnaCH
Co-encadrante : Maria Boritchev, maitresse de conférences, équipe S2a, Telecom-Paris
Références
(1) https://web-archive.oecd.org/2020-07-23/559610-trustworthy-artificial-intelligence-in-education.pdf
(Breitholtz, 2020) Breitholtz, E. (2020). Enthymemes in Dialogue. Brill.
(Asher and Lascarides, 2003) Asher, N. and Lascarides, A. (2003). Logics of conversation. Cambridge University Press.
(Rebuschi, 2017) Rebuschi, M. (2017). Schizophrenic conversations and context shifting. In International and Interdisciplinary Conference on Modeling and Using Context, pages 708–721. Springer
(Kim et al., 2023) Hyunwoo Kim, Jack Hessel, Liwei Jiang, Peter West, Ximing Lu, Youngjae Yu, Pei Zhou, Ronan Bras, Malihe Alikhani, Gunhee Kim, Maarten Sap, and Yejin Choi. 2023. SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, pages 12930–12949, Singapore. Association for Computational Linguistics.
Principales activités
L'objectif de cette thèse est d'étudier les approches qui hybrident les modèles neuronaux et symboliques. Ces méthodes seront dédiées à l'analyse du niveau de collaboration entre les participants dans les conversations (par exemple, l'analyse et la gestion des malentendus) à travers leurs expressions verbales. Nous nous concentrerons sur des applications éducatives telles que l'analyse de la dynamique de la classe et de l'engagement des étudiantes et étudiants, ainsi que sur des systèmes conversationnels destinés à aider les étudiantes et étudiants en difficulté, ou les aider à acquérir des compétences sociales, conformément aux lignes directrices éthiques définies en (1).
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
- Sécurité sociale
Informations générales
- Thème/Domaine :
Langue, parole et audio
Statistiques (Big data) (BAP E) - Ville : Paris
- Centre Inria : Centre Inria de Paris
- Date de prise de fonction souhaitée : 2024-06-01
- Durée de contrat : 3 ans
- Date limite pour postuler : 2024-05-31
Attention: Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti.
Consignes pour postuler
Sécurité défense :
Ce poste est susceptible d’être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST). L’autorisation d’accès à une zone est délivrée par le chef d’établissement, après avis ministériel favorable, tel que défini dans l’arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l’annulation du recrutement.
Politique de recrutement :
Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap.
Contacts
- Équipe Inria : ALMANACH
-
Directeur de thèse :
Clavel Chloe / chloe.clavel@inria.fr
L'essentiel pour réussir
Vous pouvez donner là, un portrait à "gros traits" du (de la) collaborateur(trice) attendu(e) : ce que vous voyez comme nécessaire et suffisant et qui peut associer :
- goûts et appétences,
- domaine d'excellence,
- éléments de personnalité ou de caractère,
- savoir et savoir faire transversaux...
Cette rubrique permet de compléter et alléger (réduire) la liste plus formelle des compétences :
- "Se sentir à l'aise dans un environnement de dynamique scientifique, aimer apprendre et écouter sont des qualités essentielles pour réussir cette mission."
- " Passionné(e) par l'innovation, avec une expertise dans le développement Ruby on Rail et une grande capacité de conviction. Une thèse dans le domaine *** constitue un réel atout."
A propos d'Inria
Inria est l’institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l’interface d’autres disciplines. L’institut fait appel à de nombreux talents dans plus d’une quarantaine de métiers différents. 900 personnels d’appui à la recherche et à l’innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'efforce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.