Une approche neuro-symbolique pour traiter les arguments implicites
Type de contrat : Stage
Niveau de diplôme exigé : Bac + 5 ou équivalent
Fonction : Stagiaire de la recherche
Niveau d'expérience souhaité : Jeune diplômé
A propos du centre ou de la direction fonctionnelle
Le centre Inria d'Université Côte d'Azur regroupe 42 équipes de recherche et 9 services d’appui. Le personnel du centre (500 personnes environ) est composé de scientifiques de différentes nationalités, d’ingénieurs, de techniciens et d’administratifs. Les équipes sont principalement implantées sur les campus universitaires de Sophia Antipolis et Nice ainsi que Montpellier, en lien étroit avec les laboratoires et les établissements de recherche et d'enseignement supérieur (Université Côte d’Azur, CNRS, INRAE, INSERM ...), mais aussi avec les acteurs économiques du territoire.
Présent dans les domaines des neurosciences et biologie computationnelles, la science des données et la modélisation, le génie logiciel et la certification, ainsi que la robotique collaborative, le Centre Inria d’Université Côte d’Azur est un acteur majeur en termes d'excellence scientifique par les résultats obtenus et les collaborations tant au niveau européen qu'international.
Contexte et atouts du poste
Présentation Générale du stage de Master 2 (durée = 6 mois) :
- Dans le cadre d’un partenariat entre l'University College London, l'IRIT à Toulouse et l'INRIA à Sophia Antipolis, l’objectif est de développer un modèle d'apprentissage dédié à l'évaluation de la qualité d'explicabilité d'un argument.
- En fonction des résultats obtenus, cette recherche sera soumise à une revue de haut niveau en intelligence artificielle.
- De plus, si l'étudiant a un bon dossier, ce sujet de recherche pourra être poursuivi en thèse si un financement est obtenu.
Contexte scientifique général :
Cette recherche s’inscrit dans le domaine de l’Intelligence Artificielle (IA), et plus particulièrement dans celui de l’Argumentation. Différentes questions de recherche sont explorées en IA-Argumentation, soit dans :
- des cadres d’IA symbolique, allant de la représentation des connaissances (traitant des défis comme l’information contradictoire, l’incomplétude, l’incertitude, la temporalité, etc.) au raisonnement automatique et explicable ;
- des cadres d’IA connexionniste, dont la tâche est de classer ou de générer différentes informations (par exemple, la structure prémisse/conclusion d’un argument, la position d’un argument, si l’argument est fallacieux, quel type de fallacie il représente, ou les relations entre les arguments : relations positives comme le soutien, ou relations négatives comme la contradiction).
Les systèmes d’argumentation sont des théories et outils puissants pour représenter et gérer les informations contradictoires de manière explicable. Ils peuvent être extrêmement utiles, par exemple, pour comprendre et analyser les débats politiques, pour fournir un soutien décisionnel aux médecins dans la génération et l’évaluation de diagnostics médicaux, ou pour aider les juges à évaluer différentes défenses juridiques dans un tribunal
Contexte spécifique :
Ce stage repose sur un article actuel qui propose d'aborder une nouvelle question de recherche, encore inexplorée : comment évaluer la qualité d'un argument décodé par rapport à un argument implicite initial.
Voici le résumé de l'article à étudier :
Un argument peut être considéré comme un couple constitué d'un ensemble de prémisses et d'une conclusion qu'elles soutiennent. Les arguments utilisés par les humains sont souvent des enthymèmes, c'est-à-dire qu'une partie des prémisses est implicite. Pour mieux comprendre, évaluer et comparer les enthymèmes, il est essentiel de les décoder, c'est-à-dire de trouver les prémisses manquantes. De nombreux décodages d'enthymèmes sont possibles. Il est donc nécessaire de distinguer entre des décodages raisonnables et non raisonnables. Cependant, il n'existe actuellement aucune recherche dans la littérature sur "comment évaluer les décodages". Pour ouvrir la voie et atteindre cet objectif, nous introduisons sept critères liés au décodage, basés sur différents domaines de recherche. Ensuite, nous introduisons la notion de mesure de critère, visant à évaluer un décodage par rapport à un critère donné. Étant donné que ces mesures doivent être validées, nous introduisons plusieurs propriétés souhaitables pour celles-ci, appelées axiomes. Une autre contribution majeure de l'article est la construction de certaines mesures de critère validées par nos axiomes. De telles mesures peuvent être utilisées pour identifier les meilleurs décodages d'enthymèmes.
Dans la figure ci-dessous*, nous illustrons avec un exemple le processus mis en œuvre dans notre approche, c'est-à-dire qu'à partir d'un enthymème et d'un ensemble de décodages, nous évaluons (pour chaque paire enthymème/décodage) chaque aspect individuellement (par exemple, minimalité, inférence, similarité, granularité, poids, etc.), puis nous agrégeons toutes ces valeurs pour obtenir un score de qualité global.
*http://www-sop.inria.fr/members/Victor.David/schema_stage_Arg_Implicit.jpg
Dans cet exemple, on peut voir que l'enthymème (argument implicite) E contient différentes informations qui peuvent justifier pourquoi Bob est heureux. Ensuite, nous avons trois décodages qui expliquent la raison de son bonheur pour des raisons diverses : D1 utilise le fait que Bob est chercheur, D2 qu'il donne et reçoit de l'amour, tandis que D3 justifie son bonheur par sa richesse. De plus, chaque information logique contient une probabilité, pouvant être apprise à partir des données, et nous les utilisons pour identifier l'explication la plus fidèle de ce qui est implicite dans un enthymème.
En résumé, pour évaluer la qualité d'une paire enthymème/décodage (c'est-à-dire pour déterminer si le décodage explicite bien ce qui est implicite dans l'enthymème), nous devons :
-
Définir ou utiliser des mesures qui évaluent si un décodage satisfait un critère donné (au total, 7 critères sont à vérifier). À noter que toutes ces mesures de critères peuvent être paramétrées, en fonction des préférences de l'utilisateur (par exemple, selon qu'une explication détaillée ou concise est préférée, etc.).
-
Une fois que toutes ces mesures ont été définies et calculées, il est nécessaire d'agréger toutes ces valeurs pour obtenir un score de qualité final, compris entre 0 et 1. Là encore, différentes stratégies d'agrégation, avec des propriétés variées, sont possibles selon les préférences de l'utilisateur (par exemple, certains critères peuvent être obligatoires tandis que d'autres sont optionnels, ce qui peut donc influencer l'agrégation finale différemment lorsqu'un critère est évalué à 0, etc.).
Mission confiée
Missions :
Avec l'aide de Victor DAVID, Jonathan BEN-NAIM et Anthony HUNTER, la personne recrutée sera amenée à produire un jeu de donné et un modèle d'apprentissage.
Sur la base d'un article (http://arxiv.org/abs/2411.04555) qui définit formellement une méthodologie composée d'une multitude de paramètres pour évaluer correctement la qualité d'un argument décodant un argument implicite, nous visons à étendre cette recherche théorique par une expérimentation pratique. Dans cette expérience, nous souhaitons utiliser des modèles d'apprentissage pour identifier les meilleures paramétrisations en fonction des évaluations produites par des humains.
Pour une meilleure connaissance du sujet de recherche proposé :
Pour approfondir le contexte scientifique général (IA-Argumentation), vous pouvez consulter les références suivantes :
- Pour une vue d'ensemble sur la recherche en argumentation et ses applications pratiques, voir : “Towards artificial argumentation.” ; 2017 ; Atkinson, Katie, Pietro Baroni, Massimiliano Giacomin, Anthony Hunter, Henry Prakken, Chris Reed, Guillermo Simari, Matthias Thimm, et Serena Villata. ; AI Magazine 38, no. 3 : 25-36.
- Les recherches en IA connexionniste appliquée à l'argumentation sont souvent appelées “argument mining”. Pour plus d'informations, voir : “Argument Mining: A Survey.” ; 2020 ; Lawrence, John, et Chris Reed. ; Computational Linguistics45, no. 4 : 765-818.
Principales activités
Avantages
- Restauration subventionnée
- Transports publics remboursés partiellement
- Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
- Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
- Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
- Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
- Accès à la formation professionnelle
- Participation mutuelle (sous conditions)
Rémunération
Gratification selon temps de présence.
Informations générales
- Thème/Domaine : Représentation et traitement des données et des connaissances
- Ville : Sophia Antipolis
- Centre Inria : Centre Inria d'Université Côte d'Azur
- Date de prise de fonction souhaitée : 2025-03-01
- Durée de contrat : 6 mois
- Date limite pour postuler : 2025-01-31
Attention: Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti.
Consignes pour postuler
Les candidatures doivent être déposées en ligne sur le site Inria. Le traitement des candidatures adressées par d'autres canaux n'est pas garanti.
Sécurité défense :
Ce poste est susceptible d’être affecté dans une zone à régime restrictif (ZRR), telle que définie dans le décret n°2011-1425 relatif à la protection du potentiel scientifique et technique de la nation (PPST). L’autorisation d’accès à une zone est délivrée par le chef d’établissement, après avis ministériel favorable, tel que défini dans l’arrêté du 03 juillet 2012, relatif à la PPST. Un avis ministériel défavorable pour un poste affecté dans une ZRR aurait pour conséquence l’annulation du recrutement.
Politique de recrutement :
Dans le cadre de sa politique diversité, tous les postes Inria sont accessibles aux personnes en situation de handicap.
Contacts
- Équipe Inria : WIMMICS
-
Recruteur :
David Victor / victor.david@inria.fr
L'essentiel pour réussir
Nous recherchons une personne motivée, curieuse et passionnée par la méthodologie scientifique.
En ce qui concerne les compétences techniques, il est essentiel d'avoir des connaissances et de l'expérience en apprentissage automatique, qui sont fondamentales pour ce rôle.
Une familiarité avec la logique et les méthodes formelles serait un atout majeur.
Enfin, étant donné que vous travaillerez dans un environnement international, la maîtrise de l'anglais est nécessaire.
Gratification : Le stagiaire sera rémunéré à hauteur de 4,35 euros de l'heure, soit 30,45 euros par jour (7 heures). La gratification variera légèrement selon le mois, entre 19 et 22 jours ouvrables, soit entre 580 et 670 euros (en général, un mois comprend 21 jours ouvrables, donc environ 640 euros par mois).
A propos d'Inria
Inria est l’institut national de recherche dédié aux sciences et technologies du numérique. Il emploie 2600 personnes. Ses 215 équipes-projets agiles, en général communes avec des partenaires académiques, impliquent plus de 3900 scientifiques pour relever les défis du numérique, souvent à l’interface d’autres disciplines. L’institut fait appel à de nombreux talents dans plus d’une quarantaine de métiers différents. 900 personnels d’appui à la recherche et à l’innovation contribuent à faire émerger et grandir des projets scientifiques ou entrepreneuriaux qui impactent le monde. Inria travaille avec de nombreuses entreprises et a accompagné la création de plus de 200 start-up. L'institut s'efforce ainsi de répondre aux enjeux de la transformation numérique de la science, de la société et de l'économie.