Une approche neuro-symbolique pour traiter les arguments implicites

Type de contrat : Stage

Niveau de diplôme exigé : Bac + 5 ou équivalent

Fonction : Stagiaire de la recherche

Niveau d'expérience souhaité : Jeune diplômé

A propos du centre ou de la direction fonctionnelle

Le centre Inria d'Université Côte d'Azur regroupe 42 équipes de recherche et 9 services d’appui. Le personnel du centre (500 personnes environ) est composé de scientifiques de différentes nationalités, d’ingénieurs, de techniciens et d’administratifs. Les équipes sont principalement implantées sur les campus universitaires de Sophia Antipolis et Nice ainsi que Montpellier, en lien étroit avec les laboratoires et les établissements de recherche et d'enseignement supérieur (Université Côte d’Azur, CNRS, INRAE, INSERM ...), mais aussi avec les acteurs économiques du territoire.

Présent dans les domaines des neurosciences et biologie computationnelles, la science des données et la modélisation, le génie logiciel et la certification, ainsi que la robotique collaborative, le Centre Inria d’Université Côte d’Azur est un acteur majeur en termes d'excellence scientifique par les résultats obtenus et les collaborations tant au niveau européen qu'international.

Contexte et atouts du poste

Présentation Générale du stage de Master 2 (durée = 6 mois) :

  • Dans le cadre d’un partenariat entre l'University College London, l'IRIT à Toulouse et l'INRIA à Sophia Antipolis, l’objectif est de développer un modèle d'apprentissage dédié à l'évaluation de la qualité d'explicabilité d'un argument.
  • En fonction des résultats obtenus, cette recherche sera soumise à une revue de haut niveau en intelligence artificielle.
  • De plus, si l'étudiant a un bon dossier, ce sujet de recherche pourra être poursuivi en thèse si un financement est obtenu.

Contexte scientifique général :
Cette recherche s’inscrit dans le domaine de l’Intelligence Artificielle (IA), et plus particulièrement dans celui de l’Argumentation. Différentes questions de recherche sont explorées en IA-Argumentation, soit dans :

  1. des cadres d’IA symbolique, allant de la représentation des connaissances (traitant des défis comme l’information contradictoire, l’incomplétude, l’incertitude, la temporalité, etc.) au raisonnement automatique et explicable ;
  2. des cadres d’IA connexionniste, dont la tâche est de classer ou de générer différentes informations (par exemple, la structure prémisse/conclusion d’un argument, la position d’un argument, si l’argument est fallacieux, quel type de fallacie il représente, ou les relations entre les arguments : relations positives comme le soutien, ou relations négatives comme la contradiction).

Les systèmes d’argumentation sont des théories et outils puissants pour représenter et gérer les informations contradictoires de manière explicable. Ils peuvent être extrêmement utiles, par exemple, pour comprendre et analyser les débats politiques, pour fournir un soutien décisionnel aux médecins dans la génération et l’évaluation de diagnostics médicaux, ou pour aider les juges à évaluer différentes défenses juridiques dans un tribunal

 

Contexte spécifique :
Ce stage repose sur un article actuel qui propose d'aborder une nouvelle question de recherche, encore inexplorée : comment évaluer la qualité d'un argument décodé par rapport à un argument implicite initial.

Voici le résumé de l'article à étudier :
Un argument peut être considéré comme un couple constitué d'un ensemble de prémisses et d'une conclusion qu'elles soutiennent. Les arguments utilisés par les humains sont souvent des enthymèmes, c'est-à-dire qu'une partie des prémisses est implicite. Pour mieux comprendre, évaluer et comparer les enthymèmes, il est essentiel de les décoder, c'est-à-dire de trouver les prémisses manquantes. De nombreux décodages d'enthymèmes sont possibles. Il est donc nécessaire de distinguer entre des décodages raisonnables et non raisonnables. Cependant, il n'existe actuellement aucune recherche dans la littérature sur "comment évaluer les décodages". Pour ouvrir la voie et atteindre cet objectif, nous introduisons sept critères liés au décodage, basés sur différents domaines de recherche. Ensuite, nous introduisons la notion de mesure de critère, visant à évaluer un décodage par rapport à un critère donné. Étant donné que ces mesures doivent être validées, nous introduisons plusieurs propriétés souhaitables pour celles-ci, appelées axiomes. Une autre contribution majeure de l'article est la construction de certaines mesures de critère validées par nos axiomes. De telles mesures peuvent être utilisées pour identifier les meilleurs décodages d'enthymèmes.

Dans la figure ci-dessous*, nous illustrons avec un exemple le processus mis en œuvre dans notre approche, c'est-à-dire qu'à partir d'un enthymème et d'un ensemble de décodages, nous évaluons (pour chaque paire enthymème/décodage) chaque aspect individuellement (par exemple, minimalité, inférence, similarité, granularité, poids, etc.), puis nous agrégeons toutes ces valeurs pour obtenir un score de qualité global.

*http://www-sop.inria.fr/members/Victor.David/schema_stage_Arg_Implicit.jpg

Dans cet exemple, on peut voir que l'enthymème (argument implicite) E contient différentes informations qui peuvent justifier pourquoi Bob est heureux. Ensuite, nous avons trois décodages qui expliquent la raison de son bonheur pour des raisons diverses : D1 utilise le fait que Bob est chercheur, D2 qu'il donne et reçoit de l'amour, tandis que D3 justifie son bonheur par sa richesse. De plus, chaque information logique contient une probabilité, pouvant être apprise à partir des données, et nous les utilisons pour identifier l'explication la plus fidèle de ce qui est implicite dans un enthymème.

En résumé, pour évaluer la qualité d'une paire enthymème/décodage (c'est-à-dire pour déterminer si le décodage explicite bien ce qui est implicite dans l'enthymème), nous devons :

  1. Définir ou utiliser des mesures qui évaluent si un décodage satisfait un critère donné (au total, 7 critères sont à vérifier). À noter que toutes ces mesures de critères peuvent être paramétrées, en fonction des préférences de l'utilisateur (par exemple, selon qu'une explication détaillée ou concise est préférée, etc.).

  2. Une fois que toutes ces mesures ont été définies et calculées, il est nécessaire d'agréger toutes ces valeurs pour obtenir un score de qualité final, compris entre 0 et 1. Là encore, différentes stratégies d'agrégation, avec des propriétés variées, sont possibles selon les préférences de l'utilisateur (par exemple, certains critères peuvent être obligatoires tandis que d'autres sont optionnels, ce qui peut donc influencer l'agrégation finale différemment lorsqu'un critère est évalué à 0, etc.).

Mission confiée

Missions :
Avec l'aide de Victor DAVID, Jonathan BEN-NAIM et Anthony HUNTER, la personne recrutée sera amenée à produire un jeu de donné et un modèle d'apprentissage.

Sur la base d'un article (http://arxiv.org/abs/2411.04555) qui définit formellement une méthodologie composée d'une multitude de paramètres pour évaluer correctement la qualité d'un argument décodant un argument implicite, nous visons à étendre cette recherche théorique par une expérimentation pratique. Dans cette expérience, nous souhaitons utiliser des modèles d'apprentissage pour identifier les meilleures paramétrisations en fonction des évaluations produites par des humains.

Pour une meilleure connaissance du sujet de recherche proposé :

Pour approfondir le contexte scientifique général (IA-Argumentation), vous pouvez consulter les références suivantes :

  • Pour une vue d'ensemble sur la recherche en argumentation et ses applications pratiques, voir : “Towards artificial argumentation.” ; 2017 ; Atkinson, Katie, Pietro Baroni, Massimiliano Giacomin, Anthony Hunter, Henry Prakken, Chris Reed, Guillermo Simari, Matthias Thimm, et Serena Villata. ; AI Magazine 38, no. 3 : 25-36.
  • Les recherches en IA connexionniste appliquée à l'argumentation sont souvent appelées “argument mining”. Pour plus d'informations, voir : “Argument Mining: A Survey.” ; 2020 ; Lawrence, John, et Chris Reed. ; Computational Linguistics45, no. 4 : 765-818.

 

Principales activités

 

 

 

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Participation mutuelle (sous conditions)

Rémunération

Gratification selon temps de présence.