Doctorant F/H NLP4NLP pour une éthique déontologique du TAL

The offer description be low is in French

Contract type : Fixed-term contract

Level of qualifications required : Graduate degree or equivalent

Fonction : PhD Position

Context

Dans le cadre d’un partenariat (vous pouvez choisir entre)

  • non pertinent
L'équipe-projet INRIA Sémagramme fait partie du centre Inria de l’université de Lorraine ainsi que du département Traitement automatique des langues et des connaissances du laboratoire LORIA de l'Université de Lorraine.
 
https://team.inria.fr/semagramme/fr/
 
Cette thèse porte sur l’utilisation des méthodes de TAL sur des corpus d’articles scientifiques en TAL pour dégager une analyse déontologiques des pratiques et des développements de la communauté scientifiques.
 
 
Co-direction de thèse/PhD Advisors
Karën Fort (Sorbonne Université/LORIA)
Maxime Amblard (Inria)
 
Location and Mobility
La thèse est située à Nancy, au centre Inria de l’université de Lorraine
Le thème de la thèse est à l’articulation de plusieurs projets de l’équipe
plusieurs mobilités pour présenter les travaux sont prévues.
 

 

Assignment

Les technologies capables de garantir la confiance dans les solutions d’IA et du TAL ont pris une place importante dans les développements récents. Cette question est au centre de la rédaction de l’AI Act et est intégrée dans les différents standard de l’IA. Les enjeux sur l’impact écologique ou la sureté des systèmes et la protection des données sont définis par leur objet même, les questions d’équité, d’explicabilité ou d’éthique restent un champ largement ouvert pour la recherche. Dans ce contexte, le sujet proposé s’intéresse particulièrement aux questions d’éthique en TAL.

Si l’éthique est un sujet au centre de nombreuses recherches en philosophie, son transfert aux sujet d’IA et TAL reste une question complexe. Très souvent, l’éthique est vue sous le prisme conséquentialiste qui est une manière naturelle d’envisager la chaîne de faits produit par le développement et qui change le monde. Cependant, cette seule vue met de côté de nombreux autres enjeux. De la même manière qu’il a fallu du temps pour identifier 5 sources de biais dans les systèmes d’apprentissage automatique, notre vision des problématiques IA et TAL a besoin de s’ouvrir à d’autres perspectives. En particulier, une seconde branche de l’éthique considère la manière dont est conduite la recherche. Pour ce qui est de l’IA et du TAL, les règles ne sont pas définitivement établies, ce qui n’exclu pas de pouvoir identifier des comportements plus ou moins acceptables du point de vue de l'éthique déontologique.
 
Le sujet proposé se focalise sur l’utilisation du TAL pour le TAL (NLP4NLP) dans une perspective déontologique. La communauté du TAL a depuis toujours été portée par les pratiques de la science ouverte. En effet, les principales conférences et revue du domaine sont intégralement accessibles, tant en français qu’en anglais. Par ailleurs, l’ensemble de la production scientifique de la thématique a été rassemblé dans une ressource connue sous le nom d’ACL anthologie (du nom de la principale association en TAL). Cette anthologie est maintenant disponible sous forme d'un corpus, où l’information est exprimée en langue naturelle, le cœur du TAL. Il est donc pertinent d’appliquer les méthodes du TAL à ces données pour analyser les pratiques de production de la recherche elles-mêmes. Par extension, il est possible d’identifier des ressources similaires, qui permettent des études comparatives. Cette analyse est le point de départ du présent sujet de thèse. 
 
Cette thèse propose d’utiliser les méhtodes du TAL pour étudier les développements scientifiques en TAL de manières diachroniques et synchroniques. L’axe déontologique sera prédominent afin d’identifier les mauvaises pratiques et mettre en avant celles qui produisent une science qui va dans le sens du bien commun.

Pour une meilleure connaissance du sujet de recherche proposé :
Un état de l'art, une bibliographie, des références scientifiques sont disponibles à l'URL suivante, n'hésitez à pas à vous y connecter : https://github.com/acl-org/ethics-reading-list/blob/main/README.md

 

 

Main activities

Compétences
Master's degree in NLP, Computer Science or a related master program
Proficiency in programming languages (Python) and good coding practices
Skills in algorithm design
Experience in deep learning
Ability to work independently and also to work in a team
Excellent oral and written English skills
 
Avantages
Subsidized meals
Partial reimbursement of public transport costs
Leave: 7 weeks of annual leave + 10 extra days off due to RTT (statutory reduction in working hours) + possibility of exceptional leave (sick children, moving home, etc.)
Possibility of teleworking (after 6 months of employment) and flexible organization of working hours
Professional equipment available (videoconferencing, loan of computer equipment, etc.)
Social, cultural and sports events and activities
Access to vocational training
Social security coverage
 
Rémunération
 
2100 € brut/mois la 1ère année
2100€ gross/month the 1st year

Skills

Compétences techniques et niveau requis :

Langues :

Compétences relationnelles :

Compétences additionnelles appréciées :

Benefits package

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Remuneration

2100 € brut/mois la 1ère année