2019-01614 - Doctorant F/H HistorIA : Grandes bases de données historiques Fouille de données, exploration et explicabilité
The offer description below is in French

Contract type : Public service fixed-term contract

Level of qualifications required : Graduate degree or equivalent

Fonction : PhD Position

About the research centre or Inria department

Le centre de recherche Inria Saclay – Île-de-France, créé en 2008, accueille 450 scientifiques et 60 membres des services d’appui à la recherche. Les scientifiques sont organisés en 28 équipes de recherche dont 23 sont communes avec des partenaires du plateau de Saclay.

Le centre Inria Saclay - Île-de-France est un acteur essentiel de la recherche en sciences du numérique sur le plateau de Saclay. Il porte les valeurs et les projets qui font l’originalité d’Inria dans le paysage de la recherche : l’excellence scientifique, le transfert technologique, les partenariats pluridisciplinaires avec des établissements aux compétences complémentaires aux nôtres, afin de maximiser l’impact scientifique, économique et sociétal d’Inria.

Context

L’objectif de la thèse est de concevoir des indicateurs et des interfaces visuelles à l’usage d’historien·nes (et plus généralement de chercheuses et chercheurs en sciences sociales) pour l’exploration de données massives issues de sources historiques, avec une forte composante d’analyse de réseaux. La thèse, inscrite en informatique, se fera en collaboration avec des historien·es et sociologues.

 

Motivations

Depuis le développement des méthodes big data et leur arrivée dans les sciences sociales, plusieurs initiatives très ambitieuses ont vu le jour se fixant pour objectif de changer la manière de faire de la recherche en histoire. Pourtant, le déploiement de ces nouvelles approches se heurte à de nombreuses réticences des historien·nes, qui craignent parfois d’être dépossédé·es de leur matériau de recherche lorsqu’il est transformé pour être intégré dans des bases de données, et qui sont souvent sceptiques sur la pertinence d’indicateurs parfois abscons, basés sur des données en trop grand nombre pour être appréhendées à la main.

L’un des objectifs de la thèse est donc d’accorder une grande importance à l’explicabilité des indicateurs mis au point, en établissant un protocole permettant des allers-retours entre production d’éléments d’analyse et exploration interactive. Les difficultés d’interprétation donneront ainsi lieu à des corrections des algorithmes au fur et à mesure et l’ajout d’éléments de visualisation qui leur donnent sens.

Méthodes

L’analyse des réseaux pourra se faire en s’appuyant sur deux approches : l’énumération de structures élémentaires (appelées schémas, motifs ou graphlets), ou l’identification de groupes denses (clusters ou communautés). Les outils visuels d’exploration pourront s’appuyer sur le « Vistorian », une plateforme web à destination des historien·nes pour la visualisation de réseaux temporels. https://vistorian.net/

Pour améliorer la réactivité des interfaces, les algorithmes pourront utiliser le principe d’analyse progressive, paradigme de calcul original, imposant un impératif de très faible temps de latence pour produire des résultats de calcul de manière progressive, commençant très rapidement par une approximation grossière et améliorant la qualité à intervalle régulier au cours temps.

 

Assignment

Missions :
Avec l'aide de Jean-Daniel Fekete, Christophe Prieu, et les chercheurs en sciences sociales, la personne recrutée sera amenée à concevoir des algorithmes de clustering et de calcul de motifs dans des réseaux sociaux qui soient compréhensibles et contrôlables par des chercheurs en sciences sociales sans expertise avancée en informatique.

Collaborations

Main activities

Principales activés (5 maximum) : aider à la saisie et la structuration de corpus historiques et sociologiques, concevoir des algorithmes de clusering, concevoir des algorithmes de calcul de motifs dans des graphes, visualiser le résultat de ces clustering et motifs.

 

Exemples d'activités :

  • Analyser les besoins des partenaires
  • Proposer des solutions de clustering et de calcul de motifs pour des grands réseaux sociaux
  • Développer des interfaces de visualisation et d'exploration pour ces réseaux.
  • Former à l’utilisation les principaux partenaires
  • Animer une communauté d’utilisateurs
  • Présenter l’avancée des travaux aux partenaires

Skills

Compétences techniques et niveau requis : Masters 2 ou équivalent (ingénieur)

Langues : Français, Anglais, éventuellement Espagnol et Roumain

Compétences relationnelles : aimer collaborer avec des historiens et des sociologues

Compétences additionnelles appréciées : être intéressé par l'histoire sociale.

Benefits package

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Remuneration

Salaire mensuel (1ère et 2ème année) : 2.085 euros, (3ème année) : 2.085 euros