2020-03219 - Stage M2: Détection automatique ou semi-automatique d’entreprises en difficultés ou fragilisées par la crise

Niveau de diplôme exigé : Bac + 4 ou équivalent

Fonction : Stagiaire de la recherche

A propos du centre ou de la direction fonctionnelle

Le centre de recherche Inria Saclay – Île-de-France, créé en 2008, accueille 450 scientifiques et 60 membres des services d’appui à la recherche. Les scientifiques sont organisés en 28 équipes de recherche dont 23 sont communes avec des partenaires du plateau de Saclay.

Le centre Inria Saclay - Île-de-France est un acteur essentiel de la recherche en sciences du numérique sur le plateau de Saclay. Il porte les valeurs et les projets qui font l’originalité d’Inria dans le paysage de la recherche : l’excellence scientifique, le transfert technologique, les partenariats pluridisciplinaires avec des établissements aux compétences complémentaires aux nôtres, afin de maximiser l’impact scientifique, économique et sociétal d’Inria.

Contexte et atouts du poste

Ce stage est proposé dans le cadre du LabIA : un partenariat entre la DINUM et Inria qui a pour but d’aider les administrations à moderniser leur action grâce à l’usage de l’Intelligence Artificielle. Ce stage est proposé pour aider à définir  des nouvelles pistes de travail aux équipes de Signaux Faibles, une start-up d’état qui cherche à identifier le plus tôt possible les entreprises en défaillance pour pouvoir leur proposer les aides adéquates.

 

 

Mission confiée

Le constat est partagé par tous les acteurs qui accompagnent des entreprises en difficultés : pour agir efficacement, en toute sérénité et confidentialité, il convient d’intervenir le plus en amont possible. Cela permet de mobiliser toute la palette des outils de financement ou d'accompagnement existants dans chaque territoire, à même de soutenir voire relancer l’activité et l’emploi. Les administrations publiques et organismes en charge d’une mission de service public détiennent des données complémentaires sur la situation économique, financière et sociale des entreprises. Il n’y a qu’un pas à franchir pour tirer parti de cette richesse : utiliser des traitements statistiques adéquats (IA/machine learning) pour identifier les entreprises fragiles et les accompagner quand il est encore temps.

« Signaux Faibles » tâche de mettre l’intelligence artificielle au service d’une action publique de proximité, proactive et bienveillante auprès des PME notamment industrielles.

Après une première phase expérimentale en Bourgogne Franche Comté, un partenariat entre cinq acteurs publics a abouti en avril 2019 au lancement d’une expérimentation à grande échelle, testée en coordination avec les agents accompagnant les entreprises. Le modèle développé (apprentissage supervisé) croise certaines données d’entreprises pour repérer des signaux de fragilités et permet ainsi de prédire un risque de défaillance à 18 mois.

Les données exploitées sont fortement brouillées par les mesures d’urgence mises en place en raison de la COVID-19 (activité partielle, délais URSSAF mobilisées par la majorité des entreprisesdonnées financières ne reflètant plus la réalité de l’activité) et le modèle algorithmique mérite des ajustements car inapte à traiter la situation spécifique de la crise.

Principales activités

L’objectif de ce stage est d’apporter des améliorations à la façon dont les données sont traitées afin de rendre plus robuste et pertinent le modèle. L’ambition est de pouvoir continuer à détecter les entreprises en difficulté malgré la perturbation due à la situation sanitaire.

Les pistes envisagées sont notamment :

  • Faire l'état de l'art des méthodes et des outils utilisés pour la détection des faillites et de type de données qui se sont avérées avoir un pouvoir prédictif important.
  • Changer la cible d’apprentissage. Actuellement la cible d’apprentissage est une cible binaire qui vaut 0 si l’entreprise a fait faillite à +18 mois. Il pourrait être imaginé une variable continue qui permettrait de saisir une dégradation temporelle de la santé de l’entreprise pas seulement à 18 mois mais aussi plus sur des périodes plus courtes comme 3 ou 6 mois, 12 mois.
  • Prendre en compte la temporalité. Actuellement le modèle n’utilise pas les séries temporelles complètes et ne prend en compte qu’une seule observation par entreprise.

Tout nouveau modèle proposé doit être interprétable et explicable, de sorte que toutes les parties concernées puissent être persuadées de son exactitude.

Éventuellement, il pourrait aussi être envisagé de travailler à mobiliser des sources variées pour la prise en compte d’éléments sectoriels de la crise. Par exemple relier des événements affectant une branche avec un groupe d’entreprises.

Toutefois, l’axe de travail principal de ce stage est de partir des données actuelles de « Signaux faibles », et d'explorer une nouvelle manière de les interpréter, utiliser, agencer pour s’adapter à la crise.

Il peut être envisageable de publier un papier de recherche à l’issu du stage, avec relecture et autorisation de l’équipe et des partenaires du projet.

Compétences

  • Bonne maîtrise de Python, Git, Linux / Connaissances en apprentissage supervisé et en feature engineering / Connaissances en traitement des séries temporelles appréciée
  • Grande autonomie et capacité à délivrer des résultats concrets et pratiques

Avantages

  • Restauration subventionnée
  • Transports publics remboursés partiellement
  • Congés: 7 semaines de congés annuels + 10 jours de RTT (base temps plein) + possibilité d'autorisations d'absence exceptionnelle (ex : enfants malades, déménagement)
  • Possibilité de télétravail (après 6 mois d'ancienneté) et aménagement du temps de travail
  • Équipements professionnels à disposition (visioconférence, prêts de matériels informatiques, etc.)
  • Prestations sociales, culturelles et sportives (Association de gestion des œuvres sociales d'Inria)
  • Accès à la formation professionnelle
  • Sécurité sociale

Rémunération

Rémunération : gratification selon tarif en vigueur