Apprentissage profond pour le monitoring et le diagnostic de défaillances à partir de données massives complexes et hétérogènes

Au sein de l’IRT SystemX, Institut de Recherche Technologique dans le domaine de l’ingénierie numérique des systèmes, regroupant sur ses projets de recherche 200 à 300 collaborateurs, vous serez partie prenante d’un projet de recherche intitulé Maintenance Prévisionnelle et Optimisation (MPO) dont l’objectif est de concevoir une méthodologie outillée d’optimisation de politiques de maintenance de systèmes industriels, avec un focus particulier sur la maintenance prévisionnelle ainsi que la prise en compte de données complexes et hétérogènes massives.

Le stage s’inscrit dans le cadre de ce projet MPO. L’instrumentation massive des systèmes industriels permet aujourd’hui de générer de gros volumes de données de surveillance et de maintenance qui sont encore actuellement sous-exploitées dans le cadre de la maintenance prévisionnelle. Un enjeu important pour la valorisation de ces données concerne donc le développement d’algorithmes permettant l’analyse en continu de ces données, complexes et hétérogènes, afin de prédire les défaillances et de planifier les opérations de maintenance. Les approches actuelles d’apprentissage automatique et notamment l’apprentissage profond et leurs succès et résultats impressionnants dans le domaine de la reconnaissance visuelle [Russakovsky, 2015] et du traitement du langage naturel [Bengio, 2013] sont donc à fort potentiel pour la maintenance prévisionnelle. Des premières approches ont été proposées sur des cas d’application particulier de maintenance [Mohammadi et al, 2017] [Wang, 2018]. L’objectif de ce stage est, en se basant sur ces avancées, d’étudier l’état de l’art orienté sur le domaine de la maintenance prévisionnelle (complexité et hétérogénéité des données), d’implémenter au moins une approche de ce type et de l’appliquer à un cas d’application du projet MPO.

Les objectifs des travaux sont les suivants. Un premier point important est la prise en compte de l’hétérogénéité et de la complexité des différentes données disponibles. En effet, les données sont hétérogènes dans le sens où sur un même matériel on peut disposer de données structurées (ex. description du matériel), de séries temporelles (ex. données de capteurs numériques ou d’états comme ouvert/fermé), de données non structurées (comme des textes de CR de maintenance ou des photos), ou encore de connaissances sur le matériel (ex. description des plages de fonctionnement). Pour chaque type de données, les approches d’apprentissage de représentations par des architectures neuronales profondes sont prometteuses. Par exemple, pour les données de capteurs qui sont souvent des séries temporelles [Susto, 2016], plusieurs travaux récents ont mis en évidence l’apport des modèles RNN (Recurrent Neural Networks) et LSTM (Long Short Term Memory networks) pour la détection de défaillances et le diagnostic de systèmes (humains [Lipton et al, 2016] ou industriels [Zhao et al, 2017], [Ahmad,2017]), notamment pour leur capacité à prendre en compte la nature séquentielle des données à court et long terme dans l’apprentissage de représentations. Pour les données non structurées, et notamment les images, ce sont plutôt des réseaux de neurones convolutionnels profonds qui sont majoritairement utilisés [Russakovsky, 2015]. Par contre, il existe, à notre connaissance, peu de travaux portant sur la prise en compte et la fusion de l’intégralité des informations disponibles. L’objectif de ce stage est donc, en se basant sur ces différentes approches de proposer un nouveau schéma d’apprentissage de représentations mutimodales de données hétérogènes [Yang, 2017] ainsi que de nouvelles stratégies de fusion de ces données [Liu, 2017] (et/ou représentation) à des fins de monitoring et de diagnostic de défaillances.

Missions

  • Dans un premier temps, il est attendu un travail bibliographique sur les principales approches mentionnées dans le sujet (apprentissage de représentations de données hétérogènes et leur fusion pour le diagnostic).
  • Implémentation d’une approche de l’état de l’art.
  • Expérimentation sur des données provenant d’un cas d’usages identifié par le projet MPO.

Profil recherché

BAC +5 master en informatique, dans le domaine de l’intelligence artificielle et la science des données, pour un stage de 4 à 6 mois minimum à compter du premier semestre 2019 sur le site de l’IRT SystemX à Palaiseau. À noter : la possibilité de poursuivre en thèse à l’issu du stage.

Compétences

  • Intelligence artificielle.
  • Science des données.
  • Programmation (Python, C++, Java).

Aptitudes personnelles

  • Doté de capacités d’analyse, d’une forte autonomie et d’un esprit d’initiative.
  • Capacité à travailler en mode projet: rendre compte de l’avancement des travaux et communication des résultats.
  • Aptitude à communiquer aussi bien à l’oral qu’à l’écrit (en français et anglais).
  • Avoir envie de travailler en collaboration.

Référence : STAGE_2019_MPO_12_01
Pour postuler : stages@irt-systemx.fr