Abdelmouaiz Tebjou, doctorant, soutiendra sa thèse de l’Institut Polytechnique de Paris / ENSTA Paris, le 30 juin 2025, à 16h, sur le thème : « Data-based monitoring using template-based probability distributions ».
Résumé de la thèse :
Au fil des années, les avancées en IA ont apporté des améliorations significatives dans différents secteurs. À mesure que ces techniques s’intègrent aux différentes applications du monde réel, dans les domaines critiques pour la sécurité en particulier, cela soulève plusieurs préoccupations concernant leur performance/sécurité. Par conséquent, il devient nécessaire d’établir des garanties de performance/sécurité des modèles d’apprentissage automatique en cours de déploiement. Une approche clé consiste à mettre en place un système de monitoring qui les observe de près en cours d’opération afin de détecter en temps réel toute déviation par rapport au comportement attendu. Ceci peut être réalisé en construisant des ensembles de prédiction qui englobent toutes les sorties considérées comme acceptables ou possibles. Les ensembles de prédiction peuvent être construits en utilisant des approches basées sur des modèles, à l’instar de celles utilisées en théorie du contrôle. Cependant, les environnements de déploiement étant souvent très dynamiques et incertains, ces modèles risquent de sous-performer en cas de décalage entre les conditions réelles et les hypothèses assumées. Afin de relever ces défis, on développe des méthodes d’estimation d’incertitude basées sur les données, indépendantes du modèle d’IA et de la distribution des données, qui permettent de construire des ensembles de prédiction avec des garanties statistiques. Cette thèse apporte deux contributions afin d’améliorer la fiabilité des systèmes d’IA :
- En première partie de cette thèse, on aborde la mise en place de moniteurs d’IA qui supervisent l’évolution des systèmes dynamiques. Ceci peut être réalisé via l’analyse d’atteignabilité, qui vise à calculer l’ensemble atteignable—l’ensemble des états atteignables après un certain temps à partir d’un état initial donné. Cependant, le calcul de l’ensemble atteignable des systèmes dynamiques complexes est difficile, même si leurs dynamiques sont connues. En pratique, les paramètres sont inconnus ou difficiles à obtenir. Pour surmonter ces défis, on exploite les propriétés de la Conformal Prediction, qui assurent une indépendance vis-à-vis des modèles d’IA et de la distribution des données, afin de développer des méthodes d’approximation de l’ensemble atteignable qui sont basées sur les données et ne nécessitant aucune connaissance préalable sur la dynamique du système. Nos méthodes assouplissent les hypothèses restrictives des méthodes existantes et offrent des garanties théoriques solides. De plus, nos méthodes offrent des garanties théoriques même en présence de valeurs aberrantes. Enfin, nous démontrons via des simulations numériques que l’utilisation de la fonction de Christoffel dans nos approches offre des approximations de l’ensemble atteignable plus précises et plus robustes aux valeurs aberrantes.
- En seconde partie, on aborde la supervision des prévisions de séries temporelles. Afin d’améliorer la fiabilité dans les prédictions de ces modèles, on développe des méthodes permettant de construire des ensembles de prédictions contenant les observations futures réelles avec des garanties théoriques. Les séries temporelles ne respectent pas souvent l’hypothèse d’échangeabilité requise par la Conformal Prediction. Dans ce contexte, on étend l’applicabilité de la Conformal Prediction au domaine des séries temporelles afin d’exploiter ses propriétés utiles. Par conséquent, on développe des méthodes de construction d’ensembles de prédiction basées sur les données, dotées de garanties théoriques sur le court et le long terme, en s’appuyant sur des hypothèses minimales, voire inexistantes, sur les données. Nos méthodes peuvent être appliquées à n’importe quel modèle de prévision, et leur recours à des hypothèses minimales ou inexistantes leur permet d’être particulièrement adaptées aux applications critiques pour la sécurité, où les environnements de déploiement sont très dynamiques et imprévisibles.
Composition du jury :
-
Déjan Nickovic
Enseignant-chercheur, Austria Institute of Technology – Rapporteur -
Marianne Clausel
Enseignant-chercheur, Université de Lorraine – Rapporteur -
Thao Dang
Directeur de recherche, Université Grenoble Alpes – Examinateur -
Giovanna Martinez Arellano
Senior Research Fellow, University of Nottingham – Examinateur -
Goran Frehse
Enseignant-chercheur, ENSTA Paris – Directeur de thèse -
Faïcel Chamroukhi
Enseignant-chercheur, IRT SystemX – Co-directeur de thèse
Informations pratiques :
La soutenance aura lieu le 30 juin 2025 à 16h au 1426, 828 Bd des Maréchaux, 91120 Palaiseau