Au sein de l’Institut de Recherche Technologique SystemX, situé au cœur du campus scientifique d’excellence mondiale de Paris-Saclay, vous prendrez une part active au développement d’un centre de recherche technologique de niveau international dans le domaine de l’ingénierie numérique des systèmes. Adossé aux meilleurs organismes de recherche français du domaine et constitué par des équipes mixtes d’industriels et d’académiques, l’institut a pour mission de générer de nouvelles connaissances et solutions technologiques en s’appuyant sur les percées de l’ingénierie numérique et de diffuser ses compétences dans tous les secteurs économiques. Plus particulièrement au sein de l’IRT SystemX, le doctorant sera rattaché à l’axe « sciences des données, IA et Interaction ». Le sujet de thèse a été défini dans le cadre du projet IAG1 « Gestion de connaissances techniques en ingénierie des systèmes complexes » du programme « IA Générative pour l’industrie » (IAG) de l’institut. Le projet vise à développer un cadre scientifique et technique permettant d’évaluer des modèles d’IAG sur des benchmarks et des cas d’usage industriels ou industrialisables, et de les spécialiser sur des données multimodales collectées dans les corpus de connaissances techniques des ingénieries. Son objectif est d’assister la prise de décision en générant des réponses adaptées aux métiers de l’ingénierie, sous forme de rapports de différentes natures comprenant des résumés, des analyses et des recommandations de scénarios métier, alignés sur les connaissances techniques sous-jacentes aux données multimodales exploitées.
La direction de la thèse sera assurée par Faïcel Chamroukhi, professeur des universités et responsable scientifique de l’axe 1 à l’IRT SystemX. La thèse sera inscrite à l’école doctorale STIC de l’Université Paris-Saclay (#580). Le poste est basé sur le site de l’IRT SystemX à Palaiseau. Hormis les déplacements en conférences internationales, un séjour dans un laboratoire à l’étranger peut être envisagé.
La date souhaitée de démarrage de la thèse est le 01/01/2026.
La rémunération de la thèse est de 2784€ brut mensuel sur 3 ans.
Contexte et motivations
Les données produites par les systèmes d’ingénierie en milieu industriel sont multimodales et complexes : données de capteurs, rapports de diagnostic et de maintenance de pannes, dessins et schémas techniques, référentiels techniques, normes et standards,… La richesse et l’hétérogénéité de ces données ouvrent des opportunités uniques pour l’aide à la décision et à la conception en industrie. Leur exploitation optimisée est un levier majeur d’amélioration du processus industriel dans son ensemble et est un vecteur de compétitivité économique. Toutefois, ces données posent aussi des défis scientifiques. Elles sont hétérogènes, de modalités variées, souvent incomplètes, notamment dans le cas de situations rarement observées. Leur intégration cohérente représente un enjeu clé pour les acteurs industriels. La recherche menée dans cette thèse porte principalement sur l’exploitation simultanée et efficace de données hétérogènes, collectées et/ou simulées à partir de différentes sources en ingénierie de systèmes complexes. Trois défis scientifiques principaux structurent la thèse :
Ces problématiques concernent en particulier l’apprentissage de modèles génératifs frugaux à partir de modalités au-delà du seul texte, notamment des séries temporelles, dessins et images techniques, diagrammes, ainsi que des données tabulaires, avec des contraintes liées à l’intégration du contexte et des connaissances métier. Aujourd’hui, les modèles de fondation multimodaux [20] appelés General Purpose AI (GPAI) models, entraînés sur de gros corpus hétérogènes, sont prometteurs pour apprendre des représentations intégrées de données très diverses (texte, image, séries temporelles). Leur potentiel reste largement inexploré pour les données industrielles, qui présentent des contraintes et des exigences spécifiques (volumétrie, qualité, spécialisation, ressources limitées). Cette thèse a pour objectif de proposer des modèles génératifs probabilistes multimodaux légers, capables d’apprendre des représentations communes de données industrielles, éventuellement partagées entre modalités, et de générer des données simulées cohérentes, sous des contraintes de ressources et de temps de traitement. Des modèles parcimonieux sont nécessaires pour répondre aux contraintes de frugalité. Des données synthétiques permettront également d’étudier des situations difficilement observables en pratique (rareté, anomalies, complétion d’annotations coûteuses à obtenir), de simuler des scénarios d’aide à la décision (ex. maintenance prédictive) et de tester des modèles prédictifs en aval.
État de l’art et méthodologie
La conception de modèles de fondation multimodaux est un axe de recherche en plein essor. Au-delà des LLMs principalement dédiés au texte, l’état de l’art en IA générative multimodale comprend deux familles principales :
Les architectures MoE—Mélanges d’experts (Mixture of Experts – MoE) (Shazeer et al., 2017) ont montré d’excellentes performances pour concilier capacité et frugalité ; par exemple, des variantes récentes de LLM à experts (ex. Mixtral 8×7B [18], DeepSeek-MoE [19]) réduisent le coût d’inférence en n’activant qu’un sous-ensemble d’experts par jeton. Des approches récentes de MoE parcimonieux montrent que l’activation sélective des experts, via des mécanismes de compétition (CompeteSMoE [16]) ou de routage dynamique optimisé (HyperRouter [17]), permet d’accroître la capacité des modèles tout en limitant les coûts. Elles offrent ainsi un moyen efficace et frugal pour spécialiser et exploiter des modèles de fondation multimodaux en contexte industriel. Dans le cadre de cette thèse, une première direction consistera à explorer l’approche des Mélanges d’experts pour traiter l’hétérogénéité des données. Chaque modalité pourra être prise en charge par un expert spécialisé (texte, séries temporelles, données tabulaires, imagerie/diagrammes). Un mécanisme de gating permet de combiner dynamiquement leurs contributions selon la tâche (prédiction, génération). Cette approche permet de favoriser la frugalité computationnelle, la modularité et l’interprétabilité. Le cadre des MoE s’articule naturellement avec les modèles de fondation multimodaux/GPAI, en permettant de combiner plusieurs modèles spécialisés de manière efficace. Un enjeu réside dans la gestion du phénomène d’effondrement des représentations (representation collapse), particulièrement critique en situation multimodale : il correspond au cas où tous les experts (ou composantes du modèle apprennent des représentations trop similaires, ce qui réduit la diversité, la spécialisation et, in fine, la capacité effective du modèle. En contexte multimodal, cette problématique est amplifiée : chaque modalité doit être représentée de manière à la fois distincte et correctement intégrée. Concernant l’adaptation de ces modèles, l’approche privilégiée sera celle de la combinaison d’experts spécialisés (MoE), orchestrés dynamiquement. Chaque modalité ou sous-tâche pourra ainsi être prise en charge par un expert adapté, activé de manière sélective, ce qui garantit modularité, frugalité computationnelle et meilleure interprétabilité. En complément, plusieurs scénarios seront étudiés : l’évaluation zero-shot / few-shot de modèles pré-entraînés existants sur des tâches spécialisées ; l’adaptation efficace en paramètres (PEFT) — comme LoRA, prefix-tuning [21]— qui constitue une alternative économe en données et en calcul ; et, de façon comparative, le fine-tuning complet, envisageable si les ressources et la qualité des données le permettent. Cette démarche permettra de tirer parti de la puissance des modèles de fondation tout en garantissant leur adaptation aux spécificités des données industrielles (volume limité, multimodalité, rareté, hétérogénéité), sous des garanties contre l’effondrement de représentations, afin de préserver et d’exploiter pleinement la contribution de chaque modalité.
Cas d’usage : Les travaux de thèse seront illustrés et validés sur un ou plusieurs cas d’application issus du monde industriel dans le cadre du projet IAG1:
Références
Le(la) candidat(te) doit justifier d’un Master Recherche (ou formation équivalente avec un intérêt avéré pour la recherche) dans le domaine des sciences des données et de l’Intelligence Artificielle.
Compétences attendues:
Pour postuler, merci d’envoyer les éléments suivants au format PDF à : faicel.chamroukhi@irt-systemx.fr