Contexte du stage
Au sein de l’Institut de Recherche Technologique SystemX, situé au cœur du campus scientifique d’excellence mondiale de Paris-Saclay, vous prendrez une part active au développement d’un centre de recherche technologique de niveau international dans le domaine de l’ingénierie numérique des systèmes. Adossé aux meilleurs organismes de recherche français du domaine et constitué par des équipes mixtes d’industriels et d’académiques, ce centre a pour mission de générer de nouvelles connaissances et solutions technologiques en s’appuyant sur les percées de l’ingénierie numérique et de diffuser ses compétences dans tous les secteurs économiques. Vous serez encadré par un ingénieur-chercheur SystemX de l’équipe science des données et IA. Vous travaillerez au sein du projet européen SYNERGIES (https://synergiesproject.eu/), traitant les scénarios réels et simulés de la conduite autonome, spécifiquement en vue de l’évaluation de leur représentativité.
Présentation du sujet
Objectifs du stage
Le stage s’inscrit dans le cadre du projet européen SYNERGIES, et particulièrement dans la tâche traitant de l’identification des caractéristiques d’un ensemble de scénarios pour estimer leur représentativité dans un contexte opérationnel donné. Par représentativité nous entendons l’évaluation de la présence et de l’adéquation des caractéristiques pertinentes des données par rapport aux distributions spécifiées, telle que la représentativité des scénarios critiques ou dangereux. L’objectif premier du stage est d’implémenter des méthodes pour calculer la représentativité avec plusieurs niveaux de granularité et de détail telle que la méthode Maximal Uncovered Patterns (MUP) proposé par Asudeh et al. [1] et Granular Relative and Theoretical Entroy (GRTE) proposée par Chaouche et al. [2]. Ces méthodes, MUP et GRTE, réalisent l’évaluation de la représentativité des patterns corrélés et de la granularité des classes et des modalités, respectivement. En plus de l’implémentation des approches évaluant la représentativité, leur adaptation au contexte de la conduite autonome ainsi que leurs interprétations sont dans les attendus du stage proposé. En effet, le contexte de la conduite autonome apporte de nouvelles dimensionnalités issues des scénarios en intégrant les aspects fonctionnels des systèmes ADAS et ADS. Enfin il conviendra d’intégrer ces approches dans la plateforme MOSAR [3], [4] de l’IRT SystemX. Cette plateforme est un gestionnaire de scénarios regroupant les analyses fonctionnelles, les approches théoriques et l’accidentologie. Le calcul et l’intégration de la dimension de représentativité permettra à MOSAR d’opérer des sélections automatiques de sous-ensembles de scénarios pertinents pour une tâche de conduite spécifique.
Missions :
- Mettre à jour l’état de l’art existant sur les métriques de représentativité utilisées dans le contexte de la conduite autonome. Cette analyse nous permettra d’enrichir le catalogue de métriques existantes ainsi que leur apport scientifique dans ce contexte particulier de la conduite autonome.
- Développer et adapter les méthodes sélectionnées au contexte de la conduite autonome.
- Intégrer les codes dans la plateforme MOSAR et y afficher les indicateurs de la représentativité
- Rédiger un rapport technique et une documentation accompagnant le code.
- Rédaction du rapport de stage
Références bibliographiques :
[1] A. Asudeh, Z. Jin, et H. V. Jagadish, « Assessing and Remedying Coverage for a Given Dataset », in 2019 IEEE 35th International Conference on Data Engineering (ICDE), avr. 2019, p. 554‑565. doi: 10.1109/ICDE.2019.00056.
[2] S. Chaouche, Y. Randon, F. Adjed, N. Boudjani, et M. Ibn Khedher, « DQM: Data Quality Metrics for AI Components in the Industry », AAAI-SS, vol. 4, no 1, p. 24‑31, nov. 2024, doi: 10.1609/aaaiss.v4i1.31767.
[3] M. Brini et al., « MOOVE & MOSAR Projects: a scenario library for designing & validating ADS », 2020.
[4] E. Revert, « MOSAR Scenario Manager insights », 2023.
Profil et compétences
De formation : BAC+5, dans le domaine de l’apprentissage machine/IA/statistiques
Compétences souhaitées :
- Statistiques, mathématiques appliquées
- Développement logiciel
- Python
- Connaissances en librairies de visualisation web est un plus (ex: plotly).
Aptitudes personnelles :
- Bon relationnel
- Avoir envie de travailler en mode collaboratif
- Curiosité, esprit d’initiative, capacité d’analyse et rigueur
- Bon niveau d’anglais
Merci de joindre CV, lettre de motivation, relevé de notes et autres documents utiles comme une lettre de recommandations..
Informations clés
Durée du stage : 6 mois
Date de démarrage envisagée : février 2026
Localisation du poste : Palaiseau (91)
Gratification : 1200 € net mensuel
Référence de l’offre à mentionner dans l’objet dans votre e-mail de candidature : STAGE-2025-17-SYNERGIES
Postuler à cette offre d’emploi
Merci de joindre CV, lettre de motivation, relevé de notes et autres documents utiles comme une lettre de recommandations
Domaine : Science de données et IA




