Au sein de l’Institut de Recherche Technologique SystemX, situé au cœur du campus scientifique d’excellence mondiale de Paris-Saclay, vous prendrez une part active au développement d’un centre de recherche technologique de niveau international dans le domaine de l’ingénierie numérique des systèmes. Adossé aux meilleurs organismes de recherche français du domaine et constitué par des équipes mixtes d’industriels et d’académiques, ce centre a pour mission de générer de nouvelles connaissances et solutions technologiques en s’appuyant sur les percées de l’ingénierie numérique et de diffuser ses compétences dans tous les secteurs économiques.

Vous serez encadré par un ingénieur-chercheur SystemX du domaine Science des données, IA et Interaction.
Vous travaillerez au sein du projet de recherche SystemX EPI (Évaluation des Performances de systèmes de décision à base d’Intelligence Artificielle (IA)) dont les partenaires sont Groupe PSA, Naval Group, Expleo et APSYS.
Le poste est basé à l’IRT SystemX – Palaiseau [site du Nano-Innov].

 

SUJET DU STAGE

Ce stage a pour ambition de mettre en œuvre et d’expérimenter plusieurs algorithmes d’apprentissage par renforcement pour concevoir un système de décision optimal en terme de performance et robustesse. Cette analyse a pour objectif de proposer un environnement de conduite permettant l’application des algorithmes de renforcement. On cherchera à mieux exprimer les paramètres d’environnement de renforcement à savoir les états, les actions, le calcul des récompenses, etc.
Le stagiaire commencera par un état de l’art sur cette problématique, et en parallèle, évaluera les approches proposées par des exemples illustratifs via une IHM.

Vos missions seront les suivantes :
• Réalisation d’un état de l’art sur les algorithmes et les environnements d’apprentissage par renforcement
• Création d’un environnement (ou amélioration d’un environnement existant) pour le contexte des systèmes autonomes
• Implémentation d’un protocole d’évaluation de l’environnement créé et des algorithmes de renforcement

Références :
[1] J. Chen, B. Yuan, and M. Tomizuka, “Model-free deep reinforcement learning for urban autonomous driving,” CoRR, vol. abs/1904.09503, 2019. [Online]. Available: http://arxiv.org/abs/1904.09503
[2] A. E. Sallab, M. Abdou, E. Perot, and S. Yogamani, “Deep reinforcement learning framework for autonomous driving,” CoRR, vol. abs/1704.02532, 2017. [Online]. Available: http://arxiv.org/abs/1704.02532
[3] M. Vitelli and A. Nayebi, “CARMA: A deep reinforcement learning approach to autonomous driving,” Tech. rep. Stanford University, Tech. Rep., 2016.
[4] Y. Cui, S. Osaki, T. Matsubara, « Reinforcement learning ship autopilot: Sample-efficient and model predictive control-based approach », CoRR, 2019.
[5] https://selfdrivingcars.mit.edu/resources/

 

PROFIL

Étudiant BAC+5 en fin de cycle école d’ingénieur ou Master 2, dans le domaine de la science des données, IA, statistiques, mathématiques appliquées ou informatique avec une spécialisation en science des données et en Machine Learning.

Compétences :
• Maîtrise du langage de programmation Python
• Maîtrise des libraires python pour IHM (QT, Tkinter, etc.).
• Machine Learning, apprentissage par renforcement
• Base de données
• Statistique / Mathématique appliquée

Aptitudes personnelles :
• Esprit d’analyse, autonomie, travail collaboratif
• Intérêt pour la recherche appliquée
• Aptitude à communiquer aussi bien à l’oral qu’à l’écrit (en français et anglais)
• Intérêt pour les transports autonomes

Durée du stage : 6 mois
Date de démarrage envisagée : mars 2020

Pour postuler :  mohamed.ibn-khedher@irt-systemx.fr en précisant la référence : DSR_2020_EPI_01_02 en objet

- ABONNEMENT NEWSLETTER

Inscrivez-vous à la newsletter de l'IRT SystemX

et recevez chaque mois les dernières actualités de l'institut :