Sujet du stage : implémentation et évaluation des technologies « in memory data grid » (IMDG) dans un processus de machine learning contraint par une architecture micro-services

Au sein de l’Institut de Recherche Technologique SystemX, situé au cœur du campus scientifique d’excellence mondiale de Paris-Saclay, vous prendrez une part active au développement d’un centre de recherche technologique de niveau international dans le domaine de l’ingénierie numérique des systèmes. Adossé aux meilleurs organismes de recherche français du domaine et constitué par des équipes mixtes d’industriels et d’académiques, ce centre a pour mission de générer de nouvelles connaissances et solutions technologiques en s’appuyant sur les percées de l’ingénierie numérique et de diffuser ses compétences dans tous les secteurs économiques.

Vous serez encadré par un.e ingénieur.e-chercheur.euse SystemX du domaine Software & DevOps et travaillerez au sein d’une équipe de développement composée de salariés et de prestataires externes.

Les résultats de ces travaux de recherche seront pris en compte dans la définition de l’architecture logicielle du programme Confiance.ai.

Le poste est basé à l’IRT SystemX – Palaiseau

Présentation du sujet du stage

Objectifs du stage

Via la réalisation d’un prototype, le stagiaire évaluera la pertinence (critères à définir durant le stage) de l’intégration d’une solution « in memory data grid » (IMDG) au sein d’un processus de machine learning.
L’étude devra se focaliser en priorité sur les axes suivants :

  • Circulation des données (data set, modèles, meta-données, events, code, etc.) au sein d’un pipeline de machine learning.
  • Scalabilité de la mémoire et fiabilité de la solution.
  • Performance versus stockage conventionnel.
  • Intégration dans une architecture micro-services.

Missions

  • Effectuer un état de l’art des solutions « in-memory data-grid » (usages, architectures, pros vs cons, librairies disponibles, etc.).
  • Spécification et réalisation d’un prototype (cas d’usage ML + architecture IMDG) s’exécutant dans un environnement Kubernetes.
  • Livrer un rapport d’évaluation + un guide d’implémentation de la solution retenue + code dans GitLab de l’IRT SystemX.

Référence

Applied Machine Learning in Real-Time with Distributed, Scalable, In-Memory Technology – YouTube

Profil et compétences

De formation : école d’ingénieur.e en 5è année en informatique. Profil Data-Engineer

Compétences :

  • Bonnes connaissances en bases de données
  • Développement de librairies en python
  • Connaissance de docker et kubernetes

Aptitudes personnelles :

  • Autonomie
  • Capacité d’analyse et de synthèse
  • Curiosité

L’IRT SystemX est engagé en faveur de l’égalité des chances. A ce titre, tous nos postes sont ouverts aux candidats en situation de handicap. 

Informations clés

Durée du stage : 6 mois
Date de démarrage envisagée : janvier 2022
Localisation du poste : Cluster Paris Saclay (91)
Référence de l’offre à mentionner dans l’objet de votre e-mail de candidature : DSR-2022-04-confianceEC1


Postuler à cette offre d’emploi


Mots-clés :


Partager cette offre d’emploi :

Inscrivez-vous à la newsletter de l'IRT SystemX

et recevez chaque mois les dernières actualités de l'institut :