Sujet du stage : implémentation et évaluation des technologies « in memory data grid » (IMDG) dans un processus de machine learning contraint par une architecture micro-services
Au sein de l’Institut de Recherche Technologique SystemX, situé au cœur du campus scientifique d’excellence mondiale de Paris-Saclay, vous prendrez une part active au développement d’un centre de recherche technologique de niveau international dans le domaine de l’ingénierie numérique des systèmes. Adossé aux meilleurs organismes de recherche français du domaine et constitué par des équipes mixtes d’industriels et d’académiques, ce centre a pour mission de générer de nouvelles connaissances et solutions technologiques en s’appuyant sur les percées de l’ingénierie numérique et de diffuser ses compétences dans tous les secteurs économiques.
Vous serez encadré par un.e ingénieur.e-chercheur.euse SystemX du domaine Software & DevOps et travaillerez au sein d’une équipe de développement composée de salariés et de prestataires externes.
Les résultats de ces travaux de recherche seront pris en compte dans la définition de l’architecture logicielle du programme Confiance.ai.
Le poste est basé à l’IRT SystemX – Palaiseau
Présentation du sujet du stage
Objectifs du stage
Via la réalisation d’un prototype, le stagiaire évaluera la pertinence (critères à définir durant le stage) de l’intégration d’une solution « in memory data grid » (IMDG) au sein d’un processus de machine learning.
L’étude devra se focaliser en priorité sur les axes suivants :
- Circulation des données (data set, modèles, meta-données, events, code, etc.) au sein d’un pipeline de machine learning.
- Scalabilité de la mémoire et fiabilité de la solution.
- Performance versus stockage conventionnel.
- Intégration dans une architecture micro-services.
Missions
- Effectuer un état de l’art des solutions « in-memory data-grid » (usages, architectures, pros vs cons, librairies disponibles, etc.).
- Spécification et réalisation d’un prototype (cas d’usage ML + architecture IMDG) s’exécutant dans un environnement Kubernetes.
- Livrer un rapport d’évaluation + un guide d’implémentation de la solution retenue + code dans GitLab de l’IRT SystemX.
Référence
Applied Machine Learning in Real-Time with Distributed, Scalable, In-Memory Technology – YouTube
Profil et compétences
De formation : école d’ingénieur.e en 5è année en informatique. Profil Data-Engineer
Compétences :
- Bonnes connaissances en bases de données
- Développement de librairies en python
- Connaissance de docker et kubernetes
Aptitudes personnelles :
- Autonomie
- Capacité d’analyse et de synthèse
- Curiosité
L’IRT SystemX est engagé en faveur de l’égalité des chances. A ce titre, tous nos postes sont ouverts aux candidats en situation de handicap.
Informations clés
Durée du stage : 6 mois
Date de démarrage envisagée : janvier 2022
Localisation du poste : Cluster Paris Saclay (91)
Référence de l’offre à mentionner dans l’objet de votre e-mail de candidature : DSR-2022-04-confianceEC1
Postuler à cette offre d’emploi
Mots-clés :