[Thèse] Monitoring, analyse et prédiction de données pour le Cloud-RAN

L’Institut de Recherche Technologique (IRT) SystemX a pour ambition de devenir une référence mondiale dans le domaine de l’ingénierie numérique. Pour cela, il s’appuie sur la co-localisation des ressources à la fois industrielles et académiques lui permettant d’avoir une efficacité et une dynamique d’innovation. Cette dernière favorise le décloisonnement des mondes publics et privés en abordant des thématiques de R&D prometteuses et des sujets de recherche d’avenir.

Définition du cadre du poste

Intégré au sein de l’Institut de Recherche Technologique SystemX, situé à Saclay et en étroite collaboration avec des industriels et académiques, vous êtes amené(e) à prendre part et à contribuer au rayonnement scientifique de SystemX. Vous travaillerez dans un environnement stimulant avec les meilleurs laboratoires de recherche français (INRIA, CEA, Institut Mines-Télécom,  …) et en étroite collaboration sur des projets scientifiques prometteurs avec des industriels chevronnés (Orange, Nokia, …).

Descriptif du poste

Le projet « Services de Télécommunications et Cloud » (STC) a pour objectif de faire converger le domaine des télécommunications avec celui du Cloud Computing en passant par deux nouveaux paradigmes inévitables (en cours de standardisation/normalisation), à savoir NFV (Network Functions Virtualization) et SDN (Software Defined Networking).

Le projet STC sera l’un des projets précurseurs des technologies permettant l’implémentation des systèmes 5G, et sera guidé par les besoins du Cloud-RAN (Cloud Radio Access Network ou C-RAN) qui représente une architecture de réseau cellulaires pour offrir les services d’accès radio sur la base des solutions technologiques Cloud et NFV.

Le principe de base du C-RAN est de mettre en commun les unités de bande de base (BBU) de plusieurs stations de base dans un ensemble centralisé de BBU, dans le Cloud, permettant ainsi  l’amélioration de la capacité du réseau, une plus grande efficacité énergétique, une flexibilité accrue pour implémenter de nouveaux services avancés de télécommunications, ainsi que la réduction des coûts d’exploitation (OPEX).

Dans le projet STC, on se focalisera plus spécifiquement sur la conception et la mise en œuvre d’un système de surveillance de l’infrastructure (sélection des métriques de l’infrastructure matérielle et logicielle, de la charge ainsi que de l’état de fonctionnement du réseau) ainsi que les métriques des services déployés (spécifiques au RAN et des composants de l’EPC).
En terme de traitement de données, il s’agit donc d’effectuer du « feature engineering » et d’implémenter des techniques de design et de sélection de features, cf. [1], avec éventuellement la considération et le test des derniers modèles par exemple (de type « deep learning », cf. [2,3]) développés récemment notamment.
Ces données de surveillance doivent être analysées en temps réel afin de prendre des décisions rationnelles et efficaces sur l’état du système. Des solutions algorithmiques de Machine Learning « en-ligne » devront ainsi être considérées et désignées, cf. [4].
Ces données seront envoyées à des orchestrateurs dans le but de reconfigurer l’infrastructure physique et/ou virtuelle pour garantir les Service Level Agreements (SLA). On sera ainsi amené à collecter deux types de données : l’un servant aux besoins de comptabilité et de tarification et l’autre sera destiné à l’analyse et à la prédiction des systèmes.

Dans le cadre du projet STC, nous recrutons un doctorant (Master M2 ou Ingénieur grandes écoles) dont les missions s’articulent autour des axes suivants :

  • Etude approfondie de l’état de l’art et de l’existant : Projets MONASCA et SAHARA de Openstack
  • Mettre en place une architecture logicielle de collecte permettant le passage à l’échelle,
  • Configuration des alarmes et notifications,
  • Mettre en œuvre des outils d’analyse de données de monitoring et de la prédiction pour la gestion et le contrôle (techniques de feature engineering [1] et de classification/détection en-ligne en Machine Learning [4]),
  • Prévoir l’usage des ressources de calcul et de stockage combinées avec des ressources réseaux, en développant de nouveaux algorithmes tirant partie des technologies Big Data (calcul parallèle notamment),
  • Mettre en œuvre l’ensemble des solutions proposées sur une infrastructure multi-sites dédiée au projet STC.

Compétences requises

  • Connaissances poussées en Machine Learning,
  • Connaissances en télécommunications (théorie de l’information, traitement de signal) souhaitées,
  • Compétences en outil d’analyse de grandes masses de données : Hadoop, Spark, …
  • Compétences en Développement Informatique : C/C++, Java, Python
  • Connaissance en Cloud Computing/Openstack souhaitées.

Aptitudes personnelles

  • Personne communicante et dynamique
  • Autonome et avec un bon esprit d’initiative

Localisation et contacts

Localisation:

IRT SystemX, 8 Avenue de la Vauve, 91120, Palaiseau.
Laboratoire LINCS, 23 Av. d’Italie, Paris.

Ref: 27-05/IC/STC-T4

Makhlouf Hadji : makhlouf.hadji@irt-systemx.fr
Ruby Krishnaswamy : ruby.krishnaswamy@orange.com
Laurent Roullet :  laurent.roullet@nokia.com

[1] Guyon, I., & Elisseeff, A. An introduction to variable and feature selection. The Journal of Machine Learning Research, 3, 1157-1182, 2003.[1]
[2] LeCun, Y., Bengio, Y., & Hinton, G. Deep learning. Nature, 521(7553), pp. 436-444, 2015.
[3] Goodfellow, I. J., Bengio, Y. & Courville, A. Deep learning. An MIT Press book in preparation, 2016. Draft chapters available in HTML at http://www.deeplearningbook.org/
[4] Alpaydin, E. Introduction to machine learning. MIT Press, 2014.