Agenda

Soutenance de doctorat de Sylvain Nérondat : Apprentissage par renforcement profond pour l’optimisation conjointe de l’allocation de ressource

Jeudi 11 décembre 2025 à 10h (heure de Paris) à Télécom Paris

Télécom Paris, 19 place Marguerite Perey F-91120 Palaiseau [y aller], amphi 2 et en visioconférence

Titre intégral : Apprentissage par renforcement profond pour l’optimisation conjointe de l’allocation de ressource et de l’ordonnancement pour les réseaux ad hoc

Jury

  • Inbar Fijalkow, Professeure des universités, ENSEA, France (Examinatrice)
  • Philippe Mary, Professeur des universités, INSA Rennes, France (Examinateur)
  • Lila Boukhatem, Professeure des universités, Université Paris-Saclay, France (Examinatrice)
  • Olivier Berder, Professeur des universités, IRISA, France (Rapporteur)
  • Didier Le Ruyet, Professeur des universités, CNAM, France (Rapporteur)
  • Philippe Ciblat, Professeur, Télécom Paris, France (Directeur de thèse)
  • Christophe Le Martret, Expert, Thales, France (Co-directeur de thèse)
  • Xavier Leturc, Ingénieur, Thales, France, (Encadrant)

Résumé

Les réseaux de communication modernes font face à des défis croissants en raison de la diversité des applications, allant des services ultra-fiables à faible latence aux communications massives de type IoT. Ces applications génèrent des demandes hétérogènes nécessitant une planification efficace des paquets, qui consiste à allouer les ressources radio dans le temps (slots) et en fréquence (blocs de ressources, RBs) afin de garantir le débit, l’équité et la latence. Les méthodes heuristiques traditionnelles manquent de flexibilité pour gérer ces besoins contradictoires, ce qui rend les solutions basées sur l’IA plus adaptées, en particulier pour les systèmes 5G et 6G.

Cette thèse est consacrée au développement de méthodes basées sur l’IA pour la planification dans les réseaux de communication sans fil.

En savoir plus
Le problème d’optimisation global implique un espace d’états et d’actions de grande dimension et ne peut être résolu par des méthodes analytiques ; d’où l’adoption de techniques d’apprentissage par renforcement, combinées à des réseaux de neurones profonds. L’objectif est d’explorer comment le DRL peut être utilisé efficacement pour optimiser l’allocation des ressources dans des environnements complexes, caractérisés par des schémas de trafic variés et des conditions de canal dynamiques.

Pour ce faire, nous identifions d’abord les propriétés essentielles qu’un réseau de neurones doit satisfaire pour réaliser la planification, en particulier la capacité à gérer un nombre variable d’utilisateurs. Nous évaluons ensuite une architecture répondant à ces critères dans des conditions de complexité croissante. Dans un premier temps, la solution est testée dans un environnement slot par slot avec un seul RB par slot. Ensuite, elle est étendue afin de réaliser la planification sur plusieurs RBs simultanément. Enfin, l’approche est adaptée pour traiter conjointement la planification des RBs et la sélection du schéma de modulation et de codage (MCS).