Soutenance de doctorat de Victor Priser : Convergence des systèmes de particules stochastiques et applications
Télécom Paris, 19 place Marguerite Perey F-91120 Palaiseau [y aller], amphi 6
Titre original : Convergence of stochastic particle systems and applications
Jury
- Massimo Fornasier, Professeur, Technical University of Munich, Allemagne (Rapporteur)
- Fabien Panloup, Professeur, Université d’Angers (LAREMA), France (Rapporteur)
- Aline Kurtzmann, Professeure associée, Université de Lorraine (IECL), France (Examinatrice)
- Alain Durmus, Professeur, Ecole Polytechnique (CMAP), (Examinateur)
- Pascal Bianchi, Professeur, Télécom Paris (LTCI), France (Directeur de thèse)
- François Portier, Professeur associé, ENSAI (CREST), France (Co-directeur de thèse)
- Walid Hachem, Directeur de recherche, Université Gustave Eiffel (LIGM), France (invité)
- Anna Korba, Professeure associée , ENSAE (CREST), France (Invitée)
Résumé
Cette thèse étudie le comportement théorique et les applications pratiques des systèmes de particules stochastiques, en mettant particulièrement l’accent sur leurs propriétés de convergence ainsi que sur leur rôle dans les méthodes de calcul modernes telles que l’optimisation, la simulation, les méthodes de Monte Carlo et l’inférence variationnelle.
Les contributions de cette thèse s’articulent autour de deux grandes classes de systèmes de particules : les systèmes de type McKean–Vlasov et les systèmes de type Importance Sampling, qui répondent à des enjeux mathématiques et algorithmiques différents.
Cependant, cette thèse s’intéresse à un problème plus réaliste et plus difficile : comprendre le comportement en temps long des systèmes de particules de type McKean–Vlasov avec un nombre fini de particules. Nous montrons que, sous des hypothèses faibles, la distribution empirique des particules converge vers l’ensemble des solutions stationnaires de l’équation de McKean–Vlasov associée. Ce résultat est obtenu sans recourir à des hypothèses fortes, comme celles utilisées dans les approches actuelles, qui sont souvent difficiles à vérifier en pratique. Nous spécialisons ensuite notre analyse à deux algorithmes importants : Consensus-Based Optimization (CBO) et Stein Variational Gradient Descent (SVGD). Pour CBO, une méthode d’optimisation sans gradient, nous établissons la convergence en temps long avec des taux explicites, montrant que les particules se concentrent près du minimiseur global après un grand nombre d’itérations. Dans le cas de SVGD, nous proposons une version bruitée de l’algorithme, qui garantit la convergence vers la distribution cible.
La seconde partie de la thèse porte sur les systèmes de particules de type Importance Sampling, dans lesquels les particules sont générées séquentiellement et associées à des poids d’importance afin d’approximer une distribution cible. Une difficulté majeure dans ce cadre est la dégénérescence des poids, qui survient lorsque la plupart des poids sont négligeables tandis que seuls quelques-uns dominent. En conséquence, seul un petit nombre de particules a une influence significative sur l’approximation de la mesure cible.
Pour remédier à ce problème, nous introduisons un algorithme adaptatif d’Importance Sampling à noyau modifié, qui applique une transformation aux poids afin de réduire leur variance tout en préservant la convergence vers la distribution cible. Cette approche améliore les performances, en particulier dans des contextes de grande dimension.
En outre, nous développons une nouvelle méthode pour l’optimisation sans gradient. Alors que de nombreuses approches actuelles consistent à sélectionner le meilleur échantillon produit par un algorithme donné, la méthode proposée utilise une moyenne pondérée basée sur l’Importance Sampling. Nous montrons l’efficacité de cette approche en la comparant à la recherche aléatoire standard et établissons que, sous des hypothèses appropriées, elle permet d’obtenir de meilleurs taux de convergence tout en conservant la même complexité de calcul.
Dans l’ensemble, cette thèse apporte de nouvelles perspectives théoriques sur le comportement en temps long des systèmes de particules stochastiques et démontre leur efficacité dans un large éventail d’applications. Elle contribue à combler l’écart entre théorie et pratique en proposant des algorithmes améliorés pour l’échantillonnage et l’optimisation, appuyés par des garanties de convergence rigoureuses.