Soutenance de doctorat de Khalid Oublal : Des signaux aux structures : avancées dans les représentations explicables pour les modèles génératifs séquentiels
Télécom Paris, 19 place Marguerite Perey F-91120 Palaiseau [y aller], amphi 3 et en visioconférence
Tire original : From Signals to Structures: Advances in Explainable Representations for Sequential Generative Models
Jury
-
Francesco Locatello, Assistant Professeur, ISTA, Google Research, Austria (Rapporteur)
-
Yann Traonmilin, Research Scientist CNRS (HDR), Institut de Mathématiques de Bordeaux, France (Rapporteur)
-
Jesse Read, Professeur (HDR), École polytechnique, France (Examiner)
-
François Roueff, Professeur (HDR), Télécom Paris, France (Directeur de thèse)
-
Saïd Ladjal, Professeur (HDR), Télécom Paris, France (Co-Directeur de thèse)
-
Emmanuel Le Borgne, Senior Research Scientist, TotalEnergies, France (Co-Directeur de thèse, invité)
-
David Benhaiem, Senior Research Scientist, TotalEnergies, France (Co-Directeur de thèse, invité)
Résumé
Au cœur de toute forme d’intelligence, qu’elle soit biologique ou artificielle, réside la capacité de transformer des signaux bruts en représentations structurées, significatives et interprétables. La cognition humaine organise en permanence les flux sensoriels en motifs révélant des régularités, des relations causales et des concepts abstraits. L’apprentissage automatique moderne poursuit un objectif similaire grâce aux modèles génératifs, dont le but est de comprendre les processus cachés qui façonnent les données observées.
Pourtant, dans la pratique, les représentations apprises peinent souvent à isoler les facteurs réels à l’origine des signaux ou à préserver leur structure causale et temporelle. Ce problème provient d’un fait fondamental : sans contraintes structurelles, plusieurs explications latentes peuvent reproduire les mêmes observations. Cette thèse, « From Signals to Structures », explore comment les biais structurels, comme la sparsité, l’invariance, la factorisation de support ou la compositionnalité, permettent de guider les modèles séquentiels vers des représentations fiables et interprétables. DIOSC réalise le désenchevêtrement des facteurs latents corrélés en imposant une indépendance de support, facilitant la généralisation hors distribution. TABVAE découvre les relations causales instantanées grâce à un goulot d’attention et à la sparsité. Des extensions fondées sur des autoencodeurs préentraînés et des modèles de diffusion améliorent encore la récupération de graphes causaux. DiLOS s’appuie sur la sparsité et la structure compositionnelle pour séparer des sources lorsque certains facteurs ne sont observés que partiellement. Enfin, TimeSAE propose une interprétabilité post-hoc en estimant les effets causaux dans l’espace latent et en alignant les représentations apprises avec des concepts compréhensibles par l’humain. Nous présentons eHabitat, un jeu de données et un benchmark pour évaluer l’apprentissage de représentations séquentielles et la séparation de sources, réduisant l’empreinte de CO₂.