Newsroom

Airbus, des données massives pour la maintenance prédictive

escadrille-airbus-1200x630px
Compte-rendu du séminaire industriel data science des Mastères Spécialisés Big Data et IA de Télécom Paris du jeudi 25 mars 2021 avec Jayant Sen Gupta, Data Science Senior Scientist chez Airbus.

Airbus est un pionnier dans l’industrie aéronautique et spatiale. L’entreprise est en particulier très en avance sur la technologie hydrogène : l’objectif d’Airbus est de produire d’ici 2035 un avion à zéro émission. Airbus produit aussi des hélicoptères et d’autres dispositifs en rapport avec la défense et l’espace.

Jayant Sen Gupta, Data Science Senior Scientist chez Airbus, est venu exposer aux étudiants de Télécom Paris les enseignements tirés de ses expériences. Il travaille au Centre de recherche corporate d’Airbus sur des sujets communs à l’ensemble des divisions en préparant les technologies pour les futurs produits et services du groupe. Plus précisément, Jayant Sen Gupta travaille dans le domaine de l’intelligence artificielle (IA). Il a fait des études d’Ingénieur puis une thèse avant d’entrer chez Airbus en 2005. Il a travaillé principalement sur l’application du machine learning pour la surveillance de l’état de santé des systèmes et plus récemment sur la certification de fonctions critiques se servant de modèles de machine learning.

La donnée chez Airbus

Les logs et les données textuelles sont une source importante de savoirs. Certaines personnes du centre de recherche travaillent sur des problématiques NLP (traitement du langage naturel) pour pouvoir exploiter les bases documentaires, mais aussi pour permettre aux utilisateurs de produits Airbus de trouver plus rapidement l’information qu’ils recherchent dans les manuels d’utilisation des produits à l’aide d’assistants virtuels. La simulation numérique ainsi que les données de tests lors de la conception des avions sont aussi une grande source de données intéressantes à partir desquelles on peut apprendre des modèles qui peuvent remplacer des modèles physiques coûteux.

Concernant les données venant de plateformes, voici quelques exemples de données (comme ici pour les avions) :

  • Les post flight reports (PFR) récupèrent les fautes détectées sur les systèmes et les agrègent,
  • Les snapshot reports sont des rapports établis à partir de relevés des données des capteurs effectués à moments particuliers du vol,
  • Les uplinks sont des actions effectuées par un opérateur au sol pour récupérer des données de capteurs,
  • Les full flight data sont des données stockées dans un système qui étaient avant récupérées uniquement en cas d’accident. Maintenant, ces données sont exploitées de façon systématique.
  • Les maintenance log sont des logs des actions de maintenance effectuées sur un avion,
  • Les vidéos et images d’un avion, obtenues à partir de caméras qui permettent aux pilotes de visualiser certaines parties de l’avion. Pour aller vers encore plus d’autonomie, l’objectif est d’utiliser ces images pour réaliser d’autres tâches comme l’évitement d’obstacle ou le positionnement précis de l’avion.

Les données complètes de vol sont particulièrement volumineuses. Ce volume dépend du nombre de variables collectées par les capteurs mais aussi de leur fréquence de captation et de l’envergure de la flotte d’appareils. Au cours d’un vol, à cause de la connectivité grandissante mais toujours limitée, toutes les données ne peuvent être transmises en temps réel. L’idée de calculer des indicateurs représentatifs et moins volumineux à bord est une solution séduisante mais bien souvent il est difficile de construire ces indicateurs sans une connaissance a priori des problèmes à détecter. Les données complètes du vol sont donc récupérées au sol à l’aéroport. Afin de collecter une donnée de qualité et de l’exploiter de façon robuste, des infrastructures big data dédiées sont nécessaires. Les partenaires d’Airbus ont par exemple accès à l’ensemble de leurs données via la plateforme Skywise.

L’exploitation de la donnée pour l’ensemble des projets d’Airbus nécessite une grande coordination entre les équipes de conception et celles d’industrialisation, le passage à l’échelle étant généralement la problématique majeure.

Un enjeu particulièrement important dans l’industrie aéronautique est bien sûr la sécurité. Celle-ci requiert une forte explicabilité et une grande robustesse des modèles employés par Airbus, afin de s’assurer de leur bon fonctionnement en toutes circonstances. Il faut également contrôler au maximum les biais du modèle et des données. Pour le moment, cela empêche par exemple l’utilisation de réseaux de neurones très profonds, souvent utilisés en vision par ordinateur pour des applications critiques. Airbus, en partenariat avec les autorités de certification et les autres partenaires de la filière aéronautique, travaille à résoudre ces difficultés.

Les données de vol pour la maintenance prédictive

L’un des cas d’usage d’exploitation de la data chez Airbus est la maintenance prédictive, qui a pour but de prévoir au mieux les besoins de maintenance des avions. En effet, il est coûteux pour une compagnie aérienne de laisser un avion au sol pour des opérations de réparation lorsque ce dernier pourrait être en vol. Cela peut se produire quand une action de maintenance imprévue doit être effectuée pour pouvoir autoriser un avion à décoller, ce qui peut engendrer des retards, des surcoûts de maintenance et l’insatisfaction des clients.

Ainsi, Airbus développe un système permettant aux compagnies aériennes de recueillir en temps réel des données générées par les capteurs des différents systèmes des avions. Ces données sont ensuite envoyées à Airbus, qui les analyse à l’aide de méthodes de machine learning afin de déterminer quand l’avion aura besoin d’être envoyé en maintenance. La problématique principale de cette tâche d’apprentissage est que les données ne sont essentiellement pas labellisées, étant donné que les avions fonctionnent presque exclusivement en conditions normales. Les algorithmes employés fonctionnent en apprenant le comportement normal des capteurs de l’avion. Ainsi, si une valeur ne concorde pas avec les prédictions du modèle, une alerte est soulevée.

Il est cependant important que ces alertes soient vérifiées par un humain. Les opérateurs chargés de remonter les alertes sont donc inclus au cœur du processus de création de la solution, porté par une équipe multidisciplinaire de data scientists et d’experts métier.

Compte-rendu rédigé par Joachim Carvallo, I-Tang Hiu et Axel Veillas, étudiants du Mastère Spécialisé Intelligence Artificielle promotion 2020-2021.

Illustration d’en-tête : site Airbus