Safran Analytics, quand le big data boume la production

mercredi 10 juillet 2019

Lorenzo Battarra, ancien chercheur à Paris VII, senior data scientist chez Safran Analytics, est venu présenter à l’occasion du séminaire du MS Big Data du 13 juin les activités de son entité et une étude de cas sur les réseaux bayésiens.

Safran est un groupe industriel de haute technologie implanté sur tous les continents. Safran est un acteur incontournable dans les domaines de la propulsion et des équipements aéronautiques de l’espace et de la défense.

Avec l’avènement de la donnée, Safran a souhaité se doter d’un outil performant et centralisé dédié au traitement de la donnée. Que ce soit pour le développement, la fabrication de produits ou pour la logistique, la vente ou le support client, le volume de données traité est considérable. En outre, leurs traitements nécessitent un savoir-faire et une compétence de haut niveau, des moyens dédiés tel que des datacenters privés (pour préserver la confidentialité) et une expertise externe aux domaines métiers.

Safran Analytics

Safran Anaytics, lié à la maison mère du groupe est situé à proximité du plateau de Saclay et possède un effectif de 60 personnes. Actuellement l’entité bénéficie de 15 data scientists répartis en deux groupes. Premièrement, l’analyse des données de production (data manufacturing) : le suivi, la détection d’anomalies, la recherche de causes racines et les contrôle qualité. Le second domaine est le suivi après la livraison des pièces (data services) et inclut la maintenance prédictive, l’optimisation des opérations de maintenance, la business intelligence et le service après-vente.

Répondant à des sollicitations des autres entités du groupe, Safran Analytics doit faire face à des problèmes concrets tels que la recherche des causes d’anomalies de production. A cette fin, l’analyse s’appuie sur des séries temporelles ainsi que sur des données continues et catégorielles prélevées à chaque étape du processus de production (fourniture, process de fabrication, contrôle produit).

Technologies utilisées

Les méthodes de machine learning utilisées varient selon les problématiques : algorithmes d’apprentissage supervisés ou non supervisés, théorie des valeurs extrêmes, modèles de survie avec covariables, application de méthodes de Monte Carlo, étude des séries temporelles ou de réseaux bayésiens.

Etude de cas : réseaux bayésiens

L’étude de cas présentée lors de cette conférence concerne l’utilisation des réseaux bayésiens pour identifier les causes d’anomalies dans une chaîne de production.

La particularité des réseaux bayésiens est de modéliser le comportement d’un système complexe avec des données non-supervisées. Les réponses attendues par ce type d’analyse demeurent compréhensibles par le métier et s’appuient sur des méthodes probabilistes rigoureuses. Cette approche permet de définir un graphe orienté et acyclique qui réduit le nombre de paramètres caractérisant intégralement la probabilité d’occurrence des échantillons. L’orientation des liens entre deux nœuds représente une relation de cause à effet (et non de corrélation), relation pouvant être corrigée par les connaissances métier.

L’application de ces réseaux peut aboutir à des recommandations concrètes pour fiabiliser des chaînes de fabrication. Cependant, la phase d’exploration n’est pas encore achevée, et aucune application n’a pour le moment été industrialisée et mise à disposition des autres entités du groupe Safran.

En savoir plus sur Safran Analytics

Compte-rendu rédigé par Margaux Rodrigues et Thierry Golder, étudiants de la promotion 2018-2019 du Mastère Spécialisé Big Data de Télécom Paris.