Newsroom

Datapred : modéliser les séries temporelles dans l’industrie

abstract-big-data-freepik
Ouvrant le cycle des séminaires du MS Big Data pour l’année 2019-2020, Nicolas Mahler, co-fondateur de la start-up Datapred, est venu présenter les activités de son entité et une étude de cas concrets, mettant en avant l’intérêt de bien modéliser les séries temporelles à l’aide du machine learning (apprentissage statistique).

Datapred est donc une start-up, éditeur de logiciels de machine learning spécialisés dans le traitement de séries temporelles. Elle compte aujourd’hui une quinzaine de personnes : mathématiciens, développeurs back end, chefs de projets et commerciaux.

Le logiciel Datapred est destiné aux grands groupes industriels disposant de bases de données conséquentes et de leviers de gain significatifs. Ils sont principalement appliqués à deux verticaux :

  • L’optimisation d’achats directs de matières premières, de commodités, et d’énergie.
  • L’optimisation de la performance industrielle (liée à la maintenance prédictive et la détection d’anomalies).

Ce logiciel repose sur un moteur de modélisation particulièrement efficace pour :

  • Gérer des données industrielles en continu.
  • Combiner plusieurs modèles de machine learning en temps réel.
  • Fournir des recommandations suffisamment explicables pour être utilisées avec confiance par des décideurs humains.
  • Se connecter aux bases de données du client et passer en production de façon automatisée.

Enfin, Datapred assure le suivi, la maintenance et le support du logiciel auprès du client. Cette approche permet d’analyser la pertinence de la modélisation et de son implémentation.

Application à l’achat de matières premières, de commodités et d’énergie

Cette application de Datapred concerne l’achat direct de grandes quantités de matières premières, pour plus de 20 millions d’euros, par les départements d’achat de grands groupes.

Il s’agit ici de combiner les prédictions d’un portefeuille diversifié de modèles avec des contraintes opérationnelles (capacités de stockage, niveaux de production à respecter, restrictions de trésorerie, contraintes logistiques) afin de proposer au client les moments opportuns pour acheter, et les quantités à acheter.

Pour cela, des données très diverses sont intégrées dans le logiciel : historique des prix de la matière première concernée, de données de marché, de données internes au client, de données contextuelles générales (par exemple relatives à la météo, aux jours de vacances, à des épisodes de pollution…).

Le logiciel est particulièrement utile lors des périodes de grande volatilité, lorsque les tendances de prix sont difficiles à déterminer. En pratique, il permet de réduire de 3 à 5% le coût lié à l’achat de la matière première, et est donc rentable pour des achats très conséquents. D’où les grands groupes visés par Datapred.

Application à la performance industrielle et à la détection d’anomalies

Cette application de Datapred concerne l’optimisation de la performance d’actifs industriels, particulièrement pour détecter des anomalies sur des chaînes de production, des parcs de machines, des moteurs…

Une grande difficulté de ce type d’application est l’absence ou la quasi absence d’anomalies répertoriées, soit parce qu’elles sont par nature peu présentes (les actifs observés étant très fiables), soit parce qu’il est complexe et cher de les collecter (les volumes de données à traiter en temps réel et leur hétérogénéité étant un obstacle).

Datapred surmonte cette difficulté en transformant un sujet a priori non supervisé en sujet supervisé :

  • Une première option est de construire, à horizon bien choisi, des prédictions sur des variables physiques représentatives des actifs observés, et d’utiliser l’erreur de prédiction comme signal d’anomalie.
  • Une option plus avancée est de définir un critère opérationnel lié au bon fonctionnement des actifs (par exemple, un taux de rendement pour un parc de machines) et de l’optimiser grâce au moteur de modélisation de Datapred.

Compte-rendu rédigé par Imane Aghmari, Emmanuel Doumard et Nicolas Louis, étudiants de la promotion 2019-2020 du Mastère Spécialisé Big Data de Télécom Paris.

(c) illustration Freepik