Prévoir la panne d'un train : à la SNCF, ce sera bientôt possible

Grâce au Machine Learning et à des trains de plus en plus connectés, la SNCF s'est lancé dans un projet de maintenance prédictive, exploitant des algorithmes de Machine Learning. Les rames du Transilien servent de galop d'essai à ce projet.

Publié par La rédaction le 16 mars 2016 | Mis à jour le 2 mars 2021 à 12:51

Lecture
6 min

Imprimer

Prévoir les pannes des trains avant que celles-ci ne perturbent le trafic ferroviaire. Pour la SNCF, l'enjeu de la maintenance prédictive est évidemment majeur. Pas étonnant donc de voir la compagnie nationale s'y intéresser de près, d'autant que, dans le même temps, les trains eux-mêmes émettent de plus en plus de données, renseignant sur l'état de fonctionnement de leurs systèmes. « Pour optimiser la maintenance, nous cherchons à utiliser au mieux les données des trains, d'autant que les nouvelles fonctions qu'ils proposent sont elles-mêmes sources de complexité, donc de pannes », raconte Philippe de Laharpe, chef de projet télédiagnostic à la direction du matériel de la SNCF. Une volonté qui a conduit la compagnie à mettre le doigt dans l'engrenage du Big Data.

Philippe de Laharpe

« On a commencé par une analyse de 'Small Data', avec des analystes examinant les données envoyées par les rames, reprend le chef de projet. Rapidement, face à la croissance des volumes, on a développé des systèmes automatisés embarquant le savoir-faire des équipes pour mettre en place une maintenance corrective connectée. L'étape suivante consiste à passer à la maintenance proactive, capable de détecter une panne quand elle se produit mais n'a pas encore impacté l'exploitation ou encore d'analyser des signaux faibles, pas forcément prévus lors de la conception des rames, mais qu'on va valoriser via des analyses de plus en plus complexes. »

Un réceptacle Hadoop

C'est pour cette étape que la SNCF a décidé de miser sur les technologies de Machine Learning. Expérimentées dans le cadre d'un pilote portant sur une génération récente de trains Bombardier circulant sur le réseau Transilien, ces technologies vont très vite passer en phase de pré-production « afin de concrétiser les premiers résultats sur des données de production ». Le projet implique la direction du matériel, qui apporte des techniciens de télédiagnostic, la direction du digital de la compagnie nationale ainsi que le prestataire Quantmetry. La plate-forme technique - un datalake Hadoop couplé au framework d'analyse de données Spark - est amenée par VSCT, la DSI de Voyages-SNCF qui intervient comme fournisseur de services pour la SNCF.

Menées en 2015, les phases d'expérimentation ont permis de mettre en évidence quelques difficultés liées à l'emploi du Machine Learning. « Quand on construit un modèle avec une boîte noire algorithmique, la difficulté consiste à surveiller les dérives de ce modèle, analyse Héloïse Nonne, data scientist senior chez Quantmetry. Sans oublier les difficultés de communication avec les techniciens qui ont besoin de preuves tangibles pour intervenir. Par ailleurs, si l'objectif est de fiabiliser le matériel, encore faut-il savoir expliquer la panne, ce que ne propose pas le Machine Learning. »

S'intégrer à la chaîne de maintenance de la SNCF

Héloïse Nonne, data scientist senior chez Quantmetry

Le modèle doit aussi être amendé avec les données réelles de circulation des rames car, même à l'arrêt, un matériel continue à émettre des données qui ont toutes les chances de fausser le modèle si on les interprète comme des informations publiées pendant un trajet. Sans oublier une dérive bien connue des algorithmes d'intelligence artificielle : la sur-performance, autrement dit la propension des algorithmes à surinterpréter les événements, surtout dans des cas où, comme ici, on fait face à un taux de panne assez bas. « Les équipes métier ont donc retravaillé les modèles pour les améliorer », note Héloïse Nonne, pour qui la principale difficulté du projet résidait toutefois dans la maîtrise de la qualité des données et dans la gestion des sources hétérogènes d'informations. Un classique des projets Big Data.

De son côté, Philippe de Laharpe apporte une vision davantage tournée vers les métiers des défis qui attendent encore le projet. « Une des difficultés réside dans le fait que les matériels qui font l'objet du pilote connaissent assez peu de pannes. D'où la question : comment faire baisser ce taux déjà faible et à quel prix y parviendra-t-on ? Il faut aussi prendre en compte l'impact organisationnel, note le chef de projet. Traiter une panne probable signifie qu'il faut faire évoluer la façon de travailler, et changer les processus de maintenance ». Car, faire des prédictions de panne ne suffit pas ; ces dernières doivent s'intégrer dans un « système de management », comme dit Philippe de Laharpe, aux côtés d'autres sources d'alerte afin, en fonction de la sévérité de l'incident, de planifier la réparation dans le centre de maintenance idoine de la SNCF.

Un test sur 176 rames Bombardier

Malgré ces obstacles, Philippe de Laharpe se veut confiant. « Je suis à peu près convaincu du retour sur investissement de la solution », explique-t-il dans un entretien avec Silicon.fr. Et de citer un exemple mis en évidence lors du pilote, où les algorithmes prédisaient deux fois plus de pannes que les analystes métier. « Cela nous encourage à aller plus loin avec le Machine Learning, d'autant que les spécialistes des systèmes techniques que nous surveillons sont rares. Ce sont donc des compétences qui coûtent cher », remarque le chef de projet.

Début avril, la SNCF lancera donc un test grandeur nature, exploitant les données de 176 rames Bombardier du réseau francilien. Des trains qui possèdent chacun 7 ou 8 ordinateurs de bord, et émettent quelque 70 000 données par mois et par rame. Ces informations sont transmises toutes les 30 minutes aux systèmes d'information de la compagnie ferroviaire. « On va laisser les pannes apparaître comme avant et mesurer pendant 6 mois les améliorations qu'aurait pu amener l'application prédictive », explique Philippe de Laharpe. Des résultats qui permettront à l'entreprise de décider si le projet doit oui ou non être mis en production et généralisé. Car, au-delà même du matériel roulant, la maintenance prédictive a aussi un intérêt pour l'entretien des voies par exemple, comme l'a d'ailleurs montré le tragique accident de Brétigny-sur-Orge en juillet 2013. « Progressivement, tous les silos de l'entreprise ont vocation à rejoindre le datalake », note Philippe de Laharpe.

Big Data : le Machine Learning protège les Livebox Orange de la foudre

Big Data : Mappy accélère son cluster Hadoop. sans acheter de serveurs

Publié par :
La rédaction

Tags associés :

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Prévoir la panne d'un train : à la SNCF, ce sera bientôt possible

Un réceptacle Hadoop

S'intégrer à la chaîne de maintenance de la SNCF

Un test sur 176 rames Bombardier

OpenAI met GPT-4.5 en retrait : que retenir de cette parenthèse ?

Gouvernance des communications : qui se distingue sur ce marché [...]

AWS Summit : le RAG, au carrefour des stratégies GenAI

{ Tribune Expert } - La voie vers une véritable IA open source

MLPerf : la quête de benchmarks IA représentatifs

S’abonner

FFTO : Fiber To The Office ou la haute disponibilité [...]

L'UHD et la Transformation Numérique : Répondre aux [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Un réceptacle Hadoop

S'intégrer à la chaîne de maintenance de la SNCF

Un test sur 176 rames Bombardier

S’abonner

Partager l'épisode