Quand l'érosion logicielle perturbe des bases de données
Publié par La rédaction le | Mis à jour le
L'équipe tech de Box revient sur le dysfonctionnement d'un de ses services de continuité, qui ne faisait pas l'objet de tests réguliers.
Box, victime du phénomène d'érosion logicielle ? Son équipe tech contextualise ainsi un incident survenu sur un outil de monitoring de bases de données. Elle en a tiré un court post-mortem, avec une morale : faites régulièrement faire de l'exercice à vos logiciels.
L'outil en question, nommé Spatula, avait été développé en 2016. Son rôle : détecter les bases de données plantées et rediriger le trafic. Il a récemment dysfonctionné sur la partie redirection. Une alerte est donc tout de même parvenue à l'administratrice, qui a dû résoudre le problème « à la main » un samedi à l'aube. Il lui a fallu du temps pour réapprendre le processus, « effacé de la mémoire collective depuis son automatisation », pour résumer les propos de Box.
Box instaure un régime à trois tests par jour
On a découvert par après que Spatula dysfonctionnait depuis quatre jours, en conséquence d'une mise à jour sur une autre partie de l'environnement. Le service étant peu sollicité, on ne s'était pas rendu compte du problème.
Dans ce contexte, Box a introduit une vérification synthétique sur une base de données test. Elle s'exécute trois fois par jour, à horaires fixes (8 heures, 15 heures et 18 heures), sur tout le pipeline. On a donc, en théorie, un temps de réaction maximal de 14 heures... confirmé dans le cadre du premier incident ayant suivi la mise en place de ce filet de sécurité.
À consulter en complément :
Des tests au CI : AXA et la gestion des applications legacy
OpenAI : gare à l'obsolescence
Obsolescence informatique : les propositions du Cigref aux fournisseurs
Photo d'illustration © Greentech - Adobe Stock