Cloudflare : quand un ingénieur enfreint les règles

Limiter par erreur le trafic vers le site web d’un client peut avoir des conséquences fâcheuses sur un écosystème. Cloudflare veut rassurer.

Restreindre par erreur le trafic web d’un client peut avoir des conséquences regrettables sur tout un son écosystème. Cloudflare, conscient du risque, a livré sa version du « comment en est-on arrivé là » pour tenter de rassurer.

L’incident a débuté le 2 février lorsqu’un ingénieur réseau a reçu une alerte concernant une saturation, a déclaré dans un billet de blog le fournisseur NaaS (network-as-a-service).

L’alerte était associée à un pic de trafic soudain et extrême. « Le trafic de ce client est soudainement passé d’une moyenne de 1 500 requêtes par seconde, et une charge utile de 0,5 Mo par demande, à 3 000 requêtes par seconde (2x) et plus de 12 Mo de charge utile par requête (25x) », a expliqué Cloudflare.

« L’ingénieur en charge a identifié le domaine du client […] à l’origine de ce pic soudain de trafic entre Cloudflare et leur réseau d’origine, un fournisseur de stockage », a précisé le fournisseur.

Or le pic de trafic a entraîné une congestion qui a impacté d’autres clients et partenaires de Cloudflare. Un ingénieur de l’équipe aurait alors « décidé d’appliquer un mécanisme d’exécution pour empêcher la zone de tirer autant de trafic ».

Dans la confusion, ajoute la firme, le support client a cru, à tort, que la décision avait été prise « en raison d’une violation de contrat d’abonnement qui interdit l’utilisation du CDN [Cloudflare] en libre-service pour diffuser un contenu non HTML excessif. »

« Le client n’a en aucun cas été banni de Cloudflare et n’a pas perdu l’accès à son compte, mais son site web n’a plus fonctionné », a reconnu l’entreprise.

Cloudflare fait son mea-culpa

Une note sur Hacker News, dont The Register s’est fait l’écho, indique que la mesure a été appliquée sans avertissement et a entraîné l’indisponibilité du site et de l’API du client en raison de la lenteur des réponses entraînant des délais d’attente.

Et ce plusieurs heures durant.

Cloudflare a assuré ne pas avoir « de processus établi pour limiter les clients qui consomment de grandes quantités de bande passante, et n’a pas l’intention d’en avoir un. Cette mesure était une erreur, elle n’a pas été sanctionnée, et nous le regrettons profondément. »

La société américaine a indiqué établir des règles claires pour qu’un tel incident ne se reproduise pas. « Toute action entreprise contre un domaine client, payant ou non, nécessitera plusieurs niveaux d’approbation et une communication claire avec le client. »

(crédit photo © Adobe Stock)