Atlassian : une transition cloud remise en question ?
Publié par Clément Bohic le - mis à jour à
Certains clients d'Atlassian Cloud seront restés deux semaines privés d'accès. Que retenir de cet incident et de sa gestion ?
Quinze jours sans services Atlassian ? C'est ce qui est arrivé à certains clients de l'éditeur américain. Leur point commun : ils étaient sur l'édition Cloud.
La durée d'indisponibilité est une chose. La gestion du problème par Atlassian en est une autre. Dans les deux cas, il y a des choses à redire.
À la racine, il y a une erreur de maintenance. Le responsable : un script destiné à supprimer les données associées à un plug-in obsolète sur Jira (logiciel de suivi de projets). Il n'a pas fonctionné comme prévu ; supprimant en l'occurrence, chez les utilisateurs dudit plug-in, toutes les données du site Atlassian.
D'après la version officielle, il y a des soucis à deux niveaux. D'une part, l'équipe commanditaire a communiqué l'équipe exécutante de mauvais identifiants de ressources. De l'autre, les script a été exécuté en mode « suppression permanente » alors que celle-ci aurait dû être temporaire.
Les premières perturbations se sont fait ressentir lundi 4 avril. Excepté un court tweet du 7 avril, il a fallu attendre plus d'une semaine pour qu'Atlassian évoque publiquement le problème. D'abord par la voie de son CTO. Entre-temps, les clients touchés n'ont pas tous semblé trouver leur content dans les e-mails qu'on leur a adressés. Ou sur la page de statut des services Atlassian, où le même message s'est peu ou prou répété au fil des jours.
Le 12 avril, Atlassian estimait que la restauration de l'ensemble des sites affectés (« environ 400 clients ») pourrait prendre encore jusqu'à deux semaines. Il n'en a finalement fallu qu'une, à la faveur de l'optimisation de la procédure : traitement en lots, parallélisation, automatisation...
Atlassian défend sa dernière option on-prem
Atlassian promet un processus de restauration « en quelques heures » sur son édition Cloud. Mais cet engagement apparaît applicable uniquement lorsqu'il s'agit de faire une récupération de l'ensemble des locataires hébergés sur un datastore. Pour en récupérer uniquement certains, il faut le faire à la main. Sinon, on pénaliserait les clients non touchés - qui se retrouveraient au même niveau que les autres, à savoir un snapshot pris avant l'incident.
En toile de fond, la transition d'Atlassian vers le modèle cloud. Depuis février 2021, l'éditeur ne vend plus de licences Server pour ses produits (il en assurera le support jusqu'en février 2024). Ne reste plus qu'une option on-prem : Data Center. Plus complète, mais aussi plus chère : à partir de 27 000 $/an maintenance incluse pour Confluence, de 42 000 $ pour Jira, etc.
« Je suis content d'avoir obtenu une des dernières licences [Server] », commente un client dans le contexte de l'incident. D'autres appellent Atlassian à revoir ses plans... sans réponse de l'intéressé, sinon un lien vers la roadmap pour l'édition Data Center.
En matière de SLA, Atlassian accorde des compensations sous la forme de remises. Elles varient selon le niveau de support.
Illustration principale ©