Cinq conseils pour faciliter une reprise après sinistre dans le cloud
En cas de sinistre, transférer les données et les applications, de manière sécurisée, vers une solution redondante, demeure essentiel et constitue depuis longtemps la norme. Pour certaines entreprises, le cloud s'est imposé comme une alternative idéale pour ce type d'usage. Mais, en situation d'urgence, il est important de garder à l'esprit quelques éléments essentiels pour que l'opération se déroule sans heurts.
Très souvent, lorsque l'automatisation fait défaut, les économies réalisées sont rapidement annihilées par le temps passé par les services informatiques à effectuer des restaurations purement manuelles. Car en cas d'urgence, toutes les données et applications doivent être transférées dans l'infrastructure de secours prévue dans le cloud. Or, chaque transfert supplémentaire que le personnel informatique peut avoir à effectuer réduit l'efficacité du processus de reprise après sinistre et coûte de l'argent.
Afin de réagir au mieux face à ce type d'imprévu, voici cinq points clés pour gérer les opérations de reprises après sinistre de manière fiable via le multi-cloud, tout en respectant les délais impartis :
Différencier les applications
Chaque application métier a une valeur spécifique pour l'entreprise et, par conséquent, ses propres exigences en matière de délais de reprise. De nos jours, les services dits sensibles ne doivent pas connaître une panne de plus de 15 minutes. Les critères se reflètent dans leurs objectifs de temps de récupération (RTO) et leurs objectifs de points de récupération (RPO).
Pour simplifier, le RPO indique la quantité de données que l'application peut se permettre de perdre pendant la panne, tandis que le RTO définit combien de temps peut s'écouler, avant que tous les éléments de l'application ne fonctionnent à nouveau correctement. Toute stratégie de reprise après sinistre doit donc être planifiée en fonction des RTO et des RPO. Pour les applications sensibles, il est nécessaire d'utiliser une technologie de transfert ou de réplication des données pour respecter un délai RPO de 15 minutes.
> Trouver des automatismes
Pour assurer une reprise rapide à partir du cloud et prévenir les pannes liées à des erreurs humaines, il est essentiel d'automatiser les processus de reprise après sinistre. La solution idéale serait de pouvoir déclencher l'ensemble du processus en un seul clic. Cela est essentiel du point de vue du service IT, en cas d'incidents majeurs causés par exemple par une inondation ou un incendie, car certains employés peuvent ne pas être disponibles, ou mal réagir sous stress, dans de telles circonstances. En outre, de nombreuses applications métier sont compliquées et parfois interdépendantes, et donc potentiellement mises de côté en cas d'urgence. Le manque d'automatisation pour l'ensemble de l'application, incluant les multiples couches et dépendances, peut entraîner des temps d'arrêt plus longs et plus coûteux. L'ensemble du processus de reprise après sinistre dans le cloud doit donc être automatisé au maximum.
> Tester le processus
Il n'y a qu'une seule manière de savoir si le processus fonctionne et le temps qu'il peut prendre, c'est de le tester. Pour s'assurer du bon fonctionnement de leur plan de reprise après sinistre, les entreprises doivent tout simplement pouvoir le tester simplement et régulièrement.
> Imaginer différents scénarios
Les entreprises qui intègrent le cloud dans leur stratégie de reprise en cas de sinistre doivent pouvoir déterminer avec souplesse le niveau de détails avec lequel elles souhaitent restaurer les applications et les données. Ont-elles juste besoin de modifier quelques machines virtuelles. Ou au contraire doivent elles modifier un grand nombre d'applications complexes à plusieurs niveaux, voir un data center dans son intégralité ? La stratégie de reprise se doit d'être en mesure de cartographier ces différents scénarios avec souplesse et simplicité.
Le niveau de détail de la prise après sinistre est essentiel, car il permet de déterminer si le plan idéal peut être mis en oeuvre en détail par application et scénario, de la restauration de machines virtuelles individuelles ou d'applications, à la restauration de data centers de données dans leur intégralité.
> Définir une stratégie au-delà des frontières du cloud
Il est inefficace d'utiliser un outil différent pour chaque environnement cloud. Une vue d'ensemble est alors impossible car des outils divers décomposent la structure informatique en fragments individuels du point de vue de la reprise après sinistre. Le risque de coûts d'exploitation plus élevés et des pannes plus longues augmente inévitablement.
Si une entreprise utilise déjà différents environnements cloud pour héberger plusieurs applications, il est recommandé de mettre en place une stratégie de reprise après sinistre qui exploite toutes les possibilités du multi cloud et en limite les frontières. Procéder de la sorte augmente ainsi considérablement l'efficacité tout en réduisant les coûts engagés et les risques.
Selon une étude Enterprise Strategy Group, 51% des entreprises autorisent des temps d'arrêt de moins d'une heure. Mais seulement 22% atteignent un taux de réussite de 90% dans leurs propres tests de récupération.
Les approches qui souffrent d'un manque de visibilité globale, sont le plus souvent inefficaces, imprévisibles, et surtout créent un risque de défaillance plus élevé.
Il existe des solutions qui permettent aux entreprises d'assurer de manière proactive et fiable la résilience dans des environnements multi-cloud comme Amazon Web Services ou Microsoft Azure par exemple. L'avantage de ces applications dédiées réside dans des plans de reprise personnalisables et entièrement automatisés qui garantissent une reprise après sinistre fiable et un temps de disponibilité maximal, même pour les applications complexes.
Les entreprises ont ainsi une vision globale et prédictible de la résilience de leurs applications sensibles grâce à des procédures de tests de reprise d'activité après sinistre.
Sur le même thème
Voir tous les articles Cloud