De l'APM à l'observabilité : ce qui change à part la terminologie
Publié par Clément Bohic le - mis à jour à
Le Magic Quadrant de l’APM (gestion de la performance applicative) est devenu celui de l’observabilité. Quelles sont les forces en présence ?
De l'APM à l'observabilité, la transition est bouclée ? Elle l'est en tout cas dans l'intitulé du Magic Quadrant consacré à ce segment de marché : le premier terme, que Gartner utilisait depuis 15 ans, a laissé place au second.
Autre changement d'une année sur l'autre : les critères d'évaluation du contenu des offres. Ils ont évolué essentiellement dans leur forme. Il ne s'agit plus d'en respecter une liste précise, mais de proposer tous les éléments définis comme « obligatoires » et « une majorité » de ceux définis comme « communs »...
Les éléments obligatoires sont au nombre de trois et s'avèrent assez génériques :
- Ingestion, stockage et analyse de télémétrie, dont métriques, événements, logs et traces
- Identification et analyse du comportement des applications, des services ou de l'infrastructure
- Enrichissement de la télémétrie (cartographie des dépendances et des relations entre services)
Les éléments jugés communs touchent notamment à la gestion des coûts, au suivi des processus, au DEX (gestion de l'expérience digitale) et à la sécurité applicative. Cette année, Gartner ne liste pas de briques « facultatives » (en 2023, il avait évoqué, entre autres, la prise en charge des outils de test de charge et la gestion de la télémétrie SaaS).
Aux critères fonctionnels s'ajoute la nécessité de figurer dans le haut du panier sur le « score d'intérêt client ». Cet indicateur, que Gartner tend désormais à mettre en avant dans ses Magic Quadrants, se fonde sur des données internes au cabinet (volumes de demandes de la part des clients, de mentions dans les Peer Insights...) et externes (trafic web, réseaux sociaux, tendances de recherche...).
Elastic et Grafana Labs, nouveaux « leaders » de l'observabilité
Des cinq fournisseurs « leaders » l'an dernier, quatre le sont restés : Datadog, Dynatrace, New Relic et Splunk. Honeycomb a rétrogradé dans le carré des « visionnaires ». Il a donc reculé sur l'axe « exécution », qui mesure la capacité à répondre effectivement au marché (expérience client, performance avant-vente, qualité, des produits/services...).
Chemin inverse pour Elastic et Grafana Labs, passés de « visionnaires » à « leaders ». Ils côtoient, dans ce carré, un nouvel entrant : Chronosphere. Une entreprise fondée par des anciens d'Uber qui avaient développé, en son sein, la base de données de séries chronologiques M3DB.
Broadcom, ManageEngine et Riverbed ont tous trois disparu du Magic Quadrant de l'observabilité, faute d'être au niveau sur le score d'intérêt client.
La situation sur l'axe « vision », qui reflète les stratégies (sectorielle, géographique, commerciale, marketing, produit...) :
Fournisseur | Évolution annuelle | |
1 | Dynatrace | = |
2 | Datadog | + 2 |
3 | Chronosphere | nouvel entrant |
4 | New Relic | - 2 |
5 | Honeycomb | + 1 |
6 | Splunk | + 2 |
7 | Grafana Labs | = |
8 | ServiceNow | - 5 |
9 | LogicMonitor | nouvel entrant |
10 | Elastic | - 5 |
11 | IBM | + 4 |
12 | Logz.io | - 3 |
13 | AWS | - 2 |
14 | Oracle | - 2 |
15 | Microsoft | - 5 |
16 | BMC | nouvel entrant |
17 | Sumo Logic | - 1 |
Sur l'axe « exécution » :
Fournisseur | Évolution annuelle | |
1 | Dynatrace | = |
2 | Datadog | = |
3 | AWS | + 1 |
4 | New Relic | - 1 |
5 | Grafana Labs | + 5 |
6 | Splunk | = |
7 | Chronosphere | nouvel entrant |
8 | Microsoft | - 1 |
9 | Elastic | + 4 |
10 | LogicMonitor | nouvel entrant |
11 | Honeycomb | - 3 |
12 | Oracle | - 1 |
13 | IBM | - 4 |
14 | ServiceNow | - 2 |
15 | BMC | nouvel entrant |
16 | Logz.io | - 2 |
17 | Sumo Logic | - 2 |
Chronosphere entre par la grande porte
Gartner n'a évalué que les plates-formes SaaS. Dans ce contexte, il donne un bon point à l'architecture monolocataire de Chronosphere. Le cabinet américain salue aussi des contrôles d'ingestion « qu'on trouve chez peu de concurrents » et qui permettent un échantillonnage dans une optique d'optimisation des coûts. Autre point fort : une prise en charge exhaustive d'OpenTelemetry, assortie de l'acquisition de Calyptia, qui apporte un autre outil open source (Fluent Bit).
Vigilance sur l'hébergement, pour le moment disponible uniquement aux États-Unis. On notera aussi l'absence de capacités DEM spécifiques (monitoring synthétique, surveillance des utilisateurs dans les apps web ou mobiles...). Et la nécessité, à défaut d'agent, d'instrumenter ses workloads soit pour qu'ils soient compatibles avec Prometheus ou OpenTelemetry, soit pour qu'ils utilisent un format supportant Fluent Bit.
Datadog rapide pour livrer, moins pour rationaliser
L'an dernier, Gartner avait relevé, chez Datadog, une difficulté à contrôler les coûts à mesure que l'usage croît. Constat renouvelé cette année. Même chose pour la multiplicité des produits (une vingtaine de lignes), qui complique la lisibilité de l'offre. S'y ajoute des manques en matière de gestion de flotte, ce qui peut complexifier les gros déploiements.
Datadog a pour lui la capacité à livrer rapidement de nouvelles fonctionnalités (APM, gestion des logs, DEM, sécurité). Gartner apprécie aussi les possibilités offertes en matière de visualisation (prise en main, personnalisation). Et la roadmap produit, axée sur l'unification avec le DevSecOps et l'automatisation.
Dynatrace couvre large... mais pas le mid-market
Dynatrace se distingue pour sa part sur le volet IA. Gartner salue aussi la transversalité de son portefeuille, des mainframes aux conteneurs. Bon point également pour l'extensibilité, avec des briques permettant de créer des applications et des automatisations spécifiques.
En 2023, Dynatrace a lancé un modèle de tarification « drawdown » permettant de piocher dans le catalogue en restant sur un même contrat. Il suppose un engagement minimal annuel. Aussi Gartner appelle-t-il à la prudence. Le cabinet américain regrette aussi l'inadaptation de l'offre aux PME (au sens de Gartner = jusqu'à 999 employés) et l'adoption lente du mécanisme d'ingestion massive de logs lancé l'an dernier.
Elastic : de l'extensibilité, mais du travail de prise en main
L'intégration de l'IA vaut aussi un bon point à Elastic (une trentaine de modèles ML, des capacités de personnalisation, un assistant avec RAG...). Même chose pour son architecture ouverte. Trouvant ses racines dans Elasticsearch, elle favorise l'extensibilité. Gartner évoque aussi la variété des options de déploiement, en soulignant l'existence d'une version on-prem « largement comparable » aux versions cloud du point de vue fonctionnel.
Attention, néanmoins, à la courbe d'apprentissage des solutions d'observabilité d'Elastic. Elles ont, par ailleurs, moins de notoriété que les autres offres de l'éditeur (recherche et sécurité). Le modèle économique, basé sur les ressources de calcul, peut en outre rendre difficile l'estimation des coûts.
Grafana Labs salué pour la composabilité, moins pour la prédicitibilité des coûts
Comme Datadog, Grafana Labs a pour lui la rapidité de livraison de nouvelles fonctionnalités. Dernièrement, il a ajouté, par exemple, de l'observabilité front-end, une gestion du SLO et des métriques adaptatives. La couverture géographique de son offre (hébergée dans une vingtaine de régions chez les « trois grands » du cloud d'infrastructure) est un autre avantage. Gartner y ajoute une composabilité « difficile à reproduire chez d'autres fournisseurs ». Elle repose sur les capacités d'intégration de dépôts de télémétrie tiers.
Comme chez Elastic, on prendra garde à la courbe d'apprentissage. En particulier sur la configuration, qui nécessite souvent l'édition manuelle de YAML ou de JSON. La prédictibilité des coûts est un autre écueil, surtout pour les nouveaux utilisateurs, vu les indicateurs utilisés (« séries actives » et points de données par minute). Gartner exprime aussi une inquiétude quant aux relations délicates de Grafana Labs avec les autres fournisseurs d'observabilité.
New Relic : un plus pour le monitoring de l'IA, un moins pour l'implémentation
New Relic a pour lui un licensing flexible. À la formule fondée sur le volume ingéré et le nombre d'utilisateurs s'est récemment ajoutée une option basée sur le compute. Autre point fort : le monitoring des stacks IA, LLM compris. Gartner apprécie aussi la plate-forme sous-jacente, construite sur une base de données maison (New Relic Database).
L'implémentation et la configuration peuvent se révéler complexes, affirme Gartner sur la foi de retours clients. Les options d'hébergement restent limitées (Allemagne et USA, et essentiellement sur AWS). On surveillera aussi l'impact de l'acquisition de New Relic par les fonds TPG et Francisco Partners - c'était fin 2023.
Splunk : des inconnues sous l'ère Cisco
Splunk figure toujours au Magic Quadrant de l'observabilité, Gartner ayant arrêté ses relevés avant que Cisco en finalise l'acquisition.
Le niveau de support d'OpenTelemetry reste un point fort. Disponible pour Windows, Linux et Kubernetes, le connecteur dispose d'un support commercial. Bon point également sur la gestion des SLO, avec un workflow spécifique pour paramétrer via l'UI ou via Terraform. Gartner apprécie aussi le niveau d'unification de l'offre.
Outre l'impact de l'acquisition par Cisco, Gartner questionne la présence géographique de l'offre Splunk Observability Cloud : son empreinte est quatre fois moins importante que celle du bundle Splunk Cloud. Comme en 2023, le modèle économique fait l'objet d'un appel à la vigilance. Splunk Observability Cloud a des licences par hôte ou à l'usage (métriques et traces analysées par minute). Tandis que Splunk Enterprise fonctionne au volume ingéré ou par workload.
Illustration