Amazon Prime Video a-t-il basculé du serverless au monolithe ?

Pour des raisons de coûts comme de performances, Amazon a revu l'architecture d'un des services constitutifs de Prime Video.

Publié par Clément Bohic le 9 mai 2023 - mis à jour à 15:52

Lecture
4 min

Imprimer

Des microservices valent-ils toujours mieux qu'un monolithe ? La question n'a rien de nouveau, mais le cas de Prime Video alimente la réflexion.

L'équipe tech chargée de cette offre chez Amazon a récemment fait le point sur l'évolution d'un de ses outils. En l'occurrence, celui qui lui permet d'analyser la qualité des flux.

Cet outil, nous explique-t-on, n'était initialement pas conçu pour une exploitation à grande échelle (et ce n'en était pas l'objectif). Lorsque le volume de flux à analyser est devenu trop important, il a fallu réarchitecturer.

Trois grandes briques composent l'outil. La première convertit les flux en images et en tampons audio. La deuxième examine ces éléments à renfort d'algorithmes et envoie une notification en cas de problème. Et la troisième orchestre le processus.

La version d'origine suivait une approche « serverless-first » : Step Functions coordonnait des fonctions Lambda. Dans la pratique, le système a vite atteint un goulet d'étranglement - à environ 5 % de la charge attendue. Tout en occasionnant des coûts importants sur deux postes en particulier : l'orchestration et la communication entre microservices.

Tel qu'implémenté, l'outil multipliait les transitions d'état, ce qui faisait exploser la facture Step Functions. C'était sans compter le mécanisme de stockage intermédiaire mis en place à l'appui de S3. Pour réduire les tâches de conversion coûteuses en ressources de calcul, l'équipe Prime Video avait effectivement développé un microservice qui découpait les flux et les entreposait temporairement dans un bucket. Sauf qu'avec la multiplication du nombre de requêtes en provenance de la brique d'analyse, la facture S3 a là aussi... explosé.

Prime Video : les microservices en surcharge

Luca Bianchi, CTO de Neosperience et par ailleurs évangéliste AWS Serverless, note que l'équipe Prime Video n'explique pas ce qui a(urait) pu l'empêcher d'exploiter d'autres solutions de stockage comme EFS, facturée non pas au nombre d'appels, mais à l'usage. Il rappelle surtout les risques de surcharge que peuvent impliquer les architectures de microservices.

Nombre de pairs lui ont fait écho. Illustration avec Lambros Petrou, de Datadog. Son constat, dans les grandes lignes : les architectures distribuées sont peu aux tâches gourmandes en ressources de calcul.

The solution of the post was badly architected from the beginning. It was designed to be inefficient.
They could just bundle up processing in less Lambda functions, with less Step Functions orchestration, and still get a nice boost.

But no, let's scrap it because of servers.

- Lambros Petrou (@LambrosPetrou) May 5, 2023

Le choix initial d'une architecture orientée serverless peut s'expliquer par un manque de visibilité sur l'évolution des fonctionnalités de la solution. Et par là même de ses exigences. L'équipe Prime Video aurait donc privilégier une capacité à itérer rapidement.

Au final, elle se retrouve avec une tâche ECS unique. Finie l'analyse distribuée, toutes les briques sont relocalisées dans un processus. Les transferts se font en mémoire, éliminant la nécessité de stockage S3. L'orchestration est simplifiée en parallèle, au sein d'une même instance. Et il devient possible d'exploiter les plans d'économies (Savings Plans) d'EC2.

Ce basculement a permis d'économiser « 90 % en coûts d'infrastructure », tout en réutilisant beaucoup de code. Mais l'équipe Prime Video a-t-elle vraiment, comme elle le déclare, basculé des microservices au monolithe ? La formulation fait débat.

Adrian Cockroft est un ancien d'AWS, où il occupait le poste de directeur de la stratégie architecture cloud. Pour lui, l'équipe Prime Video n'a en aucun cas créé un monolithe. Elle a simplement optimisé son application serverless en combinant des services au sein d'un conteneur autoévolutif. Une pratique que l'intéressé dit recommander depuis des années (cf. vidéo ci-dessous).

Illustration principale © CDPiC - Adobe Stock

Publié par :
Clément Bohic

Tags associés :

#AMAZON

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Amazon Prime Video a-t-il basculé du serverless au monolithe ?

Prime Video : les microservices en surcharge

PC IA : une adoption entre enthousiasme et incertitude

RCS passe au chiffrement de bout en bout : iOS et Android réconciliés

Amazon Chime : le concurrent de Zoom bientôt débranché

WinRAR ajoute une option axée privacy sur Windows

Microsoft rendra-t-il Office plus cher en Europe au nom de la [...]

S’abonner

Optimisez votre gestion documentaire avec la GED

Simplifier l’architecture et améliorer la sécurité

Un guide pour sécuriser la connectivité des [...]

Réunir la connectivité et la sécurité

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Prime Video : les microservices en surcharge

S’abonner

Partager l'épisode