Le FinOps, en filigrane de l'AWS re:Invent 2024
S'il a accordé peu de place au FinOps dans les principales annonces de la re:Invent, AWS a mis en avant des services aux multiples modèles économiques.
Facturé à l'instance, au port, au token, au vCPU... ou un peu de tout ça ? Les principales annonces qu'AWS a faites lors de la re:Invent 2024 ont englobé une certaine variété de services... et de modèles économiques.
Supervision des bases de données : une tarification spécifique au serverless
Avec CloudWatch Database Insights, le groupe américain intègre, dans son service de supervision, des tableaux de bord pour Aurora MySQL et PostgreSQL.
La facturation, horaire, est basée sur les ressources de calcul qu'exploitent les bases de données monitorées.
Pour les instances provisionnées, cela dépend du nombre moyen de vCPU utilisés. Dans la région Europe (Paris), cela revient à 0,0125 $/h/vCPU.
Pour Aurora Serverless v2, cela dépend du nombre d'ACU (unités de capacités) supervisées. Dans la région Europe (Paris), cela revient à 0,03125 $/h/ACU.
Il y a des frais séparés pour l'ingestion et le stockage des logs. Le niveau gratuit de CloudWatch donne accès aux données sur 7 jours glissants pour un indicateur : le niveau de charge.
Un mode "auto" pour EKS, facturé selon les instances et leur durée d'utilisation
Avec le mode Auto pour EKS, AWS configure et gère l'infra en plus du plan de contrôle. Certaines fonctionnalités qui seraient autrement gérées comme des add-on (attribution d'adresses IP aux pods, DNS local, pilote EBS...) sont alors incluses dans le coeur fonctionnel. On peut activer ce sur les nouveaux clusters et sur les clusters existants, à condition qu'ils utilisent au minimum Kubernetes 1.29.
La facturation est fonction des types d'instances EC2 gérées et de leur durée d'utilisation. Dans la région Europe (Paris), la tarification va de 0,00451 $/h pour les VM t4g.medium à 4,03344 $/h pour les x2iedn.metal et x2iedn.32xlarge.
Tarif au vCPU dégressif pour les noeuds EKS hybrides
Le mode hybride pour EKS permet d'intégrer, dans des clusters, de l'infrastructure localisée sur site ou en edge. Le client gère le matériel et les noeuds ; AWS, le plan de contrôle. Une offre alternative à EKS sur Outposts (où AWS gère le matériel et les noeuds EC2) et à EKS Anywhere (où le client héberge et gère le plan de contrôle).
Entre autres limites, les noeuds ne peuvent être intégrés qu'à des clusters EKS configurés en IPv4. Ils doivent par ailleurs exécuter Amazon Linux 2023, RHEL 8/9 ou Ubuntu 20.04/22.04/24.04.
La facturation, dégressive, est basée sur les heures vCPU. Il en coûte 0,20 $ par vCPU pour les 576 000 premières heures. Puis 0,014 $ pour les 576 000 suivantes. Et ainsi de suite jusqu'à 0,006 $ par vCPU au-delà de 11 520 000 heures.
Une flat fee pour les web apps Transfer Family
AWS Transfer Family donne accès à un serveur de transfert de fichiers géré (SFTP, FTP, FTPS, AS2) avec S3 ou EFS en back-end.
On peut désormais créer ses propres apps front-end sans code pour permettre aux utilisateurs authentifiés d'effectuer des opérations sur des buckets S3 spécifiques. Il est possible de placer ces web apps derrière CloudFront et de les héberger sur des noms de domaines personnalisés.
Au sein de l'offre Transfer Family, l'usage de ces web apps a une tarification spécifique : 0,50 $ par heure d'activation dans la région Europe (Francfort). Il existe une limite à 250 sessions uniques par tranche de 5 minutes. Il faut y ajouter le prix des requêtes S3 et de la bande passante.
AWS Verified Access : une tarification spéciale ressources non HTTP(S)
Alternative aux VPN et aux bastions, le service Verified Access s'ouvre - en preview - aux ressources non HTTP(S) : interfaces ENI, load balancers, instances et proxys RDS, réseaux dans les VPC...
La facturation repose sur deux éléments. D'un côté, le temps d'activité des endpoints : 0,23 $/h dans la région Europe (Irlande). De l'autre, les connexions : 0,001 $/h dans cette même région. Les 100 premières connexions sont gratuites pour chaque endpoint.
Du reranking à l'évaluation, les prix de l'inférence font foi sur Bedrock
L'API de Bedrock Knowledge Bases supporte désormais les modèles de reranking. À commencer par Amazon Rerank 1.0 et Cohere Rerank 3.5. Une région AWS en Europe est pour le moment couverte (Francfort).
En parallèle, AWS lance une preview de l'évaluation automatisée du RAG. Elle peut porter sur la fonction de récupération ou sur le workflow complet. Quatre régions AWS sont concernées pour commencer, dont celle de Paris.
Autre preview : celle de l'évaluation des modèles par un LLM (LLM-as-a-judge), dans cinq régions AWS dont celle de Paris.
Pour l'ensemble de ces services, la facturation dépend des prix d'inférence pour les modèles sous-jacents sur Bedrock.
Une réponse automatisée aux incidents facturée selon les dépenses AWS globales
Quatre des régions AWS en Europe accueillent un nouveau service automatisé de réponse aux incidents. Ses principales briques :
- Tri automatisé des alertes en provenance de GuardDuty et de Security Hub
- Console centralisée avec notifications préconfigurées, messagerie, transfert de fichiers, planification de visioconférences, etc.
- Outils d'investigation en self-service et contact en 24/7 avec des équipes AWS
La tarification dépend de la facture AWS globale pour les comptes connectés à ce service. En dessous de 125 000 $ dépensés, il en coûte 7000 $ pour la réponse automatisée aux incidents. On passe ensuite sur un système de tranches avec pourcentage dégressif (5 % des dépenses entre 125 000 et 250 000 $ ; 3,5 % jusqu'à 500 000 $ ; 1,5 % jusqu'à 1 M$ ; 0,5 % au-delà).
Data Transfer Terminal : au nombre de ports réservés
New York et Los Angeles accueillent les deux premiers Data Transfer Terminals d'AWS. Il s'agit d'emplacement physiques où l'on apporte ses supports de stockage pour effectuer des uploads sur des connexions dédiées.
Le service est pour chaque port provisionné (utilisé ou non), à raison de 300 $/h pour les transferts aux sein des USA et de 500 $/h pour des transferts vers l'UE. AWS n'affiche pas de tarifs pour les autres plaques géographiques.
Illustration principale
Sur le même thème
Voir tous les articles Cloud