Facebook repense l'architecture réseau de son dernier datacenter

En inaugurant son dernier datacenter dans l'Iowa, Facebook a repensé l'architecture réseau pour supporter l'évolutivité sans cesse croissante des besoins du média social.

Publié par Jacques Cheminat le 17 nov. 2014 | Mis à jour le 2 mars 2021 à 12:40

Lecture
3 min

Imprimer

Quand on s'appelle Facebook la question de la topologie réseau prend un sens particulier lors de la construction d'un datacenter. Les problématiques sont connues, un grand volume de données et de requêtes qui circulent tous les jours, un besoin de haute disponibilité en temps réel, la prise en charge des liens vers des clients et prestataires externes. Le réseau social a donc repensé son architecture traditionnelle de réseau avec l'extension de son datacenter à Altoona dans l'Iowa.

Ce dernier qui est alimenté par des énergies 100% renouvelables, via un parc éolien, a construit son réseau sur la technologie dite « data center fabric ». Alexey Andreyev, ingénieur réseau chez Facebook, explique dans un blog qu'il faut distinguer « le trafic « machine to user » qui se définit comme les requêtes, la création de contenu ou d'applications est très important, mais il s'agit de la partie émergée de l'iceberg. Le trafic « machine to machine » au sein du datacenter est en croissance exponentielle et le volume double en moins d'une année ». C'est sur ce dernier que datacenter fabric apporter une solution.

La limite des clusters

Pour faire face à ce niveau de trafic, Facebook avait habituellement une architecture sous forme de cluster de racks de serveurs avec un switch top of rack pour agréger différents commutateurs à forte densité de ports. Or cette topologie pose quelques problèmes en matière d'évolutivité, « la taille du cluster est limitée par le nombre de ports des commutateurs », précise l'ingénieur réseau. De même, il existe peu de produits fournis par les équipementiers capables de répondre aux exigences de la société de Menlo Park en termes de bande passante, mais aussi de maintenance opérationnelle du réseau.

Un saucissonnage en pod de 48 racks serveurs

D'où l'idée d'avoir une approche désagrégée de l'architecture réseau, « au lieu d'avoir des clusters avec beaucoup d'équipements réseaux, nous avons cassé le réseau en plusieurs petites unités identiques, des serveurs pods et créer une connectivité haute performance entre les pods au sein du datacenter ». La taille de ces petites unités est de 48 racks de serveurs. Chaque Pod est relié à 4 commutateurs fabric (spécialement élaboré par Facebook) avec des liens 40 G permettant d'atteindre une capacité de bande passante de 160 G pour un rack de serveurs connectés en 10 G.

Une partie software adaptée

L'avantage de cette solution modulaire est de pouvoir la répliquer au sein du datacenter et de requérir que des commutateurs basiques pour gérer l'agrégation top of rack. Cette simplicité autorise plusieurs options de routage via le protocole BGP 4 (le seul retenu par l'entreprise). Dans le même temps, Facebook souligne avoir travaillé sur un contrôleur BGP centralisé qui permet de contourner les chemins de routage via un logiciel. Cette approche flexible est dénommée « DCCO (distributed control, centralized override) ». Cela signifie aussi que le réseau social a élaboré son propre logiciel de gestion et de configuration du datacenter fabric. Quand la firme veut intégrer un nouvel équipement, il est automatiquement reconnu et configurer. Idem en cas de problème, cela ressemble au même processus que le décommissionnement d'une machine virtuelle.

Facebook renforce la sécurité des datacenters avec PrivateCore

Crédit Photo: Facebook

Publié par :
Jacques Cheminat

Tags associés :

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Facebook repense l'architecture réseau de son dernier datacenter

La limite des clusters

Un saucissonnage en pod de 48 racks serveurs

Une partie software adaptée

Crédit Photo: Facebook

RGPD : la Commission européenne défend son usage de Microsoft 365

OpenAI cherche à supprimer la contrainte commerciale de l'AGI

Economie IT : un coup de froid attendu pour 2025

Sa subvention CHIPS Act validée, Intel tourne la page Pat Gelsinger

Atos : l'État redépose une offre... à périmètre réduit

Les stations de travail dédiées à votre métier

Future of Work – Transformer le support et [...]

Focus sur les puces Apple : la puce M1 d’Apple change [...]

Comment prospérer dans un contexte imprévisible?

La MasterClass Silicon - NIS2

La Matinale Silicon : IA & Cybersécurité

Le grand dîner de gala de la Communauté