Le calcul de l'IA : la chimère des temps modernes

Pour passer des applications professionnelles les plus courantes en entreprise à une IA d'avant-garde, les organisations nécessitent des infrastructures flexibles et efficaces.

Publié par Jeff Wittich Chief Product Officer Ampere le 3 sept. 2024 | Mis à jour le 18 sept. 2024 à 11:13

Lecture
4 min

Imprimer

La chimère est une créature mythique de la mythologie grecque : un monstre à deux têtes, lion et bouc, avec un corps de chèvre et une queue de serpent, crachant des flammes quand il respire. Aujourd'hui, on emploie le terme « chimère » pour décrire « un concept reposant sur plusieurs idées ».

On peut ainsi imaginer le calcul de l'intelligence artificielle comme une chimère des temps modernes, composée elle aussi de plusieurs entités : un CPU (central processing unit) et un DSA (domaine specific accelerator). Comme la créature mythique, cet hybride technologique possède des forces distinctes. Quand ces forces sont combinées, elles libèrent une puissance formidable.

Le CPU règne en maître du contrôle et de la logique, orchestrant les tâches et maintenant l'ordre. Le DSA excelle avec ses prouesses de traitement uniques, s'attelant aux calculs répétitifs essentiels à l'IA.

La connexion entre les deux composants assure une communication fluide et un transfert de l'énergie, dotant l'ensemble de de capacités de calculs hors-normes.

Calcul de l'IA : combiner les CPUs et les DSAs pour traiter le cloud et l'IA avec succès

Avec la croissance exponentielle de la demande de calcul, trouver l'équilibre et concevoir des capacités de traitement suffisantes est difficile. Pour passer des applications professionnelles les plus courantes en entreprise à une IA d'avant-garde, les organisations nécessitent des infrastructures flexibles et efficaces.

C'est là que la combinaison CPU- DSA rentre en jeu.

Les CPUs s'apparentent au cerveau de l'ordinateur, traitant avec polyvalence une multitude de tâches. Il faut les voir comme la tête pensante derrière les applications professionnelles, les bases de données et les serveurs web.

Ces puces généralistes excellent dans le traitement séquentiel et la gestion d'une multitude de tâche. Les CPU peuvent traiter à eux seuls des modèles traditionnels d'inférence IA avec des LLMs de petite taille. Par contre, pour maximiser la puissance de calcul, il faut miser sur les DSAs.

Les DSAs sont adaptés aux tâches de traitement d'IA car ils sont particulièrement rapides et peuvent effectuer des calculs répétitifs en simultané. Ils englobent différents types de puces : GPU, TPU, ASIC, FPGA ou VPU. Leurs forces respectives en font les moteurs de l'inférence IA. Quand il s'agit des grands modèles de langage (LLM) ou de modèles et set de données spécialisés, les DSAs fournissent la puissance brute supplémentaire qui est nécessaire.

Pourquoi combiner CPUs et DSAs ?

Voilà comment la magie opère :

> Une polyvalence rentable : en utilisant en même temps des CPUs et des DSAs, l'environnement cloud devient plus flexible. Les workloads traditionnels sont traités en douceur par les CPUs, alors que les tâches d'inférences IA, plus denses et plus spécialisées, sont relayées par les DSAs. Cette répartition des tâches entre CPU-DSA délivre une puissance accélérée, alloue efficacement les ressources et optimise les coûts.

> Des workflows fluides : pour les applications d'IA complexes, les CPUs et les DSAs sont complémentaires. Les CPUs peuvent prendre en charge le pré-traitement des données, la coordination des tâches et la gestion générale. Quant aux DSAs, ils s'attaquent aux calculs les plus lourds et les plus spécialisés du modèle d'IA.

> Une scalabilité simplifiée : les environnements cloud qui combine des instances de CPU et de DSA peuvent être déployés à grande échelle plus facilement ou, au contraire, diminués en fonction des exigences de workloads et d' inférence IA, assurant une allocation optimale des ressources.

L'IA deviendra un prérequis pour toutes les applications

Il faut ne faut plus isoler l'IA. A l'avenir l'IA sera un composant essentiel pour tout service ou application. Il faut concevoir les prochaines générations de serveurs avec un maximum de cores et d'accélérateurs d'IA pour qu'ils puissent opérer sur le long-terme.

Comme les serveurs restent plus longtemps en service, les entreprises doivent équiper leur infrastructure de nouvelle génération d'un maximum de coeurs de calcul et d'accélération de l'IA. Elles s'assurent ainsi que leurs services répondent aux exigences actuelles et futures.

Jeff Wittich, Chief Product Officer - Ampere.

Publié par :
Jeff Wittich Chief Product Officer Ampere

Tags associés :

#AVIS-EXPERT

sponsorisé

Gestion de crises : les leçons d’un DSI

Gestion de crises : les leçons d’un DSI17:35

SNCF Connect & Tech explore toutes les voies de la rés…23:13

D'une mine à la supply chain, de l'OT à l’industrie 4.…22:33

Champs d'application et exigences NIS220:52

Retour d'expérience : mise en œuvre des exigences par…20:42

Comment simplifier la sécurisation de votre réseau tou…20:23

Sécurité renforcée : comment préparer la conformité à…20:56

Le savoir-faire règlementaire international de Cloudfl…20:32

Se protéger et remédier aux Attaques de Messagerie : U…21:48

[Episode en public] Les leçons de résilience d’OVH29:04

[Énergie] La résilience du réseau et sa mesure d'impact19:43

SASE : La fusion du SD-WAN et du SSE décryptée07:42

Quand la cyber-résilience investit l’espace16:31

Sécurité Multicouche : La clé pour une entreprise rési…16:11

Remettre l’humain au centre du cyber-espace16:55

L’IA, super-pouvoir du cyberespace09:39

Les enjeux de sécurité des médias internationaux de la…14:32

L’IA, un atout pour une continuité de service public p…16:50

Une cyber-résilience à l’aune de l’IA et des régulatio…19:25

Tous les Internets se valent-ils ?10:59

Decathlon : une culture agile à l’international20:08

Comment Carrefour a transformé la crise sanitaire en t…12:48

Comment Groupama s’assure d’être résilient face aux cr…13:48

Comment impulser une culture data dans une grande entr…14:17

Hors-série : La data du futur (Volume 1)08:28

Cegid : la tête dans le Cloud22:16

Hors-série : La data du futur (Volume 2)07:30

La data au service des verres intelligents chez Essilo…09:42

La vision conseil de Deloitte sur la data et l’IA19:04

Data altruisme et IA responsable au Crédit Mutuel Arkéa11:54

[BONUS] La Data Responsable : une vision écologique23:08

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Le calcul de l'IA : la chimère des temps modernes

Calcul de l'IA : combiner les CPUs et les DSAs pour traiter le cloud et l'IA avec succès

Pourquoi combiner CPUs et DSAs ?

L'IA deviendra un prérequis pour toutes les applications

La CNIL face aux limites du chiffrement homomorphe

Avec les LLM, peut-on concilier qualité et diversité des réponses ?

De l'UX à l'AX : penser les interfaces pour les agents IA

IA et copyright : la perspective d'une norme IETF réconciliatrice

Les avancées d'Open R1, ce projet qui veut reproduire les [...]

S’abonner

Sécuriser les solutions de communications unifiées et [...]

Optimisez votre gestion documentaire avec la GED

Simplifier l’architecture et améliorer la sécurité

Un guide pour sécuriser la connectivité des [...]

Le grand dîner de Gala de la Communauté

La Matinale Silicon - Zéro Trust

La MasterClass Silicon - NIS2

Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Calcul de l'IA : combiner les CPUs et les DSAs pour traiter le cloud et l'IA avec succès

Pourquoi combiner CPUs et DSAs ?

L'IA deviendra un prérequis pour toutes les applications

S’abonner

Partager l'épisode