Silicon.fr L'actualité informatique et high-tech pour décideurs IT

Google muscle sa puce TPU dédiée au Machine Learning

Google a présenté la seconde génération de sa puce TPU (Tensor Processor Unit) dédiée au Machine Learning et distribuée via Compute Engine.

Publié par Jacques Cheminat le 18 mai 2017 | Mis à jour le 2 mars 2021 à 15:00

Lecture
3 min

Imprimer

L'intelligence artificielle ne nécessite pas uniquement des développements d'algorithmes, elle suppose aussi des ressources informatiques performantes. Pour cela, Google a élaboré sa propre puce nommée TPU (Tensor Processor Unit) et l'a intégrée dans son infrastructure depuis 2015. C'est seulement en 2017 que la société a dévoilé quelques éléments techniques sur ce composant.

A l'occasion de la conférence Google I/O, la société a annoncé la deuxième génération de TPU, rebaptisée pour l'occasion Cloud TPU. Elle peut offrir des performances allant jusqu'à 180 Tflops en virgule flottante, en packageant 4 TPU capables de traiter 45 Tflops chacune. Dans un billet de blog, Jeff Dean, chercheur senior, et Urs Hölzle, vice-président de l'activité infrastructures Cloud chez Google, expliquent que « chaque TPU intègre une connectivité réseau haut débit permettant de construire des supercalculateurs dédiés au Machine Learning, appelés Pod TPU ». Ils ajoutent : « ce module intègre 64 TPU de seconde génération et peut traiter jusqu'à 11,53 Petaflops pour entraîner les modèles d'apprentissage automatique ».

Réduire le temps d'entraînement de l'IA

Cette course à la performance réduit le temps d'entraînement de l'IA, selon Mountain View. « Un de nos modèles de traduction à grande échelle prenait une journée pour s'aguerrir en monopolisant la puissance de 32 des meilleurs GPU du commerce. Maintenant, la formation se déroule avec la même précision, mais en une après-midi et en utilisant seulement un huitième du Pod TPU », peut-on lire sur le blog.

Les analystes sont restés un peu sur leur faim concernant les détails techniques de ces composants de seconde génération. Nos confrères de Top500 s'interrogent par exemple sur la nature des composants annoncés : 8, 16 ou 32 bits ? La première génération de TPU embarquait une puce 8 bits, pour des performances atteignant 92 Tflops. Le Cloud TPU devrait gérer des opérations 16 et 32 bits, estiment les journalistes de Top500, car ce processeur est conçu pour la formation de l'IA et nécessite donc des calculs plus complexes.

1000 Cloud TPU offerts aux chercheurs en IA

Cette annonce de Cloud TPU intervient au moment où Nvidia dévoile sa puce Tesla V100. Cette dernière affiche 5120 coeurs Cuda cadencés en pointe à 1455 MHz et capables de délivrer une puissance de calcul de 7,5 téraflops en double précision (15 téraflops en simple précision). Pour prendre en charge au mieux les applications de Deep Learning, 640 Tensor Cores sont intégrés par Nvidia. Ils permettent d'effectuer un très grand nombre de calculs, 120 téraflops (en 16 et 32 bits).

Pour conclure, Google a annoncé qu'il proposerait les performances de Cloud TPU dans le cadre de son offre Compute Engine. Pour susciter l'intérêt des utilisateurs, la firme de Mountain View met gratuitement 1000 TPU à disposition des chercheurs en Machine Learning.

AWS injecte du HPC dans son Cloud avec Nice

Cloud IoT Core, la tour de contrôle de l'IoT selon Google

Publié par :
Jacques Cheminat

Tags associés :

"Nous avons quitté le cloud" : S3, ultime étape d'un retour sur site

Par Clément Bohic le 7 avr. 2025

5 min.

50 ans de Microsoft : les sept vies de l'inventeur de Windows

Par Clément Bohic le 4 avr. 2025

OUTSCALE lance son Kubernetes managé : ce qu'il y a pour commencer

Par Clément Bohic le 28 mars 2025

Cloud de confiance : ce que recherche l'administration française

Par Clément Bohic le 19 mars 2025

Pourquoi OpenStack rejoint la Fondation Linux

Par Clément Bohic le 17 mars 2025

Livres Blancs

Signaturit

Cybersécurité et digitalisation Comment protéger les [...]

Ce livre blanc offre aux décideurs des solutions concrètes pour [...]

Télécharger

Palo Alto Networks

Leader des services de réponse à incident de cybersécurité

Les cyberattaques évoluent à une vitesse, dans des proportions et à des niveaux de sophistication sans précédent. [...]

Télécharger

Sigma

Comment optimiser la consommation énergétique d’un [...]

Votre datacenter pourrait réduire sa consommation d’énergie de 30 à 50 % !

Télécharger

audiocodes

Comment l'IA améliore la qualité de vos réunions ?

Optimisez vos réunions Teams ou Zoom avec des résumés automatiques personnalisés, des analyses intelligentes et [...]

Télécharger

Voir tous les livres blancs

Vos prochains événements

Voir tous les événements

5 juin 2025

Le grand dîner de Gala de la Communauté

Organisé par silicon.fr

Inscrivez-vous

3 juillet 2025

La Matinale Silicon - Zéro Trust

Organisé par silicon.fr

Inscrivez-vous

7 novembre 2024

La MasterClass Silicon - NIS2

Organisé par silicon.fr

REVIVRE EN IMAGES

Voir tous les événements

Inscrivez-vous à la Newsletter pour recevoir les dernières actualités

Abonnez-vous au magazine Silicon et profitez de contenus exclusifs !

Boostez votre expertise professionnelle en accédant aux informations clés de votre domaine.