NVIDIA ajoute des GPU refroidis par liquide pour soutenir une informatique durable et efficace

Dans l’effort mondial pour stopper le changement climatique, Zac Smith fait partie d’un mouvement croissant pour construire des centres de données qui offrent à la fois des performances élevées et une efficacité énergétique.

Il est responsable de l’infrastructure de périphérie chez Equinix, un fournisseur de services mondial qui gère plus de 240 centres de données et s’est engagé à devenir le premier de son secteur à être climatiquement neutre.

Nous avons 10 000 clients qui comptent sur nous pour les aider dans ce voyage. Ils exigent plus de données et plus d’intelligence, souvent avec l’IA, et ils le veulent de manière durable, a déclaré Smith, un diplômé de Julliard qui s’est lancé dans la technologie au début des années 2000 en créant des sites Web pour d’autres musiciens à New York.

Marquer des progrès en matière d’efficacité

En avril, Equinix avait émis 4,9 milliards de dollars d’obligations vertes. Ce sont des instruments de qualité investissement qu’Equinix appliquera pour réduire l’impact environnemental en optimisant l’efficacité de l’utilisation de l’énergie (PUE), une mesure industrielle de la quantité d’énergie utilisée par un centre de données qui va directement aux tâches informatiques.

Les opérateurs de centres de données tentent de réduire ce ratio encore plus près de l’idéal de 1,0 PUE. Les installations d’Equinix ont un PUE moyen de 1,48 aujourd’hui, ses meilleurs nouveaux centres de données atteignant moins de 1,2.

Equinix optimise l'efficacité des centres de données avec des GPU refroidis par liquide
Equinix progresse régulièrement dans l’efficacité énergétique de ses centres de données, mesurée par le PUE (encadré).

Dans un autre pas en avant, Equinix a ouvert en janvier une installation dédiée pour poursuivre les progrès en matière d’efficacité énergétique. Une partie de ce travail porte sur le refroidissement liquide.

Né à l’ère du mainframe, le refroidissement liquide mûrit à l’ère de l’IA. Il est maintenant largement utilisé dans les supercalculateurs les plus rapides au monde sous une forme moderne appelée refroidissement direct par puce.

Le refroidissement liquide est la prochaine étape du calcul accéléré pour les GPU NVIDIA qui offrent déjà une efficacité énergétique jusqu’à 20 fois supérieure sur les travaux d’inférence IA et de calcul haute performance que les processeurs.

L’efficacité grâce à l’accélération

Si vous basculiez tous les serveurs uniquement CPU exécutant l’IA et le HPC dans le monde entier vers des systèmes accélérés par GPU, vous pourriez économiser 11 000 milliards de wattheures d’énergie par an. C’est comme économiser l’énergie que consomment plus de 1,5 million de foyers en un an.

Aujourd’hui, NVIDIA ajoute à ses efforts de développement durable avec la sortie de notre premier GPU PCIe pour centre de données utilisant le refroidissement direct des puces.

Equinix qualifie le processeur graphique refroidi par liquide PCIe A100 80 Go pour une utilisation dans ses centres de données dans le cadre d’une approche globale de refroidissement durable et de capture de la chaleur. Les GPU sont en cours d’échantillonnage et seront généralement disponibles cet été.

Économie d’eau et d’électricité

Il s’agit du premier GPU refroidi par liquide introduit dans notre laboratoire, et c’est excitant pour nous car nos clients sont avides de moyens durables d’exploiter l’IA, a déclaré Smith.

Les opérateurs de centres de données visent à éliminer les refroidisseurs qui évaporent des millions de gallons d’eau par an pour refroidir l’air à l’intérieur des centres de données. Le refroidissement liquide promet des systèmes qui recyclent de petites quantités de fluides dans des systèmes fermés axés sur les points chauds clés.

Transformez un déchet en atout, dit-il.

Même performance, moins de puissance

Dans des tests distincts, Equinix et NVIDIA ont découvert qu’un centre de données utilisant un refroidissement liquide pouvait exécuter les mêmes charges de travail qu’une installation refroidie par air tout en utilisant environ 30 % d’énergie en moins. NVIDIA estime que le centre de données refroidi par liquide pourrait atteindre 1,15 PUE, bien en dessous de 1,6 pour son cousin refroidi par air.

Les centres de données refroidis par liquide peuvent également contenir deux fois plus d’informatique dans le même espace. C’est parce que les GPU A100 n’utilisent qu’un seul emplacement PCIe ; les GPU A100 refroidis par air en remplissent deux.

NVIDIA améliore l'efficacité avec des GPU refroidis par liquide
NVIDIA voit des économies d’énergie, des gains de densité avec le refroidissement liquide.

Au moins une douzaine de fabricants de systèmes prévoient d’intégrer ces GPU dans leurs offres plus tard cette année. Ils incluent ASUS, ASRock Rack, Foxconn Industrial Internet, GIGABYTE, H3C, Inspur, Inventec, Nettrix, QCT, Supermicro, Wiwynn et xFusion

Une tendance mondiale

Des réglementations établissant des normes d’efficacité énergétique sont en attente en Asie, en Europe et aux États-Unis. Cela motive également les banques et autres grands opérateurs de centres de données à évaluer le refroidissement liquide.

Et la technologie ne se limite pas aux centres de données. Les voitures et autres systèmes en ont besoin pour refroidir des systèmes hautes performances intégrés dans des espaces confinés.

La route vers la durabilité

C’est le début d’un voyage, a déclaré Smith à propos des débuts des accélérateurs grand public refroidis par liquide.

En effet, nous prévoyons de faire suivre la carte A100 PCIe par une version l’année prochaine utilisant le GPU H100 Tensor Core basé sur l’architecture NVIDIA Hopper. Nous prévoyons de prendre en charge le refroidissement liquide dans nos GPU de centre de données hautes performances et nos plates-formes NVIDIA HGX dans un avenir prévisible.

Pour une adoption rapide, les GPU refroidis par liquide d’aujourd’hui offrent les mêmes performances pour moins d’énergie. À l’avenir, nous nous attendons à ce que ces cartes offrent la possibilité d’obtenir plus de performances pour la même énergie, ce que les utilisateurs disent vouloir.

Mesurer la puissance seule n’est pas pertinent, la performance que vous obtenez pour l’impact carbone que vous avez est ce vers quoi nous devons tendre, a déclaré Smith.

En savoir plus sur nos nouveaux GPU refroidis par liquide A100 PCIe.

www.actusduweb.com
Suivez Actusduweb sur Google News


Ce site utilise des cookies pour améliorer votre expérience. Nous supposerons que cela vous convient, mais vous pouvez vous désinscrire si vous le souhaitez. J'accepte Lire la suite