NVIDIA dévoile la plate-forme de superpuce GH200 Grace Hopper de nouvelle génération pour l’ère du calcul accéléré et de l’IA générative
Le premier processeur HBM3e au monde offre une mémoire et une bande passante révolutionnaires ; Possibilité de connecter plusieurs GPU pour des performances exceptionnelles ; Conception de serveur facilement évolutive
SIGGRAPH—NVIDIA a annoncé aujourd’hui la plate-forme NVIDIA GH200 Grace Hopper ™ de nouvelle génération – basée sur une nouvelle puce Grace Hopper avec le premier processeur HBM3e au monde – conçue pour l’ère de l’informatique accélérée et de l’IA générative.
Créée pour gérer les charges de travail d’IA génératives les plus complexes au monde, couvrant de grands modèles de langage, des systèmes de recommandation et des bases de données vectorielles, la nouvelle plate-forme sera disponible dans une large gamme de configurations.
La configuration double – qui offre jusqu’à 3,5 fois plus de capacité de mémoire et 3 fois plus de bande passante que l’offre de génération actuelle – comprend un seul serveur avec 144 cœurs Arm Neoverse, huit pétaflops de performances AI et 282 Go de la dernière technologie de mémoire HBM3e.
« Pour répondre à la demande croissante d’IA générative, les centres de données ont besoin de plates-formes informatiques accélérées avec des besoins spécialisés », a déclaré Jensen Huang, fondateur et PDG de NVIDIA. « La nouvelle plate-forme GH200 Grace Hopper Superchip offre cela avec une technologie de mémoire et une bande passante exceptionnelles pour améliorer le débit, la possibilité de connecter des GPU pour agréger les performances sans compromis et une conception de serveur qui peut être facilement déployée dans l’ensemble du centre de données. »
La nouvelle plate-forme utilise la Grace Hopper Superchip, qui peut être connectée à des Superchips supplémentaires en NVIDIA NVLink™, leur permettant de travailler ensemble pour déployer les modèles géants utilisés pour l’IA générative. Cette technologie cohérente à grande vitesse donne au GPU un accès complet à la mémoire du processeur, fournissant une mémoire rapide combinée de 1,2 To en configuration double.
La mémoire HBM3e, qui est 50 % plus rapide que la HBM3 actuelle, offre un total de 10 To/sec de bande passante combinée, permettant à la nouvelle plate-forme d’exécuter des modèles 3,5 fois plus grands que la version précédente, tout en améliorant les performances avec une bande passante mémoire 3 fois plus rapide.
Demande croissante pour Grace Hopper
Les principaux fabricants proposent déjà des systèmes basés sur la puce Grace Hopper Superchip annoncée précédemment. Pour favoriser une large adoption de la technologie, la plate-forme Grace Hopper Superchip de nouvelle génération avec HBM3e est entièrement compatible avec le NVIDIA MGX™ spécification de serveur dévoilée au COMPUTEX plus tôt cette année. Avec MGX, n’importe quel fabricant de système peut rapidement et à moindre coût ajouter Grace Hopper à plus de 100 variantes de serveur.
Disponibilité
Les principaux fabricants de systèmes devraient livrer des systèmes basés sur la plate-forme au cours du deuxième trimestre de l’année civile 2024.
Regarder Huang Discours SIGGRAPH adresse sur demande pour en savoir plus sur Grace Hopper.
