与Hopper相比,NVIDIA的BlackwellB200GPU采用了全新的架构,但功耗几乎是Hopper的两倍。
NVIDIABlackwellGPU额定功率高达1200W,多种配置且均采用全新架构
当NVIDIA首席执行官黄仁勋在GTC2024主题演讲期间宣布Blackwell时,该披露缺乏大量技术和架构信息。但在接下来几天的GTC中,NVIDIA分享了更多细节,但仍然没有深入探讨我们都在等待的技术深入。JonahAlbe(NVIDIA高级副总裁兼GPU架构师)和IanBuck(NVIDIA超大规模与HPC副总裁)透露了新的细节。
BlackwellGPU——专为AI时代打造全新架构
首先,我们都知道Blackwell将是对Hopper的重大架构升级,而且乔纳表示Blackwell使用与Hopper完全不同的微架构,看起来还不止于此。
我们对Blackwell的了解是,它采用了第二代TranormerEngine技术,增加了FP4和FP6计算格式。这些格式和新的软件优化使Blackwell成为地球上同类中最快的AI,但这对其标准FP计算造成了影响,与hopper相比,该计算仅增加了32%。原因很简单,Blackwell首先是人工智能,这是它的主要目标市场。从人工智能的角度来看,FP并不那么重要,越低,推理和训练能力就越快。
此外,走小(MCM)路线的原因恰好是需要提高整体性能,而不是提高良率。看看NVIDIA的第一个MCM方法如何在该领域发挥作用将会很有趣,因为我们正在讨论在同一软件包上运行的两个GPU。据说CUDA在处理两个GPU和不同的架构方面做得相当好,不需要程序员进行重大更改。
GB200GPU是完整的Blackwell规格,比Hopper多500W功率
在发布期间,围绕所有BlackwellGPU和平台变体出现了特别大的混乱。Jensen表示Blackwell不是GPU,而是一个完整的平台,该平台拥有一系列产品,但它们仍然基于GPU。截至目前,NVIDIA已发布了三种官方BlackwellGPU变体。
其中包括GB200Superchip平台所使用的旗舰级和全规格B200。该拥有最高评级的计算能力,最大TDP为1200W。这比具有700WTDP的HopperH100高出500瓦。整个Superchip配备了两个B200GPU和一个GraceCPU,功率高达2700W(B200为1200Wx2+300WCPU/IO)。