您的位置:首页 >精选百科 >

AMDMI300X性能与NvidiaH100的比较

导读 MI300X是AMD最新、最出色的AIGPU旗舰产品,旨在与NvidiaH100竞争——即将推出的MI325X将与H200竞争,而MI350和MI400则将与BlackwellB200竞...

MI300X是AMD最新、最出色的AIGPU旗舰产品,旨在与NvidiaH100竞争——即将推出的MI325X将与H200竞争,而MI350和MI400则将与BlackwellB200竞争。ChipsandCheese在各种低级和AI基准测试中测试了AMD的怪兽GPU,发现它的表现通常远远优于Nvidia的H100。但是,在开始之前,有一些值得一提的注意事项。'

ChipsandCheese的文章没有提到在各种测试系统上进行了何种程度的调整,而软件会对性能产生重大影响——例如,Nvidia表示自推出以来,它通过软件更新将H100的推理性能提高了一倍。该网站与AMD的联系有限,但显然与Nvidia没有联系,因此可能有一些遗漏的设置会影响结果。更重要的是,提供MI300X访问权限的公司HotAisle专门寻找MI300X基准测试。ChipsandCheese还在低级测试中将MI300X与H100的PCIe版本进行了主要比较,这是规格最低的H100最弱的版本。除了注意事项和免责声明之外,ChipsandCheese的低级基准测试表明,基于AMD尖端CDNA3架构构建的MI300X从硬件角度来看是一个很好的设计。该的缓存性能看起来非常令人印象深刻,这要归功于它总共四个缓存的组合,包括32KBL1缓存、16KB标量缓存、4MBL2缓存和巨大的256MBInfinity缓存(用作L3缓存)。CDNA3是第一个继承InfinityCache的架构,它首次在RDNA2(驱动RX6000系列的AMD第二代游戏图形架构)上首次亮相。

MI300XGPU核心不仅有四个缓存,而且速度也很快。ChipsandCheese的缓存基准测试显示,MI300X的缓存带宽在所有相关缓存级别上都明显优于Nvidia的H100。L1缓存性能显示,MI300X的带宽是H100的1.6倍,L2缓存的带宽是3.49倍,MI300X的最后一级缓存(即InfinityCache)的带宽是3.12倍。

即使H100的SXM版本具有更高的时钟频率,我们也不会认为这些缓存结果会发生根本性变化。但缓存带宽和延迟本身并不一定能说明GPU在实际工作负载中的表现。例如,RTX4090的LLC带宽比H100PCIe高27%,但在许多工作负载中,H100的性能会更强。

MI300X的VRAM和本地内存性能(即标量缓存)也具有类似的优势。AMDGPU的本地HBM3内存是H100PCIe的2.72倍,VRAM带宽是H100PCIe的2.66倍。在内存测试中,AMDGPU唯一落后的地方是内存延迟结果,H100的速度提高了57%。

请记住,这是对最低规格的H100PCIe卡,具有80GB的HBM2E。后续版本(如H200)包含高达141GB的HBM3E,带宽高达4.8TB/s。H100SXM变体还具有更快的HBM,可提供高达3.35TB/s的带宽,因此使用2.0TB/s的卡显然会阻碍内存带宽。

免责声明:本文由用户上传,如有侵权请联系删除!