英特尔驱动的Aurora成为最快的人工智能超级计算机最终突破百亿亿次障碍

导读 Aurora超级计算机是英特尔、阿贡国家实验室和HPE合作的产品，在部分系统运行的情况下以585 34petaflops的速度排名第二。阿贡国家实验室的早

Aurora超级计算机是英特尔、阿贡国家实验室和HPE合作的产品，在部分系统运行的情况下以585.34petaflops的速度排名第二。阿贡国家实验室的早期科学计划取得了重大进展，重点关注高性能计算和人工智能在科学研究中的应用。在这张照片中，安装团队的成员走过阿贡国家实验室的许多机架。(来源：阿贡国家实验室)Aurora超级计算机终于突破了百亿亿次障碍，并凭借其英特尔PonteVecchio硬件实现了最快的人工智能性能。

当系统达到完全运行能力时，采用英特尔技术的Aurora超级计算机的计算速度达到1.01Exaflops，AI速度达到10.6Exaflops

Aurora超级计算机部署在阿贡国家实验室，并与HPE(惠普企业)合作构建，预计将成为HPC和AI领域表现最好的计算机之一。该平台由英特尔至强CPUMax和数据中心GPUMax系列提供支持，与AMD展开竞争，AMD率先突破了百亿亿次级别。与此同时，尽管Aurora超级计算机早在2019年就宣布推出，但勉强实现了既定目标，但如今，该系统的运行容量已达到87%，即总共9234个节点。

在ISCHighPerformance2024上，英特尔与阿贡国家实验室和惠普企业(HPE)合作宣布，Aurora超级计算机以1.012exaflops突破了exascale障碍，是世界上最快的人工智能系统，致力于开放科学领域的人工智能，达到10.6AIexaflops。英特尔还将详细介绍开放生态系统在推动人工智能加速的高性能计算(HPC)方面的关键作用。

在规格方面，Aurora超级计算机采用166个机架构建，配有10,624个刀片、21,248个IntelXeonCPUMax(第四代SapphireRapids)和63,744个IntelDataCenterGPUMax系列单元(PonteVecchio)。它基于用于互连的HPEslingshot结构，并使用84,992个端点。

在性能指标方面，Aurora超级计算机在HPLLINPACK基准测试中排名第二，但仅使用总节点容量的87%(9234个节点vs10,624个节点)就以1.012exaflops突破了百亿亿次障碍。该系统还在HPCG测试中排名第三，仅使用39%的系统，达到5612TFLOPs/秒。

利用Xe核心架构及其多个AI硬件模块，Aurora超级计算机目前以10.6AIExaflops的总额定性能在AI性能排行榜上排名第一。使用LINPACK混合精度(HPL-MxP)基准测试来测量性能。

下一步：采用英特尔至强CPUMax系列和英特尔数据中心GPUMax系列技术部署的新型超级计算机凸显了英特尔推进HPC和人工智能的目标。系统包括欧洲-地中海气候变化中心(CMCC)Cassandra，用于加速气候变化建模;意大利国家新技术、能源和可持续经济发展局(ENEA)的CRESCO8旨在实现聚变能方面的突破;德克萨斯高级计算中心(TACC)，该中心已全面投入生产，可对多种材料进行生物学数据分析、超音速湍流和原子模拟;以及英国原子能管理局(UKAEA)来解决支撑未来聚变发电厂设计的内存限制问题。

混合精度人工智能基准测试的结果将成为英特尔下一代人工智能和高性能计算GPU(代号FalconShores)的基础。FalconShores将利用下一代英特尔Xe架构以及英特尔Gaudi的最佳性能。这种集成实现了统一的编程接口。

具有P核和多路复用器组合列(MCR)内存的英特尔至强6的早期性能结果为8800MT/s，为现实世界的HPC应用程序(如用于欧洲海洋建模(NEMO)的Nucleus)提供高达2.3倍的性能提升，与上一代相比，为HPC解决方案的首选主机CPU选择奠定了坚实的基础。