NVIDIA EOS:揭示的前十超级计算机

快速导读:NVIDIA展示了其令人印象深刻的超级计算机EOS,目前在最新的Top500最强超级计算机列表中排名第9。尽管设计用于AI性能,但EOS在最初并非为此基准而设计的情况下进入了前十名,这是一个了不起的成就。凭借576个NVIDIA DGX H100系统和尖端技术,EOS是一台庞大的AI超级计算机。

令人印象深刻的规格和可扩展性

NVIDIA EOS拥有令人印象深刻的配置,包括576个NVIDIA DGX H100系统,并利用强大的NVIDIA Quantum-2 400Gb/s Infiniband。它在双精度linpack上实现了121.4 PFlops/s的Rmax,并在FP8 AI计算方面达到了惊人的18.4 exaflops。EOS总共拥有4608个GPU,如果按照市场价格组装,估计成本将超过2亿美元+。

SuperPOD架构和液冷技术

NVIDIA采用其SuperPOD架构来构建EOS,实现对更大拓扑结构的可扩展性。该系统每个机架设计有四个系统,每个机架的功耗不超过32kW。值得注意的是,EOS采用了液冷技术,如所提供的图像中可见的液冷机架集流器所示。NVIDIA对液冷技术的强调突显了功耗效率的提升,并将其定位为未来AI服务器的可行解决方案。

将NVIDIA与竞争对手区分开来

EOS对NVIDIA来说是一项重要资产,既用于其内部开发目的,又为客户提供服务。大规模集群的可用性使NVIDIA与竞争对手区别开来。EOS代表了NVIDIA持续进步的一瞥,并有可能在未来的下一代产品中实现进一步创新,例如B100。