Jim Keller建议Nvidia在GB200 GPU的芯片间连接中应该使用以太网

快速导读:Tenstorrent的CEO Jim Keller认为,Nvidia在其GB200 GPU的芯片间连接中应该使用以太网而不是其专有的NVLink协议。Keller认为,使用以太网可以节省Nvidia和用户的金钱,并且使软件在不同硬件平台上迁移更加容易。然而,Nvidia使用NVLink和InfiniBand等专有协议使他们在市场上具有竞争优势。

Nvidia对GB200 GPU的设计注重AI性能和先进的内存子系统,但设计仍存在疑问

当Nvidia推出面向AI和HPC应用的GB200 GPU时,该公司强调了其AI性能和先进的内存子系统,但对设备的设计提供了很少的信息。后来揭示,GB200 GPU由两个计算处理器组成,使用TSMC的CoWoS-L封装技术和专有的NVLink互连技术连接。这种设计对于从Nvidia的平台迁移软件到其他硬件平台构成了挑战。

在Nvidia的GPU中使用以太网的优势和劣势

Jim Keller建议Nvidia在芯片间连接中应该使用以太网而不是NVLink。Nvidia使用NVLink和InfiniBand等专有协议使软件在其他平台上的迁移变得更加复杂。以太网作为一种无处不在的技术,在性能方面可以与InfiniBand竞争,尤其是随着Ultra Ethernet互连技术的发展。然而,在AI和HPC工作负载方面,InfiniBand仍然具有优势。虽然像PCIe with CXL和Ultra Ethernet这样的开放标准技术可能最终超越Nvidia的专有协议,但目前来说,Nvidia的设计仍然有效。

Nvidia数据中心平台的未来和以太网的可行性

Nvidia对NVLink和InfiniBand等专有技术的投资是为了开发适应当前需求的数据中心平台。然而,如果像PCIe with CXL和Ultra Ethernet这样的开放标准技术在性能和功能上超过了Nvidia的专有协议,Nvidia可能需要重新开发其平台。Jim Keller建议Nvidia采用以太网,但这个过渡可能需要几年的时间。与此同时,Nvidia目前的设计仍然满足其客户的需求。