华尔街的人工智能竞赛在获取Nvidia的GPU上面遇到了障碍

Two Sigma获取Nvidia的GPU的困难

Two Sigma是一家依靠数学和计算机模型进行投资的量化对冲基金,在获取Nvidia的GPU方面面临挑战。最新的人工智能模型,如Nvidia的A100和H100,特别难以获取。这些GPU的短缺为内部技术团队创造了一个高度受限的环境,他们试图在满足用户需求的同时保持成本合理。Two Sigma获取A100芯片的成功率低至20%,凸显了容量短缺的严重性。

增加GPU可用性的创新解决方案

为了解决供需困境,Two Sigma和其技术供应商提出了创造性的解决方案。该基金的云服务提供商之一谷歌云已经开发出新技术,显著提高了获取A100芯片的可行性。通过利用谷歌云的动态工作负载调度器(DWS),客户可以增加获取稀缺GPU资源的机会。DWS允许客户指定他们的资源需求,使谷歌云能够更精细地提供容量并释放额外的容量。这个解决方案减少了支付闲置资源的需求,并一次性提供所有请求的机器,提高了效率并减少等待时间。

将谷歌云的技术与Two Sigma的调度工具集成

Two Sigma还将谷歌云的技术与其内部调度工具Cook进行了整合。Cook是一个允许研究人员提交和运行模型的平台。通过将谷歌云的技术整合到Cook中,Two Sigma进一步提高了获取Nvidia的GPU的成功率。这种整合对谷歌云和其金融客户都有好处,因为许多研究平台都托管在谷歌的公共云上。云服务提供商在技术之外为客户提供咨询解决挑战的趋势在该行业中变得越来越普遍。