近日,NVIDIA 宣布, 戴尔科技、慧与和联想将率先在其服务器产品阵容中集成专为 AI 量身定制的 NVIDIA Spectrum-X 以太网络技术,帮助企业客户加速生成式 AI 业务。
基于最新 NVIDIA Spectrum-X 网络端到端平台,助力客户通过 AI 实现业务转型
Spectrum-X专为生成式 AI 量身定制,为企业提供了一种全新的以太网络,相较传统以太网方案,其 AI 通信网络性能提高了 1.6 倍。
这三家头部系统制造商的新系统,整合了 Spectrum-X与 NVIDIA Tensor Core GPU、NVIDIA AI Enterprise 软件和 NVIDIA AI Workbench 软件,为企业通过生成式 AI 来实现业务转型奠定了基础。
NVIDIA创始人兼首席执行官黄仁勋表示:“生成式 AI 和加速计算正在推动新一代的业务转型,企业需要升级其数据中心来满足新型业务的需求。加速网络就是 NVIDIA 的头部服务器制造商合作伙伴推出新一代系统的催化剂,加快他们迈向生成式AI新时代。”
戴尔科技集团董事长兼首席执行官 MichaelDell 表示:“加速计算和加速网络是构建支撑大语言模型和生成式 AI 应用系统的关键。戴尔科技和 NVIDIA 将携手合作,为客户提供基础设施和软件,使他们可以快速、安全地发掘出数据的潜力。”
慧与总裁兼首席执行官 Antonio Neri 表示:“毫无疑问,生成式AI将推动各行各业的创新。这些强大的新型应用将需要一个全新的架构来支持各种不同的动态工作负载。为使客户能够充分挖掘生成式 AI 的潜力,慧与与 NVIDIA 携手共建系统平台,专们面向新型应用所需的性能、效率和可扩展性等需求。”
联想集团董事会主席兼首席执行官杨元庆表示:“生成式 AI 推动了前所未有的变革,但也对企业的基础设施提出了更加苛刻的要求。通过与 NVIDIA 密切合作,联想正在从网络、计算和软件等各个层面全方位构建高效的加速系统,满足现代 AI 应用的需求。”
专门用于加速AI 的网络
为实现 AI 业务的最佳效率,Spectrum-X 集性能优异的 Spectrum-4 以太网交换机、NVIDIA BlueField-3 SuperNIC(一款可以大幅提升超大规模 AI 业务性能的新型网络加速器)以及多种加速软件于一体。全球领先的基础设施计算平台 —— NVIDIA BlueField-3 DPU 就属于 Spectrum-X 的一部分。
Spectrum-4 是全球首款专门面向 AI 的 51Tb/sec 以太网交换机,可在大规模、满负荷的场景下提供超高的数据吞吐量,同时在 AI 云业务的多租户场景下将网络拥塞降到了最低,其智能的、基于微调的路由技术可以保障网络基础设施的最大利用率。
BlueField-3 SuperNIC 专为网络密集型的大规模并行计算而设计,可在 GPU 服务器之间提供高达 400Gb/s 的 RDMA(RoCE - RDMA over Converged Ethernet)网络连接,大幅提升了集群内部基于东西网络流量的 AI 训练和推理性能,还能实现多租户数据中心环境的安全隔离,确保租户业务的可预测性和性能隔离。BlueField-3 SuperNIC 基于低功耗、半高半长的 PCIe 规格设计,是企业级服务器的理想选择。
NVIDIA 加速软件包括 Cumulus Linux、SONiC 和 NetQ 三者组成的性能优异的 Spectrum-X 软件开发套件,以及作为 BlueField 核心的 NVIDIA DOCA软件框架。
NVIDIA AI Enterprise 为安全、稳定和已经支持的生产级 AI 业务提供了框架、预训练模型和开发工具。NVIDIA AI Workbench 使开发者能够在 PC 或工作站上快速创建、测试和自定义预训练生成式 AI 模型,然后将其扩展至几乎任何数据中心或云。
搭载Spectrum-X 的 NVIDIA 超级计算机
NVIDIA 自己的一台超级计算机就在使用 Spectrum-X,这也是新一代 AI 系统的参考架构。该超级计算机由 NVIDIA 与戴尔科技联合开发,使用了基于 8卡 NVIDIA Hopper GPU 的 HGX 平台和 BlueField-3 DPU 及 SuperNIC的 Dell PowerEdge XE9680 服务器,并通过 Spectrum-4交换机组成了集群系统。
供应情况
基于全套 NVIDIA AI 解决方案的戴尔服务器、慧与服务器和联想服务器预计将于明年一季度推出。
本文属于原创文章,如若转载,请注明来源:戴尔科技、慧与和联想即将推出NVIDIA全新AI以太网络平台https://net.zol.com.cn/843/8438891.html