这家总部位于加州圣克拉拉的公司推出了自己的数据处理单元(DPU),可以将数据中心的更多基础设施转移到芯片中。DPU将可编程的Arm CPU内核与高性能网络接口结合在一个片上系统(SoC)上。该芯片增加了加速器,可以卸载功能(从与存储协调到清除网络中的恶意软件),这些已成为服务器CPU性能的主要障碍。
BlueField DPU集成在一个名为SmartNIC的服务器网卡上,可以使用标准PCIe互连在云数据中心和私有计算机网络中的任何服务器上。英伟达表示,该公司已开始向早期客户供应家族第一代芯片BlueField-2,并将于2021年在主要制造商的服务器上推出。
首席执行官黄仁森(Jensen Huang)在公司一年一度的GPU技术会议(GTC)上宣布了这一举措,这符合Nvidia在数据中心市场扩张足迹的战略。这些芯片基于英伟达70亿美元收购Mellanox Technologies和中央处理器(CPU)的网络芯片,该交易基于Arm的蓝图。上个月,英伟达同意以约400亿美元的价格收购Arm。
长期以来,英伟达一直是高端个人电脑和游戏机图形处理单元(GPU)市场的领头羊。但在过去的十年里,它也开始在最大的云数据中心销售先进的服务器处理器来运行人工智能,在那里,它的芯片是目前的黄金标准。包括亚马逊,微软和Alphabet的Google在内的顶级云服务提供商使用Nvidia芯片将更多的AI性能整合到他们出租给其他公司的数据中心中。
Nvidia GPU拥有数千个用于并行计算的微型处理器。这使他们能够比英特尔芯片更快,更高效地运行AI任务。。该芯片被添加到数据中心中庞大的服务器、存储器、网络交换机和其他硬件的仓库中,以减轻AI任务的负担,这些任务可能会使服务器的CPU过度工作。
英伟达 已经超越英特尔成为美国最有价值的半导体公司,它正试图接管数据中心的更多计算工作。这可能会伤害英特尔, 后者在服务器CPU中占据90%以上的市场份额,每个服务器的成本可能高达数千美元。英特尔在推出更先进的人工智能芯片的竞赛中一直落后。
Huang在最近的一份声明中说:“数据中心已经成为新的计算单元。DPU是现代安全的加速数据中心的重要组成部分,CPU、GPU和DPU可以在其中合并为一个计算单元(这是完全可编程的,支持AI的),并且可以提供以前无法实现的安全性和计算能力。”
DPU试图解决的挑战是,现代数据中心中更多的基础结构管理琐事已经换成了在服务器CPU内部运行的软件。这些杂事大部分都曾经在标准网络接口卡(NIC)和单独的服务器硬件捆绑上运行。但是一个主要的缺点是服务器中的所有软件都会给CPU中的资源增加负担。通过 分担这些功能,CPU可以专注于其他工作负载。
Nvidia估计,数据管理会消耗多达30%的数据中心中央处理核心,数据中心中的所有软件基础架构都极大地拖累了服务器的性能。Huang在GTC上说:“需要一种专门用于数据移动和安全处理的新型处理器。BlueField DPU是芯片上的数据中心基础架构。”
Nvidia表示,该系列的首款产品BlueField-2与125个CPU内核一样,在网络,存储,安全性和基础架构任务方面具有相同水平的性能。进程中保存的资源可用于其他服务, 从而提高服务器的最大性能。数据中心使用的主要操作系统(包括Linux和VMware)支持DPU。
该芯片结合了八个基于armcortex-A72体系结构的可编程内核及其高性能ConnectX-6dx网络接口。DPU可以被添加到数据中心的任何服务器上,它有一对加速器,用于卸载存储、网络和其他管理工作负载,每秒操作数高达0.7万亿次。BlueField-2还具有1MB的L2缓存,可以由成对的CPU内核共享,还有6MB的L3缓存。
BlueField-2包含用于以太网或InfiniBand的200Gb/s或双100Gb/s网络端口,因此它可用于网络以及存储工作负载,包括非易失性存储器Express或NVMe。此外,还包括对芯片进行加密,以防止数据泄露。它具有多达16个PCIe Gen 4端口,用于与服务器上的CPU和GPU通信,以及多达16 GB的板载DRAM。
该公司正试图通过在其Bluefield DPU中添加更强大的AI来与竞争对手脱颖而出。它还正在推出BlueField-2X,该产品将于2021年在其与BlueField-2相同的硬件中添加基于其新Ampere架构的GPU。DPU支持多达60TOPS的AI性能,可用于改善网络,存储和数据中心中的其他杂务。使用AI,DPU可以检测到网络中的异常行为,并在数据被盗之前将其阻止。
Huang说,许多主要的服务器制造商,包括戴尔技术、超微、联想、华硕、Atos、技嘉和广达,都计划将Nvidia DPU集成到他们出售给企业客户的服务器中。