· · ·

世界杯赛程

世界杯赛程

2026世界杯-最新版官方软件 平头哥发布首款智能网卡「磐脉 920」,补都 AI 算力临了一块短板

发布日期:2026-05-09 16:34 来源:未知 作者:admin 浏览次数:

作家|苏子华

剪辑|郑玄

 

最近两年,AI 行业最热的词一直绕不开「算力」。

从大模子锤真金不怕火,到本年 Agent 的火热,再到各家云厂商箝制扩建智算中心,行业研讨最多的,真的都是 GPU、芯片和算力畛域。大要只消卡够多,AI 就能不时往前跑。

但试验并不是。

不少作念大模子锤真金不怕火和推理的东谈主,还是越来越显着地感受到另一层问题:机器越来越贵,GPU 越来越强,但模子锤真金不怕火和推理的效果,却莫得同步进步。

问题不一定出在算力自身,而可能出在另一件弥远被冷落的事情上——网力。

平头哥居品总监李旭慧打了个比喻:「若是把算力比作 AI 时期的石油,网力即是输油管谈。算力提供能源,网力保险效果。」

4 月 28 日,在数字中国开采峰会上,平头哥发布首款智能网卡磐脉 920。这是国内首个内置 PCIe Switch 的 400G 智能网卡,最大援助 400Gbps 隐隐带宽,可应用于万卡智算集群、通算集群和高性能存储等场景,刻下还是量产,并将率先部署在阿里云数据中心。

磐脉 920 想要惩处的即是「网力」问题。

今天的大模子锤真金不怕火,一个锤真金不怕火任务,每每需要几千致使上万张 GPU 同期妥洽。单张 GPU 性能再强,也必须跟总共集群保捏同步。

问题在于,只消其中一部分节点慢下来,其他节点就只可恭候。他不雅察到,刻下行业里许多万卡级智算集群,GPU 本色哄骗率较低,「能作念到 60%,还是算行业顶尖水平。」

已往行业更容易温雅「有些许卡」,但本色在 AI 锤真金不怕火场景中,系统运行效果并不是由最强的硬件决定,而是受限于集群里最慢的阿谁节点。「卓越节点的算力会捏续闲置恭候,形成大畛域算力浮滥。」

磐脉 920 的发布本色上也指明了一个主意:当 GPU 还是满盈强之后,下一步到底该补那儿。

 

 

一张网卡,周转总共智算集群

 

当 AI 智能体驱动进入真的业务场景,推理业务的占比越来越高。

「在 Agent 应用爆发的布景下,推理业务的增长速率显耀快于锤真金不怕火。」李旭慧示意。

大模子锤真金不怕火强调强同步,而推理靠近的是多数突发、小包、高频苦求,对低时延和相识性的要求更高,这也意味着对「网力」的要求更高。

而抽象一下磐脉 920 在作念的事,即是尽量减少整系统里的「堵」和「等」,通过网力的进步来开释 AI 算力。

其背后的竣事旨趣,有三个要害。

最初是援助多旅途 RDMA,冲破单总共径的局限。

粗鄙贯串,即是蓝本只可走一条高速,刻下变成多条路同期分流。更要害的是,这些数据诚然分开走,但最终还能按轨则准确拼总结。

李旭慧评释,磐脉 920 通过援助逐包喷洒、乱序禁受和遴荐性重传,竣事 RDMA 多旅途。

从收尾来看,这套决策带来的改善比拟平直。

按照官方实测,磐脉 920 援助单 QP 打满 400G 带宽,而同类主流居品带宽苟简惟有其一半。同期,多旅途才略不错把交换机端口缓冲区水线虚构 90%,减少丢包和重传。

第二个要害估量打算,是把「绕路」变成「直连」。

磐脉 920 最大的亮点之一,是内置 PCIe Switch。这亦然国内首个作念到这少量的 400G 智能网卡。

传统工作器架构里,2026世界杯中国压球官网PCIe Switch 平淡部署在主板上,数据需要绕多个节点转发。收尾即是,有的旅途长,有的旅途短,时延不一致。

关于需要高度同步的 AI 锤真金不怕火任务来说,这种「不整都」会平直影响效果。

李旭慧打了个比喻:传统架构里,常常会出现「四个下行通谈挤一个上行通谈」的情况。

这很像四条歧路同期汇入一条骨干谈,堵塞真的不成幸免。

磐脉 920 把 PCIe Switch 平直集成进芯片里面,让网卡与 CPU、GPU 形成更平直的勾通联系。

少绕路,意味着更低时延;旅途更长入,则意味着更相识的同步效果。

凭证平头哥实测,在疏导集群畛域和任务要求下,部署磐脉 920 后,大模子锤真金不怕火和推理任务完成时辰可裁减 14%。

第三个要害,是让收罗具备我方判断的才略。

传统网卡更多像搬运工。收到数据,搬已往,仅此汉典。

据了解,磐脉 920 加入了细粒度收罗感知和可编程拥塞截至才略。直白讲,即是它能主动避堵。让收罗驱动从被迫传输,变成主动转变。

关于越来越复杂的 AI 集群来说,这种才略的紧迫性会越来越显着。

从这些估量打算能看出来,磐脉 920 并不是在追求参数上的浅易进步,它作念的事情很求实,让还是很贵的算力,少浮滥少量,从而激勉最大的潜能。

 

为何是阿里在界说 AI 基础顺序?

除了性能自身,磐脉 920 背后更值得温雅的,是平头哥和阿里的举座布局。

已往几年,许多公司作念芯片,每每都集在单一法子,比如 GPU、AI 加快卡或者 CPU。

但平头哥的想路是作念全栈。

刻下,平头哥还是形成四条居品线:真武系列 AI 芯片、倚天工作器 CPU、镇岳存储主控芯片,以及此次发布的磐脉系列智能网卡。

对应的,正巧是数据中心里的几个要害法子:算力、存力和网力。

李旭慧在采访中示意:「单一芯片居品无法惩处全链路问题,惟有买通算力、存力、网力,技艺最大化开释 AI 硬件性能。」

这亦然平头哥和许多单点芯片公司的分歧。它不是只作念一块性能更强的芯片,而是试图从总共系统角度去看问题。

许多芯片公司作念居品,先作念出来,再去找客户和落地场景。

但平头哥不是。

李旭慧告诉极客公园,磐脉 920 立项之时 AI 智能体尚未成为行业焦点。但他们从阿里云自身业务中判断,将来 AI 一定会鼓吹数据中心收罗才略升级。

「一线业务场景的本色需求,是芯片期间迭代与居品优化的中枢驱能源。」先有阿里云的大畛域业务场景,再从本色场景需求里倒推居品界说。

这即是磐脉 920 的交易旅途。据深入,和平头哥倚天、真武、镇岳系列芯片雷同,它会先部署在阿里云数据中心。

从这个角度看,磐脉 920 的发布,自身即是阿里「通云哥」协同才略的一次体现。

通义认真模子,阿里云认真场景,平头哥认真底层硬件。模子需求鼓吹云基础顺序升级,云场景又反向鼓吹芯片演进。

这种全栈自研的闭环,在国内科技公司里并未几见。「通云哥」的阵势诚然前期插足大、周期长,但一朝走通,护城河也极深。

AI 竞争走到今天,比拼的还是不是单点才略,而是这一整套系统能否顺畅运转。

跟着 AI 越来越多从锤真金不怕火走向推理,模子、云与芯片之间形成的捏续响应轮回2026世界杯-最新版官方软件,举座上风的显现可能才刚刚驱动。

K8凯发中国官方网站