阿里(BABA)進(jìn)一步擴(kuò)展自研芯片的版圖。4月28日的2026數(shù)字中國建設(shè)峰會(huì)上,阿里(BABA)旗下平頭哥發(fā)布首款智能網(wǎng)卡,旨在提升AI算力的利用效率。公司稱,該產(chǎn)品可應(yīng)用于萬卡AI智算集群場景。
這也標(biāo)志著平頭哥的芯片產(chǎn)品線,完成了“算力-存力-網(wǎng)力”的體系化布局。三類產(chǎn)品對應(yīng)的計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)傳輸,構(gòu)成數(shù)據(jù)中心的三大核心組件。此前,平頭哥已推出“真武”系列AI芯片、“倚天”系列服務(wù)器CPU、“鎮(zhèn)岳”系列存儲(chǔ)主控芯片。
為何不聚焦于單一的AI芯片產(chǎn)品?平頭哥產(chǎn)品總監(jiān)李旭慧對南都記者解釋稱,多元化布局是根據(jù)AI基礎(chǔ)設(shè)施建設(shè)的實(shí)際需求而定的,可以快速提供一套垂直解決方案。如果只做一款A(yù)I芯片,可能在算力集群的搭建中被其他硬件環(huán)節(jié)上的短板拖累。
智能網(wǎng)卡“磐脈920”即是在這一布局思路下推出。該產(chǎn)品搭載自研的智能網(wǎng)卡芯片,研發(fā)歷時(shí)約三年,目前已量產(chǎn),將首先在阿里(BABA)云數(shù)據(jù)中心部署。李旭慧說,公司對向外部第三方銷售該產(chǎn)品持開放態(tài)度。
平頭哥產(chǎn)品總監(jiān)李旭慧展示智能網(wǎng)卡“磐脈920”
網(wǎng)卡關(guān)乎數(shù)據(jù)傳輸?shù)男剩绻阅馨l(fā)展滯后,導(dǎo)致通信速度跟不上計(jì)算速度,就會(huì)形成所謂的“通信墻”問題。
李旭慧表示,AI場景下需要低延時(shí)的通信,而市面上很多企業(yè)級(jí)網(wǎng)卡無法勝任大模型時(shí)代的性能需求,使得GPU只有部分算力被有效利用。只有當(dāng)網(wǎng)卡和GPU的算力相匹配,算力的利用效率才能得到提升。
官方參數(shù)顯示,“磐脈920”最大支持400Gbps的網(wǎng)絡(luò)吞吐帶寬和極低時(shí)延。李旭慧介紹,目前國內(nèi)主流智能網(wǎng)卡的網(wǎng)絡(luò)吞吐帶寬,仍處于100-200Gbps的水平。
此外,“磐脈920”支持多路徑RDMA(遠(yuǎn)程直接內(nèi)存訪問)——RDWA是一種讓不同服務(wù)器直接讀寫彼此內(nèi)存的高速網(wǎng)絡(luò)通信技術(shù)。平頭哥方面稱,多路徑RDMA突破了傳統(tǒng)RDMA依賴單一路徑的技術(shù)限制,可有效縮短模型訓(xùn)推任務(wù)所需的完成時(shí)間。
在架構(gòu)設(shè)計(jì)上,“磐脈920”引入PCIe Switch內(nèi)部集成的方案。PCIe(外圍組件互連高速)是一種用于連接計(jì)算機(jī)主板與外圍設(shè)備(如顯卡、固態(tài)硬盤)的標(biāo)準(zhǔn),提供高速的數(shù)據(jù)傳輸功能。而PCIe Switch類似于交通樞紐的角色,是一種用于擴(kuò)展PCIe總線連接能力的交換芯片,允許多個(gè)設(shè)備通過單一PCIe端口連接到主機(jī)系統(tǒng),主要功能包括擴(kuò)展連接性、數(shù)據(jù)交換和帶寬分配。
通常情況下,PCIe Switch集成在主板上,而非網(wǎng)卡芯片的內(nèi)部組件?!芭兔}920”將其進(jìn)行芯片級(jí)集成,替代獨(dú)立的Switch器件。平頭哥稱這可以簡化服務(wù)器主板設(shè)計(jì),減少對外部交換芯片的依賴,還能確保網(wǎng)卡以極低時(shí)延直連GPU和固態(tài)硬盤,使系統(tǒng)成本降低30%。
