人物專訪監(jiān)管
制造芯片
6G運(yùn)營(yíng)
大數(shù)據(jù)物聯(lián)網(wǎng)
移動(dòng)互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

華為超節(jié)點(diǎn):用系統(tǒng)創(chuàng)新重構(gòu) AI 算力新范式
飛象網(wǎng)訊 (計(jì)育青/文)伴隨著AI的快速崛起,專為AI提供充足算力支撐的“超節(jié)點(diǎn)”技術(shù)在2025年迅速走紅,華為先后推出了基于昇騰芯片的萬(wàn)卡超節(jié)點(diǎn)產(chǎn)品和50萬(wàn)卡、百萬(wàn)卡超節(jié)點(diǎn)集群產(chǎn)品,阿里、字節(jié)、騰訊、浪潮等企業(yè)也陸續(xù)發(fā)布了自己的超節(jié)點(diǎn)解決方案。
近日,華為計(jì)算產(chǎn)品線營(yíng)銷運(yùn)作部部長(zhǎng)張愛(ài)軍在接受記者采訪時(shí)表示,華為正在與合作伙伴一道,通過(guò)“集群+超節(jié)點(diǎn)”創(chuàng)新,為全球AI產(chǎn)業(yè)提供真正大規(guī)模、高效、開(kāi)放合作的算力支撐。
“超節(jié)點(diǎn)”是AI算力的解決之道
當(dāng)前AI技術(shù)演進(jìn)正呈現(xiàn)出兩個(gè)大趨勢(shì),一是多模態(tài)走向融合統(tǒng)一,二是各行各業(yè)全面擁抱AI。從單模態(tài)大語(yǔ)言模型到多模態(tài)融合統(tǒng)一,需要AI能夠統(tǒng)一處理文本、圖片、視頻、聲音等不同類型的數(shù)據(jù)信息,從而像人類一樣,更加全面地認(rèn)識(shí)、理解現(xiàn)實(shí)世界。不過(guò)多模態(tài)時(shí)代的到來(lái)也帶來(lái)了不少新的挑戰(zhàn),比如AI模型需要理解、生成的上下文長(zhǎng)度將從K級(jí)邁入兆級(jí),模型訓(xùn)練需要的數(shù)據(jù)規(guī)模將從10TB級(jí)增長(zhǎng)到100TB級(jí),競(jìng)爭(zhēng)加劇導(dǎo)致AI模型更新?lián)Q代周期從半年縮短到一兩個(gè)月。另一方面,各行各業(yè)都在積極引入AI技術(shù),它們對(duì)AI算力提出了更多細(xì)化的要求,比如金融風(fēng)控工作期待AI識(shí)別、反饋的時(shí)延不能高于20毫秒,新興的AI代理應(yīng)用需要在執(zhí)行多任務(wù)協(xié)同、多輪推理迭代的同時(shí)快速響應(yīng)用戶。這兩大趨勢(shì)都對(duì)算力基礎(chǔ)設(shè)施提出了更高的要求。
面對(duì)爆炸式增長(zhǎng)的算力需求,人們不能繼續(xù)依賴單顆芯片的性能提升,必須通過(guò)發(fā)展多芯片互聯(lián)技術(shù)、構(gòu)造大規(guī)模計(jì)算節(jié)點(diǎn)來(lái)解決問(wèn)題。傳統(tǒng)集群計(jì)算方案主要利用現(xiàn)成技術(shù),通過(guò)服務(wù)器堆疊、以太網(wǎng)聯(lián)接的模式來(lái)提升算力規(guī)模,不過(guò)由于服務(wù)器之間帶寬不足、時(shí)延大,導(dǎo)致集群規(guī)模越大,算力的利用率反而越低。與此同時(shí),算力集群的規(guī)模擴(kuò)張還導(dǎo)致系統(tǒng)總體可靠性下降,一個(gè)環(huán)節(jié)出問(wèn)題就會(huì)連累整個(gè)集群的運(yùn)行中斷,使得算力設(shè)施難以充分釋放自身的價(jià)值。張愛(ài)軍表示,這需要引入新的互聯(lián)協(xié)議、計(jì)算架構(gòu),從而突破服務(wù)器擴(kuò)展的硬件限制,滿足未來(lái)規(guī)模算力供給。“超節(jié)點(diǎn)就是為此提供的解決方案,可以讓AI訓(xùn)練更高效、時(shí)延更短、可靠性更高。”張愛(ài)軍說(shuō)。
“大帶寬+低時(shí)延+內(nèi)存統(tǒng)一編址”才是真“超節(jié)點(diǎn)”
傳統(tǒng)的高性能計(jì)算設(shè)備就是一臺(tái)以CPU為核心、采用單一操作系統(tǒng)的大型機(jī)或服務(wù)器,卡間互聯(lián)采用PCIe或以太網(wǎng)方式,跨服務(wù)器互聯(lián)帶寬多為200-400Gb/s,時(shí)延一般在幾十微秒,難以滿足千億參數(shù)AI模型訓(xùn)練所需。“超節(jié)點(diǎn)”則是多個(gè)分布式設(shè)備各自搭載操作系統(tǒng),通過(guò)新的技術(shù)互聯(lián)形成一個(gè)邏輯上的整體,各個(gè)分布式設(shè)備上的計(jì)算單元、存儲(chǔ)單元、內(nèi)存單元等形成資源池,供邏輯上的整體統(tǒng)一調(diào)用。
張愛(ài)軍表示,“超節(jié)點(diǎn)”方案中的每個(gè)CPU、NPU或內(nèi)存單元都可以平等地進(jìn)行互聯(lián),互聯(lián)通道不再采用傳統(tǒng)的PCIe模式,而是以全新的協(xié)議、總線能力來(lái)服務(wù)AI計(jì)算的高需求。因此張愛(ài)軍認(rèn)為,真正的超節(jié)點(diǎn)應(yīng)具備三個(gè)核心特征,即大帶寬、低時(shí)延、內(nèi)存統(tǒng)一編址。
超節(jié)點(diǎn)借助高效的互聯(lián)協(xié)議打破傳統(tǒng)架構(gòu)限制,支持更大規(guī)模AI芯片的高效協(xié)同,支持更大范圍、更高流量的數(shù)據(jù)傳輸。以華為昇騰 384超節(jié)點(diǎn)產(chǎn)品為例,系統(tǒng)集成了384個(gè)昇騰NPU和192個(gè)鯤鵬CPU,與傳統(tǒng)服務(wù)器架構(gòu)相比,其通信帶寬提升了15倍、RTT通信時(shí)延從7微秒降到了3微秒。超節(jié)點(diǎn)的大帶寬、低時(shí)延不僅局限在單臺(tái)服務(wù)器內(nèi)部,還可以擴(kuò)展到整機(jī)和跨機(jī)柜的大規(guī)模集群,整個(gè)超節(jié)點(diǎn)范圍內(nèi)都可以靈活并行切分資源、匹配業(yè)務(wù)需求。實(shí)測(cè)表明,在DeepSeek、Qwen等多模態(tài)、MoE模型訓(xùn)練中,超節(jié)點(diǎn)的性能是傳統(tǒng)集群的3倍以上。
“內(nèi)存統(tǒng)一編址”是指超節(jié)點(diǎn)內(nèi)所有互聯(lián)設(shè)備的內(nèi)存地址全局唯一,無(wú)論數(shù)據(jù)位于哪臺(tái)設(shè)備、哪塊內(nèi)存,都只有一個(gè)“全局地址”,CPU、NPU/GPU之間可以直接通過(guò)這個(gè)地址訪問(wèn)。這使得大模型訓(xùn)練中頻繁的參數(shù)同步操作可以直接通過(guò)內(nèi)存語(yǔ)義通信完成,提升小包數(shù)據(jù)傳輸、離散隨機(jī)訪存通信效率,并在超節(jié)點(diǎn)域內(nèi)實(shí)現(xiàn)更大的共享內(nèi)存池。昇騰384超節(jié)點(diǎn)已經(jīng)實(shí)現(xiàn)了128TB的全局內(nèi)存統(tǒng)一編址。
大帶寬、低時(shí)延、內(nèi)存統(tǒng)一編址三大能力相互協(xié)同,才能真正實(shí)現(xiàn)讓集群像一臺(tái)計(jì)算機(jī)一樣工作,成為真正的超節(jié)點(diǎn)。相比之下,一些AI算力設(shè)施仍然在AI處理器間以PCIe+RoCE協(xié)議互聯(lián),跨服務(wù)器帶寬、時(shí)延受限,且不支持“內(nèi)存統(tǒng)一編址” 能力,本質(zhì)上仍然是傳統(tǒng)服務(wù)器的堆疊,不是真正的“超節(jié)點(diǎn)”。
需求無(wú)止境,創(chuàng)新才有未來(lái)
在已經(jīng)過(guò)去的2025年,業(yè)界對(duì)AI算力的建設(shè)和發(fā)展一直存在爭(zhēng)議,既有算力不足的呼吁,也有算力過(guò)剩的憂慮。張愛(ài)軍認(rèn)為,與實(shí)際需求相比,現(xiàn)有AI算力還遠(yuǎn)遠(yuǎn)不夠。“從行業(yè)用戶到個(gè)人用戶,使用AI越來(lái)越多,token用量一直呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。”張愛(ài)軍說(shuō),“據(jù)統(tǒng)計(jì),2025年國(guó)內(nèi)平均每天消耗300萬(wàn)億token,未來(lái)可能突破每日千萬(wàn)億token。”
要滿足快速增長(zhǎng)的需求,必須堅(jiān)持創(chuàng)新。在2025年,華為不僅推出了創(chuàng)新的新一代超節(jié)點(diǎn)智算產(chǎn)品,還率先將智能計(jì)算的超節(jié)點(diǎn)技術(shù)引入到了通用計(jì)算領(lǐng)域,發(fā)布了全球首款通算超節(jié)點(diǎn)。張愛(ài)軍表示,其實(shí)通用計(jì)算與智算一樣,都需要不斷提高性能表現(xiàn),因此也都是大帶寬、低時(shí)延、統(tǒng)一內(nèi)存編址等新技術(shù)的用武之地。
張愛(ài)軍告訴記者,華為面向超節(jié)點(diǎn)開(kāi)發(fā)的高速互聯(lián)協(xié)議靈衢是完全開(kāi)放的,有興趣的企業(yè)和個(gè)人都可以到靈衢官網(wǎng)下載詳盡的技術(shù)資料,業(yè)界所有開(kāi)發(fā)者都可以獲取這項(xiàng)技術(shù),在此基礎(chǔ)上打造自己的超節(jié)點(diǎn)產(chǎn)品。“華為希望這些新技術(shù)、新能力可以為更多的企業(yè)選用,從而打造一個(gè)完整的產(chǎn)業(yè)生態(tài),共同努力為數(shù)字化、智能化時(shí)代提供堅(jiān)強(qiáng)的算力支撐。”張愛(ài)軍說(shuō)。
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
盤(pán)點(diǎn)2025|光纖光纜:周期性放緩之下,確定性開(kāi)始凸顯
在2025年,光纖光纜廠商們習(xí)慣于用“周期性”一詞來(lái)描述當(dāng)前的困難,相比于寬帶普及、4G升級(jí)換代帶來(lái)的流量需求猛增這一巨大業(yè)務(wù)增長(zhǎng)。可如今在刷著短視頻、看著帶貨的新日常生活常態(tài)下,盡..[詳細(xì)]
盤(pán)點(diǎn)2025|人工智能:破局前行、以智啟新,同赴人機(jī)共生新未來(lái)
2025年,人工智能行業(yè)迎來(lái)技術(shù)迭代與價(jià)值落地的雙重關(guān)口。這一年里既延續(xù)著近年來(lái)的高速增長(zhǎng)態(tài)勢(shì),也迎來(lái)從野蠻生長(zhǎng)向規(guī)范提質(zhì)的深刻轉(zhuǎn)型。 [詳細(xì)]
盤(pán)點(diǎn)2025|算力行業(yè):量質(zhì)齊升的進(jìn)階之路
在數(shù)字經(jīng)濟(jì)加速滲透全球經(jīng)濟(jì)社會(huì)各領(lǐng)域的今天,算力已成為繼電力、水資源之后的關(guān)鍵生產(chǎn)要素,是支撐數(shù)字中國(guó)建設(shè)、推動(dòng)高質(zhì)量發(fā)展的核心基礎(chǔ)設(shè)施。算力的規(guī)模與質(zhì)量直接決定了數(shù)字經(jīng)濟(jì)的發(fā)..[詳細(xì)]
盤(pán)點(diǎn)2025|芯片:AI依舊是挖潛點(diǎn),應(yīng)用進(jìn)一步多樣化
時(shí)至2025年年底,人們已經(jīng)開(kāi)始漸漸習(xí)慣,有事聽(tīng)聽(tīng)AI給出的參考意見(jiàn)。其背后的算力支撐也在逐步加強(qiáng),像是更先進(jìn)的制程,以及向更多端側(cè)設(shè)備的拓展。另一方面,AI又一石激起千層浪,機(jī)遇與需..[詳細(xì)]
盤(pán)點(diǎn)2025 | 從5G到6G:深耕與突破并行,開(kāi)啟智能連接新紀(jì)元
2025年,全球通信產(chǎn)業(yè)站在了一個(gè)關(guān)鍵的歷史交匯點(diǎn)。這一年既是“十四五”規(guī)劃的收官年,5G建設(shè)成果全面轉(zhuǎn)化的驗(yàn)收年,也是“十五五”規(guī)劃啟幕,6G布局從技術(shù)探索邁向工程落地的奠基之年,更..[詳細(xì)]
盤(pán)點(diǎn)2025|量子信息:三大領(lǐng)域技術(shù)持續(xù)演進(jìn),產(chǎn)業(yè)發(fā)展未來(lái)可期
以量子計(jì)算、量子通信和量子精密測(cè)量為代表的量子信息技術(shù)是挑戰(zhàn)人類調(diào)控微觀世界能力極限的世紀(jì)系統(tǒng)工程,是對(duì)傳統(tǒng)技術(shù)體系產(chǎn)生沖擊、進(jìn)行重構(gòu)的重大顛覆性創(chuàng)新,將引領(lǐng)新一輪科技革命和產(chǎn)..[詳細(xì)]
盤(pán)點(diǎn)2025|2025年智能終端趨勢(shì)洞察:AI重構(gòu)體驗(yàn),超級(jí)終端時(shí)代加速到來(lái)
2025年,全球智能終端行業(yè)站在了技術(shù)革新與生態(tài)重構(gòu)的十字路口。AI技術(shù)的規(guī)模化滲透、折疊屏形態(tài)的成熟落地、跨設(shè)備協(xié)同的深度演進(jìn),正在重塑終端產(chǎn)品的價(jià)值邏輯與市場(chǎng)格局。[詳細(xì)]
2026手機(jī)市場(chǎng)開(kāi)局遇寒流 市場(chǎng)結(jié)構(gòu)悄然生變
2026年伊始,尚處于溫和復(fù)蘇階段的全球智能手機(jī)市場(chǎng),便遭遇了一記“寒流”。據(jù)媒體消息,受上游供應(yīng)鏈存儲(chǔ)漲價(jià)影響,多家手機(jī)廠商近日下調(diào)全年整機(jī)訂單數(shù)量,小米、OPPO下調(diào)超20%,vivo下調(diào)..[詳細(xì)]
2026十大AI技術(shù)趨勢(shì):應(yīng)用拓展、模式探索與底層技術(shù)齊頭并進(jìn)
在2025年,人工智能技術(shù)不僅繼續(xù)向著更快、更強(qiáng)、更多能的方向發(fā)展,還在向著小而精的新方向發(fā)展,并因此得以大步走出實(shí)驗(yàn)室,以令人吃驚的速度快速融入各行各業(yè)的業(yè)務(wù)應(yīng)用。時(shí)間進(jìn)入2026年..[詳細(xì)]
XR3.0時(shí)代,產(chǎn)業(yè)已邁入發(fā)展“快車道”
虛擬(增強(qiáng))現(xiàn)實(shí)(簡(jiǎn)稱XR)是新一代信息技術(shù)的重要前沿方向,是數(shù)字經(jīng)濟(jì)的重大前瞻領(lǐng)域,將深刻改變?nèi)祟惖纳a(chǎn)生活方式,各國(guó)政府重視該領(lǐng)域的發(fā)展布局,美韓持續(xù)推進(jìn)沉浸式技術(shù)戰(zhàn)略,我國(guó)..[詳細(xì)]












