華為發布全新AI數據基礎設施
3月17日,在2026華為數據存儲新春發布會上,華為正式發布針對AI推理場景的全新AI數據基礎設施,包含面向中心推理場景的AI數據平臺,和面向分支邊緣推理場景的FusionCube A1000 AI超融合一體機,旨在推動AI推理體驗全面升級,并顯著降低推理部署門檻,加速AI商業正循環。
過去幾年,AI歷經多輪演進,已邁入了以推理為核心的全新階段。當下,企業正面臨兩大變化:一是數據類型與規模持續擴展,從文本為主轉向多模態格式混合,體量從TB級躍升至EB級;二是企業核心資產從“數據”轉變為“知識”與“記憶”,被實時調用以支撐智能體自主決策。這些正全面重塑AI數據基礎設施,成為AI行業化落地的關鍵。
面向中心推理場景
華為推出AI數據平臺
為解決推理業務中知識質量不足、長序列推理體驗差以及推理記憶缺失的三大瓶頸,華為發布AI數據平臺,整合知識庫、KV Cache加速和記憶庫,并結合UCM技術實現調度與管理,破除企業AI的數據門檻,加速智能體應用落地。
華為存儲產品線副總裁、閃存領域總裁 謝黎明
知識庫:實時生成知識、高精度檢索知識
企業數據在不斷變化與更新,如果知識轉化不及時,會導致模型的推理決策結果不精準。華為AI數據平臺采用端到端的解析優化、表征優化與檢索優化,提供一個可敏銳捕捉源端數據變化的AI數據管道,并通過多模無損解析、Token級編碼等方式,將文本、圖片、視頻等資源轉化成海量細顆粒度的知識,結合多維度檢索與重排序,實現超95%知識檢索精度。
KV Cache加速:容納海量歷史數據,加速推理響應
在長文本長序列、多用戶多并發的推理過程中,大量的KV Cache數據存不下、系統響應遲緩,導致推理體驗惡化。華為AI數據平臺針對性提供了全局分層緩存能力,讓記憶數據在On-chip memory、DRAM、外置SSD存儲三層間按需流動,顯著擴充KV Cache存儲池,同時融合多種稀疏注意力算法,避免重復計算,大幅擴展上下文窗口,實現首Token時延降低90%。
記憶庫:高效管理上下文記憶,讓模型越用越聰明
當前,大模型普遍缺乏持久的記憶,會遺忘多步驟的中間結果和長期沉淀的歷史經驗,無法真正實現自我進化。華為AI數據平臺提供精準的記憶萃取與召回能力,實現上下文狀態保持、信息凝練。記得越多,推理就越精準,模型應用才能“越用越聰明”。
本次發布的AI數據平臺可提供一體化和獨立式兩大部署模式。一體化部署以OceanStor A800為全棧一體機底座;獨立式部署采用“數據引擎節點+OceanStor Dorado”架構,可在現有存儲系統上新增數據引擎節點,保護歷史投資,支撐業務平滑轉型。
面向分支邊緣推理場景
華為發布FusionCube A1000 AI超融合一體機
如今,大量的數據是在分支邊緣場景產生的,針對傳統分支邊緣場景進行智能化改造過程中所面臨的部署復雜、成本高昂、效率低下等問題,華為推出FusionCube A1000 AI超融合一體機,通過集成化與智能化交付,助力AI快速部署與高效運行。
華為存儲產品線副總裁、虛擬化領域總裁 張偉力
FusionCube A1000采用通算與智算融合一體化架構,實現AI部署“開箱即用”。其內置的AI平臺預集成了數據處理、模型訓練與推理全流程能力,基礎設施部署與應用上線周期顯著縮短80%。同時,FusionCube A1000具備統一運維、安全運營的能力,實現全棧管理、健康監測、故障快速定位定界,為智能體穩定高效地運行提供安全保障。
此外,FusionCube A1000支持邊緣與中心協同運行,打破數據孤島,形成智能體從感知到自主決策的閉環。分支邊緣側產生的數據將回傳至中心,在中心側不斷豐富語料、完成模型增訓,模型更新后可一鍵下發至邊緣側,實現模型能力的持續優化與共享。同時,FusionCube A1000支持算力的動態切分與調度,可同時運行多個不同的AI模型,并依據業務優先級智能分配資源,單卡算力利用率提升約30%。其內置平臺還支持知識庫與記憶庫的協同構建,數據飛輪無感運轉,持續提升AI模型輸出的準確性與實用性。
此次發布的華為AI數據平臺與FusionCube A1000,實現了從中心到邊緣的AI推理全場景覆蓋,為AI技術廣泛行業化落地注入新動能。華為數據存儲將持續深耕創新,賦能AI全路徑,助力企業兌現AI商業價值。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
2026十大科技趨勢
2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順遂!
[詳細]
我國算力規模與質量協同躍升,行業賦能效益加速釋放
當前,以大模型為代表的人工智能應用驅動全球計算技術進入新一輪創新爆發期,先進計算硬件、軟件、算法之間深度融合、協同演進,量子計算、類腦計算等前沿計算架構加快突破,算力需求呈現指..[詳細]
如何推進算電協同,筑牢綠色高效硬底座?
隨著AI浪潮的快速發展推進,全社會對算力的需求持續擴大,今年的《政府工作報告》也重點提出,要深化拓展“人工智能+”,實施超大規模智算集群、算電協同等新基建工程。在AI算力需求井噴的..[詳細]
平時不戴眼鏡的高通卡圖贊,談可穿戴設備殺手級AI應用
“我本人不戴眼鏡,只在戶外戴太陽鏡。所以對我來說,可能掛墜或項鏈這類形態會更舒服,我可以戴在胸前,隨時都能完成視覺交互。”卡圖贊隨后又以個人視角表..[詳細]
聚焦兩會|以AI賦能新質生產力,人工智能的責任是為人民服務
在“十五五”規劃開局的2026年,人工智能作為科技創新與新質生產力的關鍵支撐,被全民熱議、全社會所關注,并在兩會上被提升至戰略高度。委員代表們集體圍繞AI治理、產業創新、民生應用、人..[詳細]
MWC2026 爆火關鍵詞:U6GHz 到底是什么?一文看懂
近日巴塞羅那MWC2026大會火熱召開,全球最新的ICT科技集體亮相,令人目不暇接。各大廠商在介紹新技術、新產品時,不約而同地強調了對AI的支持能力和價值。[詳細]
聚焦兩會|具身智能落地場景全面擴容,產業堵點待打通
2026年開年,具身智能成為科技與產業領域的高頻熱詞。從央視春晚舞臺上人機共武,到 MWC2026 巴塞羅那展上中國機器人企業集體亮相的全球秀場,舞臺與展會的高光背后,是國產具身智能從技術演..[詳細]
我國系統推進自動駕駛政策法規體系建設,加速產業發展
近日,中國信息通信研究院(簡稱“中國信通院”)政策與經濟研究所、人工智能與經濟社會研究中心聯合發布《自動駕駛戰略與政策觀察(2025年)——推動自動駕駛全場景落地,搶占科技發展制高..[詳細]
專題|2026世界移動通信大會
2026年3月2日至5日,世界移動通信大會(MWC)在西班牙巴塞羅那Fira Gran Via會展中心拉開帷幕。本屆展會以“The IQ Era”(眾智啟新)為主題,向世界展示AI與通信深度融合的無限可能。..[詳細]
MWC26啟幕:AI+通信深度融合,重構行業價值邏輯
三月的巴塞羅那,科技盛宴如期而至。3月2日至5日,世界移動通信大會(MWC26)將拉開帷幕,恰逢展會落戶當地20周年,這場全球通信行業的開春盛事,正承載著定義下一個十年科技革命和產業變革..[詳細]













