中國電信完成業界首個面向國產算力的跨架構大模型推理技術驗證
飛象網訊 近日,中國電信研究院聯合中科院計算所、華為昇騰、沐曦等產業伙伴,依托中國電信云網融合技術中試驗證平臺,成功完成業界首個面向國產算力的跨架構大模型推理技術驗證。此次突破構建了基于Triton的異構大模型推理框架,實現“一套框架代碼、三芯透明遷移”的核心目標,將大模型算子適配周期從“周級”壓縮至“天級”,性能達到原生算子庫90%。
當前,國產芯片生態碎片化、算子開發難度高、適配周期長等問題,已成為制約國產算力規模化商用的關鍵瓶頸。為破解這一行業痛點,中國電信研究院牽頭啟動“Triton統一跨架構推理框架”技術攻關,成功突破三大核心技術:一是自研Triton跨架構編譯器與統一大模型算子庫,實現同一套算子源碼在英偉達、昇騰、沐曦三類芯片上無縫運行,從根源上解決多架構適配難題;二是創新研發vLLM-Triton運行時透明嵌入插件,采用零侵入式接入方式,完整繼承原生調度、內存管理及量化策略,保障框架兼容性與穩定性;三是打造圖算融合編譯器,通過多芯聯合優化計算圖,自動匹配最優算子實現方案與并行切分策略,將性能損耗嚴格控制在10%以內。
本次技術驗證已完成10余款主流開源模型在三類芯片上的端到端推理測試,核心指標表現優異:平均遷移時間≤3天,較傳統適配模式效率提升超80%;精度誤差<0.5%,確保模型推理可靠性;在同等延遲約束下,系統吞吐達到各芯片原生算子庫的90%以上,實現性能與適配效率的雙重優化。此外,框架內置的benchmark與Profiling工具可一鍵生成跨芯性能對比報告,為業務方提供直觀、精準的選芯決策支撐。
作為支撐本次驗證的核心平臺,中國電信云網融合技術中試驗證平臺入選國資委央企中試平臺名錄,現已對外開放20余項中試驗證服務能力,憑借其優質智算資源與靈活組網能力,構建了業界領先的異構推理試驗環境,為技術突破提供了關鍵保障,標志著國產算力生態正式從“一芯一策”的分散適配模式,邁入“統一框架”的高效協同新階段,大幅降低了國產芯片的應用門檻。
未來,中國電信將持續拓展Triton異構推理框架的適配范圍,覆蓋更多算力芯片與大模型類型,與產業伙伴攜手共建“代碼一次編寫、多芯無縫遷移”的開放生態。通過技術創新推動國產算力從“可用”向“好用”“易用”跨越,為自主可控、多元異構的算力基礎設施高質量協同發展注入強勁動力,助力我國數字經濟核心產業自主化進程。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
中國信通院正式發布2026深度觀察十大趨勢
12月13日,2026中國信通院深度觀察報告會主報告會在北京舉辦。本次報告會主題為 “面向“十五五”,人工智能浪潮下的新質生產力發展”。工業和信息化部黨組成員、副部長張云明出席報告會并致..[詳細]
1ms城市算網筑基:四川千行百業數智煥新
當前,人工智能引領的新一輪科技革命和產業變革正加速推進,各行各業都在嘗試以大數據、AI模型來升級業務,這對算力基礎設施及其提供服務的靈活性提出了更高的要求。為更好地支持各行各業的..[詳細]
手機輕松暢玩PC游戲?G胖引發玩家大猜想
PC游戲在手機上游玩不是新鮮事,PC游戲通過模擬器在手機上游玩也不是什么新鮮事,然而Steam親自下場,讓Arm設備能夠運行PC設備,就絕對是一件值得關注的事了。畢竟前有SteamOS的成功,甚至能..[詳細]
中國具身智能機器人市場呈六大發展趨勢,2030年市場規模將達770億美元
根據國際數據公司(IDC)發布《中國具身智能機器人應用市場分析與典型應用實踐,2025》報告顯示,在政策、資本與產業鏈的三重驅動下,中國具身智能機器人市場已完成從“技術突破”到“價值落..[詳細]
中國電信柯瑞文:智能領航、智惠共生,全面擁抱人工智能推動數智生態高質量發展
當前,人工智能正以前所未有的廣度和深度融入經濟社會各領域,重塑生產方式、生活方式乃至治理模式。作為建設網絡強國、科技強國、數字中國的重要力量,中國電信主動把握以人工智能為代表的..[詳細]













