人物專訪監(jiān)管
制造芯片
6G運(yùn)營
大數(shù)據(jù)物聯(lián)網(wǎng)
移動互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報告衛(wèi)星

對話Arm鄒挺:2026年物理AI加速 芯片將有這些新進(jìn)展
在開源大模型持續(xù)豐富能力矩陣的行業(yè)背景下,AI產(chǎn)業(yè)鏈從底層基礎(chǔ)設(shè)施到上層應(yīng)用都正加速演進(jìn)。
2026年被業(yè)界定義為AI應(yīng)用大年,其中“物理AI”被多家頭部廠商尤其看中,而底層基礎(chǔ)設(shè)施在應(yīng)用的差異化需求催動下,也面臨新的發(fā)展走向。
近日,Arm發(fā)布多項(xiàng)技術(shù)預(yù)測,指出2026年將邁入智能計(jì)算新紀(jì)元,屆時,計(jì)算將具備更高的模塊化特性和能效表現(xiàn),實(shí)現(xiàn)云端、物理終端及邊緣人工智能 (AI) 環(huán)境的無縫互聯(lián)。其中還提到,下一個價值數(shù)萬億美元的AI平臺將屬于物理智能領(lǐng)域,智能能力將被植入新一代自主設(shè)備與機(jī)器人。
Arm中國區(qū)業(yè)務(wù)全球副總裁鄒挺接受21世紀(jì)經(jīng)濟(jì)報道記者采訪時指出,對于“物理AI”的發(fā)展,“業(yè)界完全有能力打造出單臺高性能的機(jī)器人或自動駕駛系統(tǒng)。但真正的挑戰(zhàn)在于,如何實(shí)現(xiàn)數(shù)萬甚至數(shù)百萬臺同類設(shè)備的可靠部署。”
其背后直指原生AI硬件發(fā)展過程中面臨的軟硬件碎片化問題,由此,對于AI產(chǎn)業(yè)鏈來說,構(gòu)建完善的軟件生態(tài)能力,同時部署充分靈活的異構(gòu)計(jì)算硬件基礎(chǔ)設(shè)施,成為布局關(guān)鍵所在。
物理AI疾馳
談及今年備受關(guān)注的應(yīng)用場景,“物理AI”必占其一。在前不久舉行的CES 2026上,多家芯片頭部廠商高管都提到了今年對該領(lǐng)域的期待。
目前業(yè)界公認(rèn)的“物理AI”場景主要包括具身智能和自動駕駛,在方向確定的背景下,技術(shù)路線和商業(yè)化進(jìn)展還存在一定分野,距離大規(guī)模落地尚需一定時間。
根據(jù)Arm對2026年的趨勢分析,在多模態(tài)模型、更高效訓(xùn)練與推理管線的技術(shù)突破推動下,物理AI系統(tǒng)將實(shí)現(xiàn)規(guī)模化部署,催生全新品類的自主設(shè)備。這將幫助醫(yī)療健康、制造、交通運(yùn)輸、采礦等多個行業(yè)重塑。
此外,面向汽車與機(jī)器人自動化場景的通用計(jì)算平臺將逐步涌現(xiàn)。車載芯片有望通過技術(shù)復(fù)用與適配,應(yīng)用于人形機(jī)器人或工業(yè)機(jī)器人領(lǐng)域。這將進(jìn)一步提升規(guī)模經(jīng)濟(jì)效益,加速物理AI系統(tǒng)的研發(fā)與落地進(jìn)程。
不過從技術(shù)路線看,物理AI目前仍面臨世界模型和VLA(視覺-語言-動作)模型兩條技術(shù)持續(xù)演進(jìn)的命題。
鄒挺對記者分析,二者均為物理AI落地的核心技術(shù)路線,適配自動駕駛、工業(yè)自動化、精密醫(yī)療等多元應(yīng)用場景。其中VLA模型聚焦解決“理解與執(zhí)行”的核心需求,世界模型則專注攻克“預(yù)測與因果”的關(guān)鍵難題,均對算力提出高要求。
“這兩條路線各有側(cè)重、優(yōu)勢互補(bǔ),業(yè)界也在探索兩種路線的融合:將VLA模型引入世界模型能力以提升環(huán)境預(yù)測精度,世界模型則融入語言交互接口以增強(qiáng)決策可解釋性。”他續(xù)稱。
鄒挺告訴記者,為應(yīng)對物理AI的發(fā)展需求,在內(nèi)部組織架構(gòu)方面,2025年11月,Arm完成旗下汽車、機(jī)器人及各類自主運(yùn)行設(shè)備相關(guān)業(yè)務(wù)的整合,成立“物理AI”事業(yè)部。
“這些領(lǐng)域正朝同一個核心目標(biāo)加速融合。即打造一套在算力、安全性與可靠性毫不妥協(xié)的前提下,實(shí)現(xiàn)‘感知-決策-執(zhí)行’實(shí)時閉環(huán)的AI方案。”他續(xù)稱,隨著AI技術(shù)在各類物理系統(tǒng)中規(guī)模化部署,能效表現(xiàn)、完善且成熟的軟件生態(tài)已成為決勝關(guān)鍵。
“物理AI需要在嚴(yán)苛的功耗與熱管理限制下持續(xù)運(yùn)轉(zhuǎn),并且往往部署在安全關(guān)鍵型應(yīng)用場景中。而規(guī)模化的關(guān)鍵,絕非單純提升性能,更在于將統(tǒng)一的架構(gòu)理念貫穿于云端訓(xùn)練、邊緣推理及物理系統(tǒng)實(shí)時執(zhí)行的全流程。這就需要一套能夠支撐‘從傳感器端到中央決策端’分布式智能的平臺化方案。”鄒挺指出。
對此,Arm推出了一套分層式解決方案。硬件層面,Arm有汽車增強(qiáng)AE IP及Zena CSS產(chǎn)品組合;軟件層面,Arm提供KleidiAI庫和優(yōu)化工具,幫助實(shí)現(xiàn)模型量化和調(diào)優(yōu);系統(tǒng)層面則推動云-邊-端協(xié)同,將高功耗任務(wù)卸載到邊緣或云端,同時支持低功耗通信協(xié)議,形成“架構(gòu)+硬件+軟件+生態(tài)”的整體能效優(yōu)化路徑。
“我們深知,業(yè)界完全有能力打造出單臺高性能的機(jī)器人或自動駕駛系統(tǒng)。但真正的挑戰(zhàn)在于,如何實(shí)現(xiàn)數(shù)萬甚至數(shù)百萬臺同類設(shè)備的可靠部署。過去,由于軟硬件技術(shù)棧的碎片化問題,行業(yè)發(fā)展一度陷入停滯。Arm希望通過計(jì)算平臺、配套工具鏈及龐大的生態(tài)體系,通過‘一次開發(fā)、多類物理系統(tǒng)部署’的模式破解這一痛點(diǎn)。”鄒挺指出。
AI手機(jī)再升級
作為當(dāng)前智能手機(jī)的核心供應(yīng)商,Arm也是本輪AI手機(jī)熱潮的核心“推手”之一。
在2025年,AI手機(jī)一個核心特征是,僅在端側(cè)、不聯(lián)網(wǎng)條件下,高端手機(jī)已經(jīng)具備運(yùn)行30億參數(shù)規(guī)模大模型能力。這背后不僅有賴于開源模型在小型化之后的能力躍升,也離不開芯片硬件層面的支持。
Arm發(fā)布的技術(shù)趨勢中談道,得益于模型壓縮、蒸餾及架構(gòu)設(shè)計(jì)的技術(shù)突破,當(dāng)下復(fù)雜的推理模型正在實(shí)現(xiàn)數(shù)量級的規(guī)模縮減,轉(zhuǎn)化為小語言模型 (SLM),同時不會犧牲計(jì)算能力。這些輕量化模型不僅更易于在邊緣側(cè)部署、微調(diào)成本更低,還能高效適配功率受限的應(yīng)用環(huán)境。同時,模型蒸餾、量化等超高能效的AI模型訓(xùn)練技術(shù)的規(guī)模化應(yīng)用,為這一變革提供了堅(jiān)實(shí)支撐,正逐步成為行業(yè)標(biāo)準(zhǔn)。訓(xùn)練能效有望成為衡量AI模型的核心指標(biāo)。
據(jù)悉,搭載Arm Mali GPU中專用神經(jīng)加速器的智能手機(jī)將在2026年推出,這項(xiàng)移動GPU專用的神經(jīng)技術(shù)標(biāo)志著移動端側(cè)圖形和AI能力的重大飛躍,不僅支持更高幀率的4K游戲、實(shí)時視覺計(jì)算及更智能的端側(cè)AI助手等功能,且所有功能均無需依賴云端連接即可運(yùn)行。
在技術(shù)層面,鄒挺對21世紀(jì)經(jīng)濟(jì)報道記者指出,小語言模型(SLM)對手機(jī)的性能、能效、安全性及軟件適配能力提出了更高要求。
這既需要CPU、GPU、NPU等異構(gòu)算力芯片的無縫配合,實(shí)現(xiàn)動態(tài)負(fù)載均衡;也需要突破“性能-功耗-面積”三角,適配手機(jī)低功耗約束;同時,由于涉及越來越多的個人數(shù)據(jù),需要更加強(qiáng)調(diào)安全性;軟件生態(tài)適配也不能忽視,需兼容多框架與模型壓縮技術(shù),降低部署門檻,SLM快速迭代要求產(chǎn)品支持PyTorch、ExecuTorch等框架,同時適配4-bit量化等壓縮方案。
因此,在幫助手機(jī)承接大算力、多模態(tài)能力方面,Arm通過構(gòu)建“Lumex CSS計(jì)算平臺+ KleidiAI軟件庫+開放生態(tài)”作為應(yīng)對。
據(jù)介紹,借助Armv9.3 CPU集群,Arm Lumex實(shí)現(xiàn)了兩位數(shù)的性能提升和硬件級安全性;而Lumex搭載的第二代可伸縮矩陣擴(kuò)展 (SME2) 技術(shù),有更強(qiáng)的AI性能、更低的內(nèi)存占用,尤其對于音頻生成、攝像頭推理、計(jì)算機(jī)視覺或聊天交互等對實(shí)時性要求嚴(yán)苛的應(yīng)用。
KleidiAI目前已集成到多個主流AI框架,包括 Llama.cpp、ExecuTorch、MNN和LiteRT。以中國市場為例,Arm架構(gòu)CPU在阿里通義千問、百度文心大模型及騰訊混元大模型開源首日便率先完成適配,且三大模型均深度集成Arm KleidiAI。
XR眼鏡加速落地
除了AI手機(jī),近些年被認(rèn)同作為手機(jī)之外下一個端側(cè)入口的XR眼鏡也在如火如荼發(fā)展。雖然2025年中國市場經(jīng)歷了AI眼鏡的“百鏡大戰(zhàn)”,但行業(yè)普遍認(rèn)為,AR才是未來發(fā)展遠(yuǎn)景,這意味著行業(yè)仍在快速演化。
展望2026年,Arm方面指出,頭顯和智能眼鏡等增強(qiáng)現(xiàn)實(shí) (AR) 與虛擬現(xiàn)實(shí) (VR) 可穿戴設(shè)備,將在物流、運(yùn)維、醫(yī)療和零售等更廣泛的工作場景中落地應(yīng)用。這一趨勢主要得益于輕量化設(shè)計(jì)和電池續(xù)航能力的進(jìn)步,讓解放雙手的計(jì)算模式在更多場景中具備實(shí)用性。
隨著外形尺寸不斷縮小、AI能力不斷增強(qiáng)、連接體驗(yàn)愈發(fā)流暢,AR與VR可穿戴計(jì)算設(shè)備將成為推動職場向更智能、更具輔助價值的未來演進(jìn)的關(guān)鍵一步。
不過,鄒挺對記者指出,AR/VR這類可穿戴設(shè)備在企業(yè)應(yīng)用中的日益普及,要求設(shè)備在設(shè)計(jì)時,需持續(xù)滿足更嚴(yán)苛的形態(tài)規(guī)格與能耗限制要求。“不同的行業(yè)場景對實(shí)時渲染、數(shù)據(jù)處理和交互響應(yīng)速度的要求差異明顯。例如,遠(yuǎn)程醫(yī)療手術(shù)對時延極為敏感,而工業(yè)培訓(xùn)可能更關(guān)注渲染質(zhì)量和設(shè)備續(xù)航。”他說。
XR可穿戴設(shè)備在實(shí)際落地過程中,仍面臨多個方面挑戰(zhàn)。鄒挺分析道,其一是要平衡算力與能效。AR/VR穿戴設(shè)備存在電池容量有限、機(jī)身輕量化的設(shè)計(jì)約束,因此,在提供高性能計(jì)算以支撐復(fù)雜功能的同時保障長續(xù)航,是此類設(shè)備在企業(yè)級場景落地應(yīng)用的關(guān)鍵前提。
其二是多種實(shí)時交互(如視頻、語音、手勢識別)對系統(tǒng)時延提出極高要求,尤其在醫(yī)療、工業(yè)等關(guān)鍵場景。
其三,由于設(shè)備需支持從輕量級到高性能的多樣化應(yīng)用,XR設(shè)備還要有多功能異構(gòu)場景適配能力。
對此,Arm認(rèn)為需要從架構(gòu)、計(jì)算能力、軟硬協(xié)同等方面應(yīng)對。Arm C1-Nano非常適合XR(包括VR、AR)、入門級或中端設(shè)備,甚至可用于數(shù)字電視等場景,同時,Arm不斷優(yōu)化CPU、GPU、NPU等異構(gòu)計(jì)算單元,適配不同設(shè)備和應(yīng)用場景。
此外,鄒挺指出,高算力、低延時任務(wù)優(yōu)先采用終端側(cè)與邊緣側(cè)處理,同時按需調(diào)用云端資源拓展算力上限,既能減輕設(shè)備運(yùn)行負(fù)荷,又可保障關(guān)鍵場景下的實(shí)時性能。 同時也在推動生態(tài)系統(tǒng)合作,優(yōu)化操作系統(tǒng)、中間件和應(yīng)用算法,提升整體系統(tǒng)效率,降低時延。
AI計(jì)算新走向
作為AI產(chǎn)業(yè)發(fā)展的核心基座,AI芯片本身面對的市場需求也在持續(xù)演進(jìn)。除了通用計(jì)算的核心芯片GPU和CPU之外,2025年以來,ASIC、NPU等不同類型芯片也備受關(guān)注。
鄒挺對記者分析,不同類型的AI加速器各具技術(shù)優(yōu)勢,需結(jié)合具體應(yīng)用場景與工作負(fù)載特性進(jìn)行選擇。其中,NPU作為神經(jīng)網(wǎng)絡(luò)推理專用處理器,核心優(yōu)勢為AI架構(gòu)適配、高能效比、輕量化部署、本地閉環(huán)處理及多處理器協(xié)同,適用于可穿戴設(shè)備、智能揚(yáng)聲器、軟件定義智能攝像頭以及智能家居設(shè)備等場景,滿足低功耗、實(shí)時響應(yīng)、數(shù)據(jù)隱私保護(hù)核心需求。
據(jù)悉,在推動NPU能力提升方面,Arm核心聚焦兩大方向:異構(gòu)架構(gòu)協(xié)同與全棧軟件生態(tài)支撐。
在堅(jiān)持異構(gòu)架構(gòu)協(xié)同方面,Arm NPU與包括CPU、GPU在內(nèi)的多元化處理器高效協(xié)同,針對不同場景提供更優(yōu)的算力支撐。例如,Arm Cortex-A處理器作為一款面向多種應(yīng)用的可編程處理器,集成了Neon/SVE2向量引擎,旨在加速神經(jīng)網(wǎng)絡(luò)和各種向量化代碼,并原生支持多種數(shù)據(jù)類型。而對于AI工作負(fù)載明確的邊緣場景,則可通過Arm Ethos-U85這類專用NPU承載神經(jīng)網(wǎng)絡(luò)處理任務(wù),從而釋放中央處理器(CPU)資源。
生態(tài)支撐層面,Arm為Cortex-A、Cortex-M、Ethos-U等全系列AI硬件方案提供全面的開源運(yùn)行時支持,并通過Arm KleidiAI為PyTorch、ExecuTorch、Llama.cpp、TensorFlow、LiteRT等主流ML框架提供硬件加速適配。
從整體AI芯片趨勢來說,Arm方面指出,特定領(lǐng)域加速技術(shù)的興起,正在重新定義芯片性能,但這一變革并非通過簡單區(qū)分通用計(jì)算與加速器來實(shí)現(xiàn)。相反,行業(yè)正朝著系統(tǒng)級協(xié)同設(shè)計(jì)的定制化芯片方向演進(jìn),這類芯片將從系統(tǒng)層面與軟件棧協(xié)同設(shè)計(jì),并針對特定AI框架、數(shù)據(jù)類型及工作負(fù)載完成深度優(yōu)化。
其中,亞馬遜云科技 (Graviton)、Google Cloud (Axion) 和Microsoft Azure (Cobalt) 等頭部云服務(wù)提供商正在引領(lǐng)這一轉(zhuǎn)變,展示了緊密集成的平臺,即從底層開始將專用CPU、加速器、內(nèi)存和互連共同設(shè)計(jì)在一起,是實(shí)現(xiàn)可擴(kuò)展、高效且開發(fā)者可訪問的AI的核心。這一趨勢將推動下一代基礎(chǔ)設(shè)施——“融合型AI數(shù)據(jù)中心”加速落地,這類數(shù)據(jù)中心可最大化單位面積內(nèi)的AI算力,從而降低AI運(yùn)行所需的能耗總量及相關(guān)成本。
2026年,原生AI應(yīng)用與AI芯片的協(xié)同進(jìn)化,正指向一個更深層次融合的智能世界。AI不再僅是云端的數(shù)據(jù)處理工具,而是嵌入設(shè)備、融入場景、貫穿系統(tǒng)的“自主神經(jīng)”。一個由物理AI、邊緣推理與云端協(xié)同共同編織的智能新紀(jì)元,正在芯片與算力的基石上加速展開。
1.本網(wǎng)刊載內(nèi)容,凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載,請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題,請?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
盤點(diǎn)2025|光纖光纜:周期性放緩之下,確定性開始凸顯
在2025年,光纖光纜廠商們習(xí)慣于用“周期性”一詞來描述當(dāng)前的困難,相比于寬帶普及、4G升級換代帶來的流量需求猛增這一巨大業(yè)務(wù)增長。可如今在刷著短視頻、看著帶貨的新日常生活常態(tài)下,盡..[詳細(xì)]
盤點(diǎn)2025|人工智能:破局前行、以智啟新,同赴人機(jī)共生新未來
2025年,人工智能行業(yè)迎來技術(shù)迭代與價值落地的雙重關(guān)口。這一年里既延續(xù)著近年來的高速增長態(tài)勢,也迎來從野蠻生長向規(guī)范提質(zhì)的深刻轉(zhuǎn)型。 [詳細(xì)]
盤點(diǎn)2025|算力行業(yè):量質(zhì)齊升的進(jìn)階之路
在數(shù)字經(jīng)濟(jì)加速滲透全球經(jīng)濟(jì)社會各領(lǐng)域的今天,算力已成為繼電力、水資源之后的關(guān)鍵生產(chǎn)要素,是支撐數(shù)字中國建設(shè)、推動高質(zhì)量發(fā)展的核心基礎(chǔ)設(shè)施。算力的規(guī)模與質(zhì)量直接決定了數(shù)字經(jīng)濟(jì)的發(fā)..[詳細(xì)]
盤點(diǎn)2025|芯片:AI依舊是挖潛點(diǎn),應(yīng)用進(jìn)一步多樣化
時至2025年年底,人們已經(jīng)開始漸漸習(xí)慣,有事聽聽AI給出的參考意見。其背后的算力支撐也在逐步加強(qiáng),像是更先進(jìn)的制程,以及向更多端側(cè)設(shè)備的拓展。另一方面,AI又一石激起千層浪,機(jī)遇與需..[詳細(xì)]
盤點(diǎn)2025 | 從5G到6G:深耕與突破并行,開啟智能連接新紀(jì)元
2025年,全球通信產(chǎn)業(yè)站在了一個關(guān)鍵的歷史交匯點(diǎn)。這一年既是“十四五”規(guī)劃的收官年,5G建設(shè)成果全面轉(zhuǎn)化的驗(yàn)收年,也是“十五五”規(guī)劃啟幕,6G布局從技術(shù)探索邁向工程落地的奠基之年,更..[詳細(xì)]
盤點(diǎn)2025|量子信息:三大領(lǐng)域技術(shù)持續(xù)演進(jìn),產(chǎn)業(yè)發(fā)展未來可期
以量子計(jì)算、量子通信和量子精密測量為代表的量子信息技術(shù)是挑戰(zhàn)人類調(diào)控微觀世界能力極限的世紀(jì)系統(tǒng)工程,是對傳統(tǒng)技術(shù)體系產(chǎn)生沖擊、進(jìn)行重構(gòu)的重大顛覆性創(chuàng)新,將引領(lǐng)新一輪科技革命和產(chǎn)..[詳細(xì)]
盤點(diǎn)2025|2025年智能終端趨勢洞察:AI重構(gòu)體驗(yàn),超級終端時代加速到來
2025年,全球智能終端行業(yè)站在了技術(shù)革新與生態(tài)重構(gòu)的十字路口。AI技術(shù)的規(guī)模化滲透、折疊屏形態(tài)的成熟落地、跨設(shè)備協(xié)同的深度演進(jìn),正在重塑終端產(chǎn)品的價值邏輯與市場格局。[詳細(xì)]
從反詐先鋒到太空互聯(lián)守護(hù)者,全球電信運(yùn)營商都在忙些什么
之所以想談?wù)勅螂娦胚\(yùn)營商的近況,純粹是出于好奇。你是否想過,在中國人民普遍遭受過電信詐騙戕害時,其他國家的人們是否也會感同身受。很快,這個問題便有了答案,并且出人意料。近年來..[詳細(xì)]
82:1 的身份數(shù)量比挑戰(zhàn),AI普及下的網(wǎng)絡(luò)安全風(fēng)險格局
剛剛過去的2025年,很多人的日常工作開始習(xí)慣于偷點(diǎn)懶,讓AI給出更多參考,以節(jié)省幾十分鐘的思考或檢索時間。在近期派拓網(wǎng)絡(luò)給出2026 年 AI 與網(wǎng)絡(luò)安全六大預(yù)測中,給出了82:1這樣一個數(shù)字,..[詳細(xì)]
人形機(jī)器人市場爆發(fā):中國廠商領(lǐng)跑,四大場景落地提速
國際數(shù)據(jù)公司(IDC)近日發(fā)布的《全球人形機(jī)器人市場分析》報告顯示,2025年全球人形機(jī)器人出貨量約1.8萬臺,同比增長約508%。中國廠商在規(guī)模化商用進(jìn)程中表現(xiàn)強(qiáng)勁,全球人形機(jī)器人市場銷量..[詳細(xì)]












