Token為王,如何打贏AI時代“新大宗商品”爭奪戰?
無形的海量Token(詞元)順著網線,賣到全球各地,就像有形的大宗商品通過路網銷往全球一樣——Token正在成為AI時代的“新石油”和“新集裝箱”。
隨著Agent(智能體)時代的來臨,尤其是OpenClaw(龍蝦)應用爆火,AI的任務執行模式從人機對話升級為機器自循環,Token消耗量指數級增長,其角色從模型訓練的技術副產品,一躍成為可計量、可交易的戰略資產。
這種劇變重塑互聯網大廠底層邏輯:商業模式從“燒錢換流量”邁向“按Token計費”,競爭模式也從“參數競賽”轉向“Token經濟體系構建”。在這場圍繞Token展開的競逐中,老玩家的“二次創業重塑”與新玩家平衡“保利潤還是保用戶”交織而行,共同演繹著下一代AI競爭劇本。
更深遠的變化也在醞釀。多位受訪者認為,所有企業都值得重新評估能否被裝在Token里重構,這將誕生新的產業巨頭。
Token作為定義未來十年技術版圖與產業話語權的關鍵變量,如何在這個“新大宗”全球貿易網絡中尋得更多主導權,需要不同于互聯網時代流量邏輯的新模式,這考驗所有參與者的智慧。
新大宗商品
多數受訪者都沒料到,隨著“龍蝦”的到來,Token需求的爆發來得如此之快。
Token是大語言模型處理信息的基本單位。在AI世界,Token可以是一個詞、一段代碼,也可以是圖像或視頻中的一個像素區塊。當用戶向AI模型提問,模型先把用戶的話“切”成Token,算完后再把結果Token拼回成句子。
百度千帆平臺產品負責人張婷將Token比喻成“樂高積木”——單個Token是碎片,但大模型把成千上萬個Token的“拼法”學會后,就能理解語義、生成文本、回答問題。每生成一個Token,都在調用數據中心的GPU(圖形處理器)算力,并伴隨著電力消耗。
過去兩年,大模型競爭的核心敘事是模型能力:誰更聰明,誰就更接近AGI(通用人工智能)。參數規模、推理深度、復雜任務完成率,構成行業主要競爭指標。隨著Agent時代的來臨,在“自主拆解—調用模型—完成任務”新屬性下,Token消耗從人機對話升級為機器自循環,消耗量級跳漲。
任職于范式智能的谷少輝說,Chatbot(聊天機器人(14.790, 0.00, 0.00%))時代,GPU就好像餐廳服務員,一桌客人上完菜就去下一桌;Agent時代,服務員全程陪同,從點菜到結賬,思考菜單的時候也不能走。粗略估算,Chatbot單輪對話消耗約1000到3000個Token,而“龍蝦”跑一次深度研究要經歷感知、規劃、執行、反思等多個循環,稍微復雜的任務就要吃掉百萬級Token。
無問芯穹聯合創始人夏立雪的感受頗具代表性:從1月開始,公司Token消耗每兩周就翻一番,至今已經翻了10倍。“上次見到這個速度,還是多年前3G手機流量時代。”
業內共識是,需求曲線仍處陡峭上升期。多Agent并行、長上下文推理、編程場景的爆發才剛剛開始,每一個新場景打開都意味著Token消耗量再上一個臺階。同時,AI已跨越感知與生成階段,以智能體和物理AI為核心的執行時代,所需的Token量和計算量相比訓練階段會幾何級別增加。
黃仁勛日前提出“Token經濟學”概念,認為推理已成為AI最核心的工作負載,Token則是新的大宗商品——標準化、可計量、可交易。由此Token從模型訓練的技術副產品,演變為驅動數字經濟的核心生產要素。
3月22日,國家數據局方面表示,Token是智能時代的價值錨點,更是連接技術供給與商業需求的“結算單位”,Token有了官方翻譯“詞元”。
“這次定調前,圈內就在熱議Token該如何翻譯。”谷少輝透露,“張一鳴用計算機術語‘字節’給公司起名真是一步到位,這個基本單位的技術感、力量感并存,認知成本幾乎為零”。
業內對于Token的熱度也直接投射到資本市場。“Token第一股”迅策股價,已經從上市之際的40港元附近狂飆5倍。該公司收費將從訂閱和交易制向Token升級,這將使收益與客戶價值創造深度綁定,實現利潤率擴張。
同樣在港股上市的美圖公司,商業模式也在從訂閱模式延伸到Token消耗。公司首席產品官陳劍毅用咨詢舉例,“每個
行業的咨詢費都不一樣,針對不同行業所能創造的商業價值做Token定價”。
AI時代的“集裝箱”
大宗商品的特征之一是全球流動。
一個美國程序員打開電腦,調用DeepSeek的API來寫代碼。敲下回車后,請求數據通過太平洋(3.770, 0.00, 0.00%)海底光纜,到達中國西部的數據中心,中國的GPU集群消耗著中國電力,幫這位程序員把代碼“跑”出來,結果再傳回美國。整個過程不到1秒鐘,算力、電力都沒有離開中國,而程序員為這次服務支付了數美元。這是Token出海的一個典型場景。
上世紀50年代,全球貿易的成本一半左右是裝卸費,后來集裝箱被發明,貨物運輸被標準化,全球貿易迎來大繁榮。谷少輝將Token比作“AI時代的集裝箱”——中國本土AI模型通過API接口向全球提供推理服務,按處理量計費,算力與電力實現“數字化出口”。
3月30日,據全球大模型聚合路由平臺OpenRouter數據,上周全球模型調用量排名榜中,國產大模型調用量連續一個月超過海外模型。MiniMax、月之暗面等排名持續靠前。資本競逐下,今年剛上市的智譜、MiniMax這兩顆國產AI大模型“雙子星”,市值直逼京東。
最新財報顯示,MiniMax去年收入7903萬美元,超過70%收入來自國際市場。此外,Kimi等多家平臺均對證券時報記者證實,API海外調用今年以來快速增長。
中國模型足量、低價,一些企業樂意花錢補貼海外開發者,這些都放大了市場持續調用的需求,增強了中國Token服務在全球市場上的推廣和使用中的優勢。在谷少輝看來,這是政府工作報告中“算電協同”、“智能經濟新形態”在產業層面的落地。“Token出海,或成為中國制造之后下一個出口引擎。”他說。
中美大模型性能差異不大,價格卻有數倍之別,背后原因在于中國電力和算力優勢。中國借助“東數西算”、數字經濟等超前布局,接住了Token消耗狂飆的紅利。有券商測算,國產AI模型綜合推理成本僅為海外的1/10至1/6,多維優勢轉化為中國在全球AI服務市場的定價權。
Token成為“新大宗”,數據中心從存儲設施演變為“Token工廠”——進入的是數據和電力,產出的則是詞元和智能體執行能力。今年以來,二級市場資金多次圍獵電力板塊,背后原因就與“Token工廠”可能帶來電力價值重估有關。
長期聚焦AI產業投資的基金經理楊勇舉例,一度電直接出口通常在0.5元左右;做成鋁錠可售1.5元;用來跑大模型推理,能產生500萬Token,按照國內模型定價可以賣到10元,按照OpenAI定價可以上百元。
谷少輝認為,幾乎所有產業出海都與電力優勢相關。“制造業出海,可以視為電力加勞動力;精煉稀土等出海可以看作電力加資源;電力加算力下的Token出海是第三種電力出海形式。Token不是實物,而是服務貿易,這可能導致未來中美雙邊服務貿易差縮窄。”
“所有產業都值得被Token重構一遍,企業應該評估自己能不能裝到Token里賣(服務)。”谷少輝說,“設計、咨詢、教育……一旦變成可計量的智能服務,就可以規模化,這將是誕生新的垂直產業巨頭的土壤。”
老玩家的新風口
與作為計量單位的Token狂飆相伴生的,是作為基礎設施的算力競賽。
新玩家智譜和MiniMax均處年度虧損狀態,背后與龐大的資本開支密不可分。而老玩家方面,分別聚焦社交、搜索、電商、內容賽道的騰訊、百度、阿里和字節,在AI競賽中,也在拼模型能力、拼算力資源,在AI基礎設施及相關技術研發方面的資本開支持續加大。
從2025年財報來看,大廠中阿里資本支出最高,數額突破千億元;騰訊和百度在百億元級別。“大廠仍處在算力擴張期,多數都將獲取最先進的訓練芯片、更快迭代訓練模型放在更高優先級,而并非先考慮降低推理成本。”楊勇表示。
國際巨頭算力“軍備競賽”更為夸張,從2024年到2026年三年間,僅微
軟、亞馬遜、谷歌、Meta四家公司的年度總資本支出就從約2000億美元飆升到5000億美元以上。不少科技巨頭從高利潤的輕資產模式,轉向類似公用事業或制造業的重資產模式,一些公司負債率急升。
楊勇認為,量級雖不同,但中美巨頭都在將海量資本投入到AI算力建設中,這是爭奪下一代人工智能平臺主導權的生死之戰。只有贏家才能定義未來十年的技術格局。
但高額投入帶來新問題。以折舊為例,英偉達的AI芯片迭代周期通常為一年左右。“今天花幾千億建的數據中心,GPU不到兩年就不是最優版本,折舊應該怎么算呢?”楊勇反問。
中國云廠商們也進入全新的重資產設備周期。過去20年,云計算的敘事是“輕”——彈性伸縮、按需付費、用多少買多少。但算力需求膨脹使大廠算力部署表現激進,折舊攤銷必將壓在利潤表上。“阿里云、火山引擎巨資投入,很像電信運營商3G/4G網絡周期內的資本開支競賽。”楊勇說。
這導致國際國內大廠更加依賴融資補血。但新問題隨之出現。例如,新勢力港股上市后,普遍要面對“是繼續租算力還是自己買設備,是保利潤率還是保用戶”的艱難平衡。老玩家壓力也很大。以阿里為例,一邊是即時零售搶食美團的基本盤,另一邊在“全棧式AI布局”下,算力燒錢兇猛,阿里將自身定義為“新的創業重塑”。
“阿里正試圖從一個以電商為主業的平臺,轉型為一家覆蓋從AI芯片、云計算基礎設施、基礎大模型到企業和消費者應用的全棧AI科技公司。轉型結果將決定其在未來十年科技版圖中的位置。”谷少輝說。
系統性新要求
Token調用量爆發帶動算力需求,拉動了算力相關服務的價格。3月,騰訊云、阿里云和百度智能云,國內三大云廠商接連提高AI算力產品價格,十天之內漲價30%左右。同濟大學經濟與管理學院教授阮青松認為,漲價最先受益的是上游的芯片、服務器這些硬件廠商,而下游使用AI的應用和終端成本壓力加大,倒逼企業要么提高效率,要么減少成本,可能會加速國產算力的替代進程,推動整個行業在技術創新上更進一步。
市場解讀為大廠利好,但有接近騰訊的人士對記者介紹,擴建AI算力基礎設施的資本開支動輒數百億量級,但AI業務本身的利潤率還很薄。目前賣Token的收入增速遠遠追不上建數據中心的花錢速度。“漲價不是云廠商貪心,而是供應鏈漲價的無奈之舉。”在他看來,與此前低價引流、先把算力用起來的“Token價格戰”相比,算力市場定價正在轉向供需關系決定。
在三六零(10.730, -0.05, -0.46%)創始人周鴻祎看來,互聯網流量是信息搬運,邊際成本趨近于零,能走免費模式;但Token是智力產出,靠算力、芯片、電力支撐,用戶越多、消耗越大、成本越高,邊際成本遞增,免費模式走不通。“現在行業都在賠錢做AI,就是因為免費慣性。智能體正在教育用戶:軟件免費、部署免費,但算力和Token需要付費,就像給數字員工發工資一樣。這才是AI新勢力活下去、互聯網大廠進入可持續發展的健康模式。”
為了適配AI新經濟體系,阿里宣布正式成立新的事業群,建立以“創造Token、輸送Token、應用Token”為核心目標的新組織,由CEO吳泳銘直接負責,以Token Hub為核心主線,強化AI業務戰略協同,推進AI戰略落地。與阿里的全棧模式不同,騰訊的策略重心在于把握Token的流向入口。比如,用戶在微信下達指令,Agent在云端執行任務,結果返回用戶。由此,Token消耗被自然引導至騰訊云生態。
楊勇認為,對
大廠而言,Token時代提出的新要求是系統性的:戰略上要從模型競賽轉向經濟體系構建,組織上要從分散賽馬轉向中樞協同,商業上要從燒錢換流量轉向Token計費變現。“一方面是資本開支,另一方面也要成功轉身,這樣才能在AI時代占據基礎設施的話語權。”
股價被爆炒的迅策,其業務本質是為每次Token調用加裝“增效器”,在消耗Token時換取更高精度的結果,獲取最高產出確定性。通過垂類AI解決方案,避免因推理失敗造成的Token浪費。迅策認為,使用公開數據,Token燒在“試錯”上;用專業數據,Token燒在“創造價值”上,前者是成本,后者是投資。
美圖公司陳劍毅對證券時報記者介紹,整個互聯網行業將出現一個新趨勢——很多公司會定制Token消耗預算,在野蠻擴張下,Token消耗量為王;但未來好的產品應該是在幫助用戶滿足任務的同時盡量減少Token消耗數,可以根據所交付的商業價值給不同Token做更高的商業議價。因此,美圖會關注幫用戶降低Token消耗的次數,做更好的商業轉化。
百度張婷暢想,五年后,Token一詞可能從普通用戶的視野里消失,其價值會以另一種形式存在——就像現在打滴滴不需要關心汽油消耗了多少升,用AI寫一份報告不用關心消耗了多少Token,直接為成果付費。“MaaS(模型即服務)只是起點,最終希望提供的是端到端的AI能力,讓企業客戶不用關心底層是哪個模型、消耗了多少Token,而是關注AI解決了什么問題,帶來了多少價值。”
“黃仁勛判斷Token是新時代的大宗商品。但歷史告訴我們,在大宗商品的全球貿易網絡中,最終掌握主導權的,往往不是擁有最多原始礦藏的玩家,而是擁有高效提煉與轉化技術的人。”谷少輝說,中國AI需要投入、需要效率,也需要更多不同于互聯網流量時代的商業模式創新,來定義全球智能算力的貿易版圖。
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
2026十大科技趨勢
2026 十大科技趨勢,定義新一年的每一次突破。祝大家馬年大吉,馬到成功!初八啟新程,萬事皆順遂!
[詳細]
三大運營商2025年報:營收穩中有進 算力等新興產業成效顯現
近日,中國移動、中國電信、中國聯通三大電信運營商2025年年度報告已全部對外披露。作為我國數字經濟發展的“國家隊”與主力軍,三大運營商在2025年頂住行業競爭加劇、傳統業務增長趨緩等多..[詳細]
告別“大黑屏” 智能手機如何走出增長困局?
從首款智能手機問世至今十余年間,這塊握在掌心的 “大黑屏” 曾憑借不斷刷新的硬件參數掀起一輪輪換機潮,成為移動互聯網時代的核心載體。但如今,全球手機市場早已告別高速增長,換機周期..[詳細]
中國電信2025年財報透視:雙輪融合發力 “AI+”重構增長邏輯
2025 年,中國電信緊扣數字經濟與人工智能發展浪潮,完成云改數轉向云改數轉智惠的戰略升級,全年經營業績穩健收官,核心業務穩固、創新業務高增、數字基建持續加碼,在算力、AI、量子、低空..[詳細]
當速率不再是核心主題,5G網絡好壞如何重新考量?
回首5G網絡部署之初,宣傳口徑往往聚焦于“速率”,但歷經時間的反復押韻,很多受眾都發現,原來“看電視”這項用例,可以從3G一直宣傳到5G。而當如今人們在談論6G的時候,終于不用再看到滿..[詳細]
劉烈宏:以高質量數據賦能AI創新,加快培育智能經濟新形態
當前,人工智能發展正經歷著一場前所未有的加速演進,一個又一個熱點事件接連涌現。在技術創新與商業應用的雙輪驅動下,人工智能產業規模持續增長,從去年春節DeepSeek開源模型出圈,到機器..[詳細]
AI賦能中小企業仍處于初期探索階段
新一代人工智能正在全球范圍蓬勃興起,成為新一輪科技革命和產業變革的戰略性技術和重要驅動力量。開展人工智能賦能中小企業高質量發展研究,既是人工智能技術推進規模化商業化應用、加速向..[詳細]
華為啟動“乾坤 · 眾智同行”計劃:與伙伴共同創造、共同受益,把中國方案帶向世界
AI大潮洶涌而來,千行百業都在向云端、向智能化遷移,期待新的ICT技術方案能夠帶來更高的工作效率、更好的服務品質、更理想的用戶體驗。不過每個行業的應用場景不同,每個企業的服務對象和市..[詳細]
5G-A大上行成產業共識,差異化體驗賦能行業升級
數據顯示,截止2026年1月,全球已有374個運營商部署5G網絡,為各國用戶提供了更好的體驗,也涌現了很多新的需求,比如高清直播需要大上行,人群密集場所需要大容量,工業智能化需要低時延等..[詳細]
6G時代的智能設備:反思自身、協同彼此、共同推理
經歷了MWC26,很多人都對6G有了更加直觀的認識,如同5G時代的高速率、低時延、廣連接,6G給出的答案是連接、廣域感知和高性能計算。不過,正如5G當初所暢想的智能工廠與萬物互聯,6G自然也需..[詳細]













