從DeepSeek“上新”看AI演進 大模型將成“全能管家”?
12月1日晚間,DeepSeek一口氣發布了DeepSeek-V3.2和DeepSeek-V3.2-Speciale兩個正式版模型。
《科創板日報》記者注意到,此次新發布的DeepSeek-V3.2系列模型,主要強在推理能力的提升。
在Benchmark推理測試中,V3.2與GPT5、Claude 4.5在不同領域各有高低,只有Gemini 3 Pro對比前三者均有較明顯優勢。
而與月之暗面新發布的Kimi-K2-Thinking相比,V3.2的輸出長度大幅降低,顯著減少了計算開銷與用戶等待時間。
對于這次DeepSeek新模型的發布,IDC中國研究總監盧言霞向《科創板日報》記者認為,其將推理能力融入到既有大模型,使得大語言模型、多模態大模型本身就具備推理能力,這也是未來的發展方向,會讓模型推理更快,以解決之前純推理模型速度慢的問題。
快思慢想研究院院長、特邀評論員田豐則向《科創板日報》記者稱, DeepSeek新模型降低了推理成本,通過稀疏注意力機制,使128K長上下文推理成本降低數倍,內存占用減少70%。
與此同時,DeepSeek作為開源模型在某些領域實現對閉源模型的反超,通過RL強化學習投入超過預訓練投入,以規模化投入強化學習創新路徑,直接推動模型在數學推理(IMO金牌)、編程(ICPC世界第二)等硬核任務中達到GPT-5水平。
此外,DeepSeek V3.2模型從“工具調用”邁向“思考型智能體”,實現“文武兼優”。V3.2版本引入“思考保留”模式,支持將工具調用嵌入完整的推理鏈條中,從而有效規避傳統智能體常見的“記憶斷裂”問題。比如,面對多步驟復雜任務時,模型能夠基于歷史工具執行結果持續優化決策,而無需重啟推理流程。
技術報告顯示,在智能體評測中,V3.2得分高于同為開源的Kimi-K2-Thinking和MiniMax M2。
不過, DeepSeek也承認,與Gemini3 Pro等前沿閉源模型相比,自家模型仍存在一定的局限性。首先,V3.2的世界知識廣度仍落后于領先的專有模型,其次在令牌(Token)效率方面,V3.2通常需要更多的令牌才能達到像Gemini3 Pro這樣的模型輸出質量。在解決復雜任務方面也不如前沿模型。
DeepSeek方面稱,團隊計劃在未來通過增加預訓練計算量來填補知識空白,并專注于優化模型推理鏈的智能密度以提高效率,進一步改進基礎模型和訓練后方案。
一位AI智能體業內人士在實測后向《科創板日報》記者表示,DeepSeek的多智能體效果優于國內其他模型,而低于谷歌Gemini。
對于DeepSeek近期的新模型都在發力智能體,盧言霞認為,未來的大模型就是智能體平臺,這是必然趨勢。
“大模型衍生出來的智能體,將首先在部分垂直應用場景落地。然而,要構建系統級的智能體,仍要克服數據、硬件、知識融合與外部生態協同等多重挑戰。展望未來,專用的智能體開發平臺將應運而生。一個明確的趨勢是,基礎大模型能力將越來越延伸,進化為可自主行動的智能體。”
從智能體的發展方向上來看,田豐表示,目前在深度思考、調用工具兩類發展方向上漸趨融合,同時解決長記憶能力、復雜任務規劃能力。
此外,服務執行正在取代信息搜索。田豐表示,初級智能體只能查詢信息、缺少執行能力,而以千問app、豆包AI、 DeepSeek等為代表的智能體,則能將購物、支付、物流、社交、娛樂等綜合O2O服務融為一體,即是百事通,又是“全能管家”。
田豐還看好智能體解決行業專有問題。“法律、財會、醫療、制造、能源、政務、教育等智能體將成為剛需,萬金油不如一招鮮,用戶會對解決工作生活剛需的專用智能體更有興趣,通過通用智能體調用專用智能體也成為一籃子協同模式。”
1.本網刊載內容,凡注明來源為“飛象網”和“飛象原創”皆屬飛象網版權所有,未經允許禁止轉載、摘編及鏡像,違者必究。對于經過授權可以轉載,請必須保持轉載文章、圖像、音視頻的完整性,并完整標注作者信息和飛象網來源。
2.凡注明“來源:XXXX”的作品,均轉載自其它媒體,在于傳播更多行業信息,并不代表本網贊同其觀點和對其真實性負責。
3.如因作品內容、版權和其它問題,請在相關作品刊發之日起30日內與本網聯系,我們將第一時間予以處理。
本站聯系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
當6G遇見AI,通信如何重塑我們的未來?
在第十三屆通信和寬帶網絡國際會議(ICCBN2025)上,我們就見證了一次源自未來的變革。當來自全球20多個國家的數百位頂尖專家齊聚一堂,不光帶來幾十場精彩的演講,還展示了眾多突破性技術成..[詳細]
技術重構帶動產業升級:“5G+工業互聯網”交出硬核答卷
在過去五年間,中國從各級政府到各行業企業都在積極探索“5G+工業互聯網”,嘗試將新一代數字技術深度融入實體經濟,實現工業領域的全面升級。在國內電信運營商和ICT產業的大力支持下,中國..[詳細]
第五代驍龍8的意義:鮮衣怒馬少年時,旗艦本色正當風
兩周零三天以后,面對第五代驍龍8的發布,現場觀眾將會回想起驍龍與年輕用戶群體一起狂歡共度的那個決賽夜晚。[詳細]
賦能新型工業化,三大運營商都做了啥?
“近年來,我國工業互聯網逐步打造了IT(信息技術)、CT(通信技術)、OT(運營技術)、DT(數據技術)“4T融合”的技術產業體系,融合應用拓展至國民經濟全部41個工業大類。“近日,在2025..[詳細]
存儲芯片掀起漲價潮:手機廠商承壓 明年換機更貴了?
近日,微博話題 “25 年是買手機最好的節點嗎” 登上熱搜,引發網友廣泛熱議。伴隨著內存、存儲芯片的上漲,手機價格上漲預期增加,不少網友問2025年是否為最佳換機時間。[詳細]













