人物專訪監(jiān)管
制造芯片
6G運(yùn)營(yíng)
大數(shù)據(jù)物聯(lián)網(wǎng)
移動(dòng)互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

我國(guó)大模型成果首次登上《自然》正刊
近日,北京智源人工智能研究院的多模態(tài)大模型成果“通過(guò)預(yù)測(cè)下一個(gè)詞元進(jìn)行多模態(tài)學(xué)習(xí)的多模態(tài)大模型”上線國(guó)際頂級(jí)學(xué)術(shù)期刊《自然》,預(yù)計(jì)2月12日紙質(zhì)版正式刊發(fā),這是我國(guó)科研機(jī)構(gòu)主導(dǎo)的大模型成果首次在《自然》正刊發(fā)表。
2018年以來(lái),GPT采用“預(yù)測(cè)下一個(gè)詞元(NTP)”的自回歸路線,實(shí)現(xiàn)了語(yǔ)言大模型重大突破,開(kāi)啟了生成式人工智能浪潮。而多模態(tài)模型主要依賴對(duì)比學(xué)習(xí)、擴(kuò)散模型等專門(mén)路線,自回歸路線是否可以作為通用路線統(tǒng)一多模態(tài)?一直是未解之謎。
智源研究院提出的Emu3模型,基于“預(yù)測(cè)下一個(gè)詞元”的全新多模態(tài)模型,將圖像、文本和視頻統(tǒng)一離散化到同一個(gè)表示空間中,并從零開(kāi)始,在多模態(tài)序列混合數(shù)據(jù)上聯(lián)合訓(xùn)練一個(gè)單一的Transformer。這一架構(gòu)證明了僅憑“預(yù)測(cè)下一個(gè)詞元”,就能夠同時(shí)支持高水平的生成能力與理解能力,并且在同一統(tǒng)一架構(gòu)下,自然地?cái)U(kuò)展到機(jī)器人操作以及多模態(tài)交錯(cuò)等生成任務(wù)。
實(shí)驗(yàn)顯示,Emu3在生成與感知任務(wù)上的整體表現(xiàn)可與多種成熟的任務(wù)專用模型相媲美:在文生圖任務(wù)中,其效果達(dá)到擴(kuò)散模型水平;在視覺(jué)語(yǔ)言理解方面,可以與融合CLIP和大語(yǔ)言模型的主流方案比肩。此外,Emu3還具備視頻生成能力。不同于以噪聲為起點(diǎn)的擴(kuò)散式視頻生成模型,Emu3通過(guò)自回歸方式逐詞元(token)預(yù)測(cè)視頻序列,實(shí)現(xiàn)基于因果的視頻生成與延展,展現(xiàn)出對(duì)物理世界中環(huán)境、人類與動(dòng)物行為的初步模擬能力。
這項(xiàng)成果表明,只采用自回歸路線,就可以統(tǒng)一多模態(tài)學(xué)習(xí),訓(xùn)練出優(yōu)秀的原生多模態(tài)大模型,對(duì)于確立自回歸成為生成式人工智能統(tǒng)一路線具有重大意義。值得一提的是,智源研究團(tuán)隊(duì)對(duì)相關(guān)研究的多項(xiàng)關(guān)鍵技術(shù)與模型進(jìn)行了開(kāi)源,以推動(dòng)該方向的持續(xù)研究。
《自然》編輯點(diǎn)評(píng)這項(xiàng)研究:Emu3僅基于預(yù)測(cè)下一個(gè)詞元,實(shí)現(xiàn)了大規(guī)模文本、圖像和視頻的統(tǒng)一學(xué)習(xí),其在生成與感知任務(wù)上的性能可與使用專門(mén)路線相當(dāng),這一成果對(duì)構(gòu)建可擴(kuò)展、統(tǒng)一的多模態(tài)智能系統(tǒng)具有重要意義。
1.本網(wǎng)刊載內(nèi)容,凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有,未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載,請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源:XXXX”的作品,均轉(zhuǎn)載自其它媒體,在于傳播更多行業(yè)信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系,我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777,郵件后綴為cctime.com,冒充本站員工以任何其他聯(lián)系方式,進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。
盤(pán)點(diǎn)2025|光纖光纜:周期性放緩之下,確定性開(kāi)始凸顯
在2025年,光纖光纜廠商們習(xí)慣于用“周期性”一詞來(lái)描述當(dāng)前的困難,相比于寬帶普及、4G升級(jí)換代帶來(lái)的流量需求猛增這一巨大業(yè)務(wù)增長(zhǎng)。可如今在刷著短視頻、看著帶貨的新日常生活常態(tài)下,盡..[詳細(xì)]
盤(pán)點(diǎn)2025|人工智能:破局前行、以智啟新,同赴人機(jī)共生新未來(lái)
2025年,人工智能行業(yè)迎來(lái)技術(shù)迭代與價(jià)值落地的雙重關(guān)口。這一年里既延續(xù)著近年來(lái)的高速增長(zhǎng)態(tài)勢(shì),也迎來(lái)從野蠻生長(zhǎng)向規(guī)范提質(zhì)的深刻轉(zhuǎn)型。 [詳細(xì)]
盤(pán)點(diǎn)2025|算力行業(yè):量質(zhì)齊升的進(jìn)階之路
在數(shù)字經(jīng)濟(jì)加速滲透全球經(jīng)濟(jì)社會(huì)各領(lǐng)域的今天,算力已成為繼電力、水資源之后的關(guān)鍵生產(chǎn)要素,是支撐數(shù)字中國(guó)建設(shè)、推動(dòng)高質(zhì)量發(fā)展的核心基礎(chǔ)設(shè)施。算力的規(guī)模與質(zhì)量直接決定了數(shù)字經(jīng)濟(jì)的發(fā)..[詳細(xì)]
盤(pán)點(diǎn)2025|芯片:AI依舊是挖潛點(diǎn),應(yīng)用進(jìn)一步多樣化
時(shí)至2025年年底,人們已經(jīng)開(kāi)始漸漸習(xí)慣,有事聽(tīng)聽(tīng)AI給出的參考意見(jiàn)。其背后的算力支撐也在逐步加強(qiáng),像是更先進(jìn)的制程,以及向更多端側(cè)設(shè)備的拓展。另一方面,AI又一石激起千層浪,機(jī)遇與需..[詳細(xì)]
盤(pán)點(diǎn)2025 | 從5G到6G:深耕與突破并行,開(kāi)啟智能連接新紀(jì)元
2025年,全球通信產(chǎn)業(yè)站在了一個(gè)關(guān)鍵的歷史交匯點(diǎn)。這一年既是“十四五”規(guī)劃的收官年,5G建設(shè)成果全面轉(zhuǎn)化的驗(yàn)收年,也是“十五五”規(guī)劃啟幕,6G布局從技術(shù)探索邁向工程落地的奠基之年,更..[詳細(xì)]
盤(pán)點(diǎn)2025|量子信息:三大領(lǐng)域技術(shù)持續(xù)演進(jìn),產(chǎn)業(yè)發(fā)展未來(lái)可期
以量子計(jì)算、量子通信和量子精密測(cè)量為代表的量子信息技術(shù)是挑戰(zhàn)人類調(diào)控微觀世界能力極限的世紀(jì)系統(tǒng)工程,是對(duì)傳統(tǒng)技術(shù)體系產(chǎn)生沖擊、進(jìn)行重構(gòu)的重大顛覆性創(chuàng)新,將引領(lǐng)新一輪科技革命和產(chǎn)..[詳細(xì)]
盤(pán)點(diǎn)2025|2025年智能終端趨勢(shì)洞察:AI重構(gòu)體驗(yàn),超級(jí)終端時(shí)代加速到來(lái)
2025年,全球智能終端行業(yè)站在了技術(shù)革新與生態(tài)重構(gòu)的十字路口。AI技術(shù)的規(guī)模化滲透、折疊屏形態(tài)的成熟落地、跨設(shè)備協(xié)同的深度演進(jìn),正在重塑終端產(chǎn)品的價(jià)值邏輯與市場(chǎng)格局。[詳細(xì)]
2026十大AI技術(shù)趨勢(shì):應(yīng)用拓展、模式探索與底層技術(shù)齊頭并進(jìn)
在2025年,人工智能技術(shù)不僅繼續(xù)向著更快、更強(qiáng)、更多能的方向發(fā)展,還在向著小而精的新方向發(fā)展,并因此得以大步走出實(shí)驗(yàn)室,以令人吃驚的速度快速融入各行各業(yè)的業(yè)務(wù)應(yīng)用。時(shí)間進(jìn)入2026年..[詳細(xì)]
XR3.0時(shí)代,產(chǎn)業(yè)已邁入發(fā)展“快車道”
虛擬(增強(qiáng))現(xiàn)實(shí)(簡(jiǎn)稱XR)是新一代信息技術(shù)的重要前沿方向,是數(shù)字經(jīng)濟(jì)的重大前瞻領(lǐng)域,將深刻改變?nèi)祟惖纳a(chǎn)生活方式,各國(guó)政府重視該領(lǐng)域的發(fā)展布局,美韓持續(xù)推進(jìn)沉浸式技術(shù)戰(zhàn)略,我國(guó)..[詳細(xì)]
從反詐先鋒到太空互聯(lián)守護(hù)者,全球電信運(yùn)營(yíng)商都在忙些什么
之所以想談?wù)勅螂娦胚\(yùn)營(yíng)商的近況,純粹是出于好奇。你是否想過(guò),在中國(guó)人民普遍遭受過(guò)電信詐騙戕害時(shí),其他國(guó)家的人們是否也會(huì)感同身受。很快,這個(gè)問(wèn)題便有了答案,并且出人意料。近年來(lái)..[詳細(xì)]












