本報電 (記者劉峣)近日,北京智源人工智能研究院正式發(fā)布原生多模態(tài)世界模型Emu3。該模型實現(xiàn)了視頻、圖像、文本三種模態(tài)的統(tǒng)一理解與生成,成功驗證了基于下一個token(詞元)預測的多模態(tài)技術范式,釋放其在大規(guī)模訓練和推理上的潛力。
據(jù)了解Emu3只基于下一個token預測,無需擴散模型或組合式方法,把圖像、文本和視頻編碼為一個離散空間,在多模態(tài)混合序列上從頭開始聯(lián)合訓練一個Transformer。
智源研究院院長王仲遠表示,Emu3為構建多模態(tài)通用人工智能提供了廣闊的技術前景,有機會將基礎設施建設收斂到一條技術路線上,為大規(guī)模多模態(tài)訓練和推理提供基礎。未來,多模態(tài)世界模型將促進機器人大腦、自動駕駛、多模態(tài)對話和推理等場景應用。
北疆新聞:內蒙古自治區(qū)重點新聞網站(客戶端),內蒙古出版集團新華報業(yè)中心旗下國家互聯(lián)網新聞信息采編發(fā)布服務一類資質網站(客戶端)。
北疆新聞版權與免責聲明:
一、凡本站中注明“來源:北疆新聞”的所有文字、圖片和音視頻,版權均屬北疆新聞所有,轉載時必須注明“來源:北疆新聞”,并附上原文鏈接。
二、凡來源非北疆新聞的新聞(作品)只代表本網傳播該消息,并不代表贊同其觀點。
如因作品內容、版權和其它問題需要同本網聯(lián)系的,請在見網后30日內進行,聯(lián)系郵箱:bjwmaster@163.com。
版權聲明:北疆新聞版權所有,未經書面授權,不得轉載或建立鏡像,違者依法必究。 本站違法和不良信息舉報電話:15648148811蒙ICP備16001043號-1
Copyright © 2016- 北疆新聞網 All Rights Reserved互聯(lián)網新聞信息服務許可證:15120200009-1蒙公網安備:15010502001245