国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Lumina-DiMOO:多模態(tài)擴散語言模型重塑圖像生成與理解

人工智能 新聞
Lumina-DiMOO 讓我們再次接近 “原生多模態(tài)智能” 的理想。它能讀、能寫、能畫、能思考 —— 真正實現(xiàn)從感知到創(chuàng)造的統(tǒng)一閉環(huán)。

上海人工智能實驗室推出了一款革新的多模態(tài)生成理解一體化的擴散語言模型 ——Lumina-DiMOO。基于離散擴散建模(Discrete Diffusion Modeling),Lumina-DiMOO 打破了多模態(tài)任務(wù)之間的壁壘,在同一離散擴散框架下,完成從 文本→圖像、圖像→圖像、圖像→文本的全棧能力閉環(huán)。

  • 論文標(biāo)題:Lumina-DiMOO: An Omni Diffusion Large Language Model for Multi-Modal Generation and Understanding
  • 論文鏈接:arxiv.org/pdf/2510.06308
  • GitHub 地址:Alpha-VLLM/Lumina-DiMOO  
  • 關(guān)鍵詞:多模態(tài)生成與理解統(tǒng)一、擴散語言模型

過去:自回歸生成的瓶頸

從 Chameleon 到 Lumina-mGPT,再到 Janus-Pro—— 主流 “多模態(tài)統(tǒng)一模型”,幾乎都基于 自回歸(AR)架構(gòu)。這些模型的架構(gòu)存在顯著缺陷:

  1. 生成太慢:逐 token 生成,導(dǎo)致圖像生成通常需要幾分鐘;
  2. 生成質(zhì)量受限:圖像細(xì)節(jié)的表現(xiàn)力較弱,尤其是在高分辨率生成時,精細(xì)度無法保證;
  3. 任務(wù)間無法無縫銜接:多模態(tài)的生成和理解任務(wù)往往分開處理,導(dǎo)致模型的通用性和效率受到制約。

然而,Lumina-DiMOO 采用了純離散擴散框架,徹底解決了上述問題。在這個全新的架構(gòu)中,我們通過并行化的雙向注意力機制和靈活的采樣策略,實現(xiàn)了跨多任務(wù)的高效融合,不僅加速了生成過程,還提升了生成質(zhì)量。

現(xiàn)在:擴散語言模型的崛起

Lumina-DiMOO,作為一款全新推出的多模態(tài)擴散語言模型,憑借其創(chuàng)新的離散擴散架構(gòu),不僅在圖像生成和文本生成之間架起了無縫橋梁,還在理解和生成任務(wù)中實現(xiàn)了跨模態(tài)的一體化。與傳統(tǒng)自回歸(AR)模型相比,Lumina-DiMOO 大幅提升了生成速度和精度,成為多模態(tài)領(lǐng)域的技術(shù)突破。

1. 離散擴散架構(gòu):核心創(chuàng)新與優(yōu)勢

Lumina-DiMOO 使用了最新的離散擴散架構(gòu)(Discrete Diffusion Model),通過并行生成和雙向注意力機制,使得圖像生成和理解任務(wù)不再互相獨立,而是能夠在同一個框架中高效運作。這一創(chuàng)新架構(gòu)打破了傳統(tǒng)的生成 - 理解邊界,在一個框架中同時實現(xiàn)文本生成圖像、圖像編輯、風(fēng)格遷移、圖像理解等任務(wù)。

2. 高效生成:并行預(yù)測與加速

與大多數(shù)傳統(tǒng)的自回歸模型不同,Lumina-DiMOO 通過并行生成的方式大大加快了推理過程。通過一次性處理多個 token 的生成任務(wù),Lumina-DiMOO 能夠在每個時間步驟并行預(yù)測,并在圖像生成任務(wù)中從完全 mask 的 token 開始,逐步解碼生成圖像或文本。這種方式不僅加速了生成過程,還有效提升了生成質(zhì)量,確保了任務(wù)間的高效協(xié)同。

3. 雙向注意力機制:深入理解與生成

雙向注意力機制(Bidirectional Attention)是 Lumina-DiMOO 另一個關(guān)鍵的技術(shù)特點。該機制讓模型不僅能夠理解文本的上下文關(guān)系,還能捕捉圖像之間的結(jié)構(gòu)和細(xì)節(jié)。這種跨模態(tài)的注意力機制確保了文本和圖像任務(wù)的高度一致性,同時提升了模型在理解和生成過程中處理多模態(tài)信息的能力。

4. 聯(lián)合優(yōu)化:全局性能提升

Lumina-DiMOO 還采用了全局優(yōu)化策略,在訓(xùn)練過程中通過聯(lián)合損失函數(shù)優(yōu)化整體性能。通過這種方法,Lumina-DiMOO 不僅優(yōu)化了文本生成圖像、圖像編輯、理解等任務(wù)的表現(xiàn),還確保了模型的高效統(tǒng)一和多任務(wù)能力,使其能夠在多個任務(wù)之間無縫切換。

加速采樣:Max-Logit 緩存技術(shù)的革新應(yīng)用

在 Lumina-DiMOO 的推理過程中,Max-Logit 緩存技術(shù)顯著提升了生成效率和速度。該技術(shù)通過緩存那些 “穩(wěn)定” 或 “不容易變化” 的 token,避免了不必要的重復(fù)計算,從而加速了推理過程。具體而言,在生成每個 token 時,模型評估其概率分布,并將高置信度的 token 進行緩存,只有當(dāng) token 變化較大時才重新計算。通過并行推理和高效的緩存機制,Max-Logit 技術(shù)不僅加快了推理速度,還保證了生成質(zhì)量,尤其在高分辨率生成任務(wù)中,能夠保留圖像的細(xì)節(jié)與準(zhǔn)確性。此外,該技術(shù)的引入大幅降低了計算成本,使得 Lumina-DiMOO 在保持高質(zhì)量生成的同時,具備了更高的推理效率和更低的計算開銷。

模型的 “自我演化”:Self-GRPO

更令人驚喜的是,團隊提出了一個全新的自我強化框架 ——Self-GRPO。它把 “圖像生成” 和 “多模態(tài)理解” 整合進一條強化學(xué)習(xí)軌跡,讓模型在生成中學(xué)會理解,在理解中反哺生成。訓(xùn)練過程中,模型會自評答案正確率、計算獎勵、再反向優(yōu)化,從而完成 “生成 - 推理 - 校正” 的閉環(huán)。這意味著 Lumina-DiMOO 已不僅是一個多模態(tài)模型,更像一個具備 自主反思能力的智能體雛形。

成績單:全面 SOTA

Lumina-DiMOO 在多項權(quán)威評測中奪魁:

  • UniGenBench(由騰訊混元維護):開源模型第一名
  • GenEval:綜合得分 0.88,超越 GPT-4o、BAGEL、Janus-Pro 等頂尖模型
  • DPG、OneIG-EN、TIIF:在語義一致性、布局理解、屬性綁定、推理等維度全面領(lǐng)先。

未來展望

Lumina-DiMOO 讓我們再次接近 “原生多模態(tài)智能” 的理想。

它能讀、能寫、能畫、能思考 —— 真正實現(xiàn)從感知到創(chuàng)造的統(tǒng)一閉環(huán)。

正如團隊所言:

“我們希望模型不只是理解世界,更能創(chuàng)造世界。”

—— 來自 Alpha-VLLM 團隊的又一次大膽嘗試。

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-09-16 10:28:57

2025-05-28 03:30:00

AI人工智能大數(shù)據(jù)

2025-05-07 01:00:00

多模態(tài)大模型AI

2025-07-16 13:05:15

2024-11-12 10:20:00

模型數(shù)據(jù)

2023-10-11 12:32:26

模型訓(xùn)練

2025-08-12 09:08:00

2023-09-04 12:59:03

AI數(shù)據(jù)

2023-05-22 09:22:41

論文CV

2025-04-07 00:00:00

多模態(tài)大模型

2025-03-13 10:18:42

2025-04-25 09:10:00

2025-05-20 09:08:59

2024-11-22 08:22:58

2025-09-16 09:35:52

2025-08-27 09:08:00

AI視覺模型

2025-01-08 08:21:16

2024-12-31 14:00:00

模型訓(xùn)練數(shù)據(jù)

2024-12-30 00:01:00

多模態(tài)大模型Python

2023-07-17 11:02:36

模型開源
點贊
收藏

51CTO技術(shù)棧公眾號

久草热久草在线频| 国产经典三级在线| 黄网在线免费看| 国产精品免费久久久久| 一区三区视频| 性久久久久久久| 国产精品1234| 一区二区三区视频免费在线观看| 麻豆av一区| 日韩av毛片| 美女日韩在线中文字幕| 欧美电影在线免费观看| 国产一区二区三区免费不卡| 黄色美女网站在线观看| 久久亚洲成人| 激情亚洲一区二区三区四区 | 人妖欧美1区| 久久久久久久高潮| 日韩美女视频中文字幕| 国产精美视频| 久久久久久久久丰满| 欧美综合亚洲图片综合区| 成人女人免费毛片| 97视频精彩视频在线观看| 精品动漫av| 国产91色在线免费| 亚洲精品午夜| 亚洲国产日韩av| 亚洲精品免费网站| 超碰免费97在线观看| 久久久五月天| 日产日韩在线亚洲欧美| 秋霞一区二区| 一区二区三区精品在线| 亚洲在线视频观看| 亚洲盗摄视频| 欧美自拍偷拍午夜视频| av毛片免费看| 欧美涩涩网站| 亚洲精品狠狠操| 成人黄色片视频| 精品国产123区| 欧美丰满一区二区免费视频 | 麻豆国产一区| 亚洲一本大道在线| 国产精品国产一区二区| 污污网站在线观看| 777午夜精品免费视频| 青青草原网站在线观看| 国产调教精品| 欧美性欧美巨大黑白大战| 欧美日本韩国一区二区三区| 免费日韩电影| 亚洲精品欧美激情| 日韩国产精品一区二区| 二区三区精品| 五月激情六月综合| 免费看成年人视频在线观看 | 成年人免费在线播放| av影院午夜一区| 国产精品久久久久久婷婷天堂 | 福利视频网站| 久久成人国产| 亚洲资源视频| 成人在线电影在线观看视频| 精品久久一区二区三区| xxxx69视频| 亚洲一区自拍偷拍| 邻居大乳一区二区三区| 久久综合九色综合97婷婷| 91丨九色丨国产在线| 成人激情视屏| 欧美精品视频www在线观看| 337p亚洲精品色噜噜狠狠| 精品视频在线观看| 成人av在线播放| 久久久久成人网| 牛牛电影国产一区二区| 亚洲午夜小视频| 成全电影播放在线观看国语| 欧美高清精品3d| 国产精品电影| 欧美视频精品一区| 无码人妻丰满熟妇区五十路百度| 黄色亚洲免费| 2019中文字幕全在线观看| 高清在线视频不卡| 欧美另类在线播放| 草美女在线观看| 久久天堂电影网| 高清毛片在线观看| 久久久久久网站| 欧美激情 亚洲a∨综合| 91精品国产九九九久久久亚洲| 国产啊啊啊视频在线观看| 色偷偷偷亚洲综合网另类| 不卡av免费观看| 久久久久久综合网天天| 99欧美精品| 国产成人精品亚洲精品| 美腿丝袜在线亚洲一区| 国产一区二区视频在线免费观看| 国产一区二区三区四区五区美女| 国产日韩久久| 不卡影院免费观看| japanese在线播放| 亚洲影视综合| 成人18视频| 欧美精品二区| 少妇高潮毛片色欲ava片| 免费在线视频一区| 网上成人av| 国产婷婷精品av在线| www.avtt| 麻豆成人免费电影| 日韩精品欧美一区二区三区| 欧美激情一区二区三区四区| 无码人妻丰满熟妇区96| 国产乱人伦精品一区二区在线观看| 欧美亚洲免费在线| 久久久久久黄| 白天操夜夜操| 日韩国产一区三区| 成人性生活视频| 亚洲欧美日韩国产中文专区| 9999热视频在线观看| 精品sm捆绑视频| 俄罗斯一级**毛片在线播放| 欧美亚洲激情视频| 成人免费的视频| 少妇人妻无码专区视频| 色综合中文综合网| av在线免费一区| 久久久爽爽爽美女图片| 九一九一国产精品| 日韩国产欧美亚洲| 91精品国产免费久久综合| av福利导福航大全在线| 亚洲综合自拍一区| 亚洲日本在线看| 在线免费福利| 在线观看亚洲精品视频| 欧美精品国产白浆久久久久| 国产成人综合精品| 26uuu国产在线精品一区二区| 欧美黑人又粗又大又爽免费| 亚洲激情综合网| 欧美大片91| 国产肉体ⅹxxx137大胆| 亚洲精品在线电影| 亚洲一区激情| 在线观看免费网站黄| 亚洲free性xxxx护士白浆| 亚洲一区日韩精品中文字幕| 91久久偷偷做嫩草影院电| 庆余年2免费日韩剧观看大牛| 久久亚洲国产| 另类图片亚洲色图| 欧美激情视频在线观看| 91女神在线视频| 深夜福利亚洲| 国产91色在线|| 国产精品美女久久久久久久久 | 日韩欧美国产精品一区| 四虎4545www精品视频| 欧美激情小视频| 久久久久久免费| 青青草视频免费在线观看| 精品国产免费久久| 亚洲一区国产| 日本高清在线观看| 亚洲图片欧洲图片日韩av| 日韩h在线观看| 成人综合激情网| 日韩在线精品强乱中文字幕| 国产超级av在线| 亚洲精品伦理在线| 国产日产精品一区二区三区四区的观看方式| 国产日韩在线一区二区三区| 欧美性一级生活| 日韩成人一级大片| 黄色av网站在线观看| 国产精品白丝jk喷水视频一区| 亚洲精品在线二区| 日本一本二本在线观看| 色综合久久久888| 国产亚洲在线| 国产对白国语对白| 成人免费自拍视频| 成人午夜激情影院| aiss精品大尺度系列| 午夜影院免费看| 在线日韩第一页| 欧美色图在线播放| 玖玖综合伊人| 亚洲成人自拍| 亚洲成av人片| 亚洲国产激情| 91超碰碰碰碰久久久久久综合| 中文字幕第38页|