国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

舍棄自回歸!國內團隊打造純擴散多模態大模型LLaDA-V,理解任務新SOTA

人工智能 新聞
研究團隊將 LLaDA 作為語言基座,通過引入視覺編碼器(SigLIP 2)和 MLP 連接器,將視覺特征投影到語言嵌入空間,實現了有效的多模態對齊。LLaDA-V 在訓練和采樣階段均采用離散擴散機制,擺脫了自回歸范式。

本文介紹的工作由中國人民大學高瓴人工智能學院李崇軒、文繼榮教授團隊與螞蟻集團共同完成。游澤彬和聶燊是中國人民大學高瓴人工智能學院的博士生,導師為李崇軒副教授。該研究基于團隊前期發布的、首個性能比肩 LLaMA 3 的 8B 擴散大語言模型 LLaDA

此次,團隊將 LLaDA 拓展至多模態領域,推出了 LLaDA-V—— 集成了視覺指令微調的純擴散多模態大語言模型(MLLM)。這項工作標志著對當前以自回歸為主流的多模態方法的一次重要突破,展示了擴散模型在多模態理解領域的巨大潛力。

近年來,多模態大語言模型(MLLMs)在處理圖像、音頻、視頻等多種輸入模態方面取得了顯著進展。然而,現有的大多數方法依賴自回歸模型。雖然有研究嘗試將擴散模型引入 MLLMs,但往往采用混合架構(自回歸 + 擴散)或者受限于語言建模能力,導致性能不佳。

繼 LLaDA 成功證明擴散模型在純語言任務上能與自回歸模型(如 LLaMA3-8B)競爭后,一個關鍵問題隨之而來:擴散語言模型能否在多模態任務中也達到與自回歸模型相當的性能?LLaDA-V 正是對這一問題的有力回答。

研究團隊將 LLaDA 作為語言基座,通過引入視覺編碼器(SigLIP 2)和 MLP 連接器,將視覺特征投影到語言嵌入空間,實現了有效的多模態對齊。LLaDA-V 在訓練和采樣階段均采用離散擴散機制,擺脫了自回歸范式。

圖片

  • 論文標題:LLaDA-V: Large Language Diffusion Models with Visual Instruction Tuning
  • 論文鏈接:https://arxiv.org/abs/2505.16933
  • 項目地址:https://ml-gsai.github.io/LLaDA-V-demo/
  • 代碼倉庫:https://github.com/ML-GSAI/LLaDA-V

團隊預計近期開源訓練推理代碼以及 LLaDA-V 權重。

性能亮點

數據可擴展性強,多項基準表現優異

大規模的實驗評估揭示了 LLaDA-V 的多個引人注目的特性:

1. 卓越的數據可擴展性與競爭力。團隊將 LLaDA-V 與使用 LLaMA3-8B 作為語言基座、但其他部分完全相同的自回歸基線 LLaMA3-V 進行了對比。

結果顯示,LLaDA-V 展現出更強的數據可擴展性,特別是在多學科知識(如 MMMU)基準上。令人印象深刻的是,盡管 LLaDA-8B 在純文本任務上略遜于 LLaMA3-8B,但 LLaDA-V 在 11 個 多模態任務中超越了 LLaMA3-V。這表明擴散架構在多模態任務上面具備一定的優勢。

圖片

圖片

2. 純擴散與混合架構中的 SOTA:與現有的混合自回歸 - 擴散模型(如 MetaMorph, Show-o)和純擴散模型相比,LLaDA-V 在多模態理解任務上達到了當前最佳(SOTA)性能。這證明了基于強大語言擴散模型的 MLLM 架構的有效性。

圖片

3. 縮小與頂尖自回歸 MLLM 的差距:盡管 LLaDA 的語言能力明顯弱于 Qwen2-7B,但 LLaDA-V 在某些基準(如 MMStar)上顯著縮小了與強大的 Qwen2-VL 的性能差距,達到了相當的水平(60.1 vs. 60.7)。這進一步印證了擴散模型在多模態領域的潛力。

下圖是 LLaDA-V 同用戶進行交流的場景。

圖片

LLaDA-V 準確描述出了一幅寧靜而富有層次感的瑞士阿爾卑斯山景:一條綠色小路蜿蜒延伸,一位行人沿路行走,遠處是山谷中的白色教堂和被薄霧環繞的巍峨群山,藍天白云為畫面增添了寧靜氛圍,整體構圖清晰,意境優美。

核心方法

LLaDA-V 的核心在于將視覺指令微調框架與 LLaDA 的掩碼擴散機制相結合。下圖展示了 LLaDA-V 的訓練和推理過程:

圖片

架構: 采用經典的「視覺編碼器 + MLP 投影器 + 語言模型」架構。視覺編碼器(SigLIP 2)提取圖像特征,MLP 投影器將其映射到 LLaDA 的嵌入空間。LLaDA 語言塔則負責處理融合后的多模態輸入并生成回復。特別地,LLaDA-V 采用了雙向注意力機制,允許模型在預測時全面理解對話上下文,這在消融實驗中被證明略優于對話因果注意力機制。

訓練目標: LLaDA-V 擴展了 LLaDA 的訓練目標,以支持多輪多模態對話。其核心思想是在訓練時保持圖像特征和用戶提示(Prompt),僅對模型的回復(Response)進行隨機掩碼,訓練目標僅對被掩碼部分計算交叉熵損失。

圖片

推理過程: LLaDA-V 的生成過程并非自回歸式的逐詞預測,而是通過擴散模型的反向去噪過程。從一個完全被掩碼的回復開始,模型在多個步驟中迭代地預測被掩碼的詞元,逐步恢復出完整的回復。研究采用了 LLaDA 的低置信度重掩碼策略,優先保留高置信度的預測,提升了生成質量。

總結與展望

LLaDA-V 成功地將視覺指令微調與掩碼擴散模型相結合,證明了擴散模型不僅能在語言任務上與自回歸模型一較高下,在多模態理解領域同樣展現出強大的競爭力和獨特的優勢,尤其是在數據可擴展性方面。

這項工作不僅為 MLLM 的發展開辟了一條新的技術路徑,也挑戰了多模態智能必須依賴自回歸模型的傳統觀念。隨著語言擴散模型的不斷發展,我們有理由相信,基于擴散的 MLLM 將在未來扮演更重要的角色,進一步推動多模態 AI 的邊界。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-03-25 12:40:19

訓練模型

2024-04-02 09:17:50

AI數據開源

2023-07-17 11:02:36

模型開源

2025-09-19 09:05:18

AI模型訓練

2025-06-10 09:18:53

2024-06-17 00:00:00

MiCo模態人腦

2025-03-03 10:17:00

模型數據生成

2025-07-17 09:16:20

AI模型視覺

2025-11-17 09:22:09

2025-05-20 13:02:23

2025-05-20 09:08:59

2024-04-26 12:51:48

2025-01-08 08:21:16

2025-04-28 14:13:43

開源SOTA多模態

2025-04-16 02:55:00

2025-02-17 12:30:00

2023-06-28 13:55:30

模型AI

2023-10-17 12:34:04

2024-01-16 17:17:30

模型訓練

2025-11-05 08:51:33

點贊
收藏

51CTO技術棧公眾號

欧美国产成人在线| 日韩精品在线私人| 亚洲精品成人自拍| 欧美挤奶吃奶水xxxxx| 日本精品一区二区三区四区的功能| 欧美在线观看视频免费| 91精品国产调教在线观看| 在线精品播放av| 91大神在线网站| 亚洲视频在线一区二区| 麻豆91av| 国产精品不卡| 欧美精品videos另类日本| 久久大胆人体| 欧美系列在线观看| 91骚色在线| av一区二区三区四区| 国产日韩在线一区二区三区| 成人动态视频| 中文字幕亚洲欧美| 黄色在线视频网站| 欧美性生交xxxxxdddd| 开心丁香婷婷深爱五月| 国产亚洲欧美激情| 国产真实老熟女无套内射| 亚洲综合社区| 91九色国产视频| 久久综合影院| 韩国美女主播一区| 中文字幕视频精品一区二区三区| 亚洲欧洲成视频免费观看| 日本aa在线| 欧美一区二区三区视频免费播放 | 成人在线视频国产| 日韩av有码在线| av免费网站在线观看| 在线精品视频一区二区三四| av成人动漫| 中文字幕在线播放不卡一区| 免费男同深夜夜行网站| 91丝袜呻吟高潮美腿白嫩在线观看| avove在线观看| 久久99热狠狠色一区二区| 视频一区三区| 久久精品久久99精品久久| 欧美自拍资源在线| 三级成人在线视频| 中文字幕一区二区三区乱码 | 青春草免费在线视频| 91.com在线观看| 91在线网址| 欧美性受xxxx黑人xyx| 能在线看的av| 欧美丰满一区二区免费视频| 性xxxxfjsxxxxx欧美| 精品成人在线观看| 午夜av不卡| 精品久久久av| 亚洲精品不卡在线观看| 88xx成人精品| 成人激情开心网| 97视频中文字幕| 翔田千里一区二区| 国产精品一二三在线观看| 99久久国产综合色|国产精品| 久久精品国产精品亚洲色婷婷| 成人免费毛片a| 亚洲国产高清av| 欧美日韩国产黄| aaa在线观看| 亚洲精品一区中文| 秋霞午夜一区二区三区视频| 欧美在线观看网址综合| 一区二区三区午夜视频| 日韩欧美在线观看强乱免费| 成人午夜短视频| 日韩欧美亚洲| 精品1区2区3区| jk漫画禁漫成人入口| 欧美激情xxxxx| 999久久久免费精品国产| 三区精品视频观看| 久久久久久久综合色一本| 96久久久久久| 欧美大片一区二区| 伊人久久影院| 成人h在线播放| 国产成人精品一区二区三区四区 | 成熟亚洲日本毛茸茸凸凹| 亚洲无吗一区二区三区| 精品人伦一区二区三区蜜桃免费| 91精品专区| 最近中文字幕日韩精品| 欧洲杯什么时候开赛| 日韩中文一区| 国产精品毛片a∨一区二区三区| 美丽的姑娘在线观看免费动漫| 日韩欧美一级二级| 国产成人精品福利| 国精产品99永久一区一区| av电影在线观看一区| 亚洲s色大片在线观看| 亚洲乱码国产乱码精品精天堂| 亚欧日韩另类中文欧美| 成人网在线免费看| av激情综合网| 91青青在线视频| 久久久噜噜噜久久| 狂野欧美一区| 国产无遮挡又黄又爽免费软件 | 青春有你2免费观看完整版在线播放高清| 7777精品伊人久久久大香线蕉的 | 色综合久久精品| 超级碰碰久久| 成人春色激情网| 不卡的看片网站| 91在线视频| 国产成人高清激情视频在线观看 | 国产亚洲一二三区| 日本www在线| 国自产精品手机在线观看视频| 久久婷婷av| 丝袜国产免费观看| 最新国产成人av网站网址麻豆| 国产精品大片| 福利在线免费| 精品国内亚洲在观看18黄| 国产亚洲永久域名| 三上悠亚一区| 伦伦影院午夜日韩欧美限制| 久久激情视频| 性感美女激情视频在线观看| 欧美俄罗斯乱妇| 国产一本一道久久香蕉| 国内精品不卡| 国产精品.com| 亚洲一二三四久久| 国产乱人伦丫前精品视频| 久久精品无码中文字幕| 日韩欧美国产1| 综合精品久久| 樱桃视频免费看| 性色av一区二区三区免费| 成人久久18免费网站麻豆| 成人观看网址| 亚洲精品自在在线观看| 日韩一区二区在线播放| 亚洲美女毛片| yiren22亚洲综合伊人22| 91免费欧美精品| 亚洲.国产.中文慕字在线| 欧洲乱码伦视频免费| 国产91白丝在线播放| 国模视频一区二区| 国产欧美一区二区三区沐欲| 国产成年精品| 青青草原av在线播放| 色婷婷综合成人av| 成人激情午夜影院| 国产精品第一| 妞干网这里只有精品| 国产亚洲一区二区精品| 丁香桃色午夜亚洲一区二区三区| 欧美人体一区二区三区| 91免费国产精品| 色阁综合伊人av| 久久一区二区视频| 久久精品九色| 99热com| 国产精品高潮视频| 色综合中文字幕| 亚洲精选国产| 欧美xxx黑人xxx水蜜桃| 中国成人在线视频| 最近更新的2019中文字幕 | 成人福利在线视频| 欧美性色xo影院| 在线欧美三区| av大全在线| 国产一二三四区在线观看| 亚洲最新av在线| 91蝌蚪porny成人天涯| 丝袜久久网站| 日本电影一区二区在线观看| 国产精品视频福利| 日韩欧美一卡二卡| 成人免费毛片a| 日韩精品丝袜美腿| 欧美一区二区少妇| 麻豆精品视频| 中文字幕av一区二区三区谷原希美| 99国产精品久久久久| 一个色免费成人影院| 国产在线你懂得| 亚洲欧美日韩不卡| 久久久久久亚洲| 色综合久久天天综合网| 狠狠v欧美v日韩v亚洲ⅴ| 欧洲大片精品免费永久看nba| 中文字幕日产av一二三区|