国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

突破全模態AI理解邊界:引入上下文強化學習,賦能全模態模型“意圖”推理新高度

人工智能 新聞
阿里巴巴通義實驗室團隊推出HumanOmniV2,強調模型必須在對多模態輸入全局上下文有清晰理解的基礎上進行推理。

在多模態大語言模型(MLLMs)應用日益多元化的今天,對模型深度理解和分析人類意圖的需求愈發迫切。盡管強化學習(RL)在增強大語言模型(LLMs)的推理能力方面已展現出巨大潛力,但將其有效應用于復雜的多模態數據和格式仍面臨諸多挑戰。

在深入研究現有技術后,發現在當前多模態推理模型中發現現有的推理路徑存在兩大核心問題:全局上下文理解不足和捷徑問題。

圖片

全局上下文理解不足: 當模型無法準確識別或錯誤解讀多模態證據和上下文信息時,便會出現此問題,導致給出不正確的答案。

捷徑問題: 指模型在處理多模態輸入時,忽視了關鍵線索,未充分考量多模態信息就直接給出答案,從而導致次優或片面的結果

為徹底解決這些痛點,阿里巴巴通義實驗室團隊推出HumanOmniV2,強調模型必須在對多模態輸入全局上下文有清晰理解的基礎上進行推理。這種全局性理解能夠有效避免模型遺漏關鍵多模態線索,確保推理過程的全面性和深入性。

相關代碼、模型、數據都開源,地址可在文末獲取。

效果展示

問題:這兩個人是什么關系?

A. 他們想引起人們對該產品的關注。

B. 這兩個人是商業伙伴,他們正試圖推銷他們的產品。

C. 他們在推銷另一種產品。

D. 看起來他們剛認識,以便他能在她的節目中展示他的產品。 

圖片

創新與優勢

  • 強制上下文總結與全模態推理

為實現這一目標,要求模型在推理之前,首先在一個標簽內輸出其對上下文信息的概括。這種強制性的上下文理解能夠有效避免模型跳過關鍵的多模態輸入信息,并在隨后的推理過程中提供全面的全局背景支持。

  • 多維度獎勵機制引導

為了確保模型準確理解多模態上下文信息,引入了上下文獎勵 (Context Reward),并與格式獎勵 (Format Reward) 和準確性獎勵 (Accuracy Reward) 協同作用。上下文獎勵通過LLM進行評估,對比模型輸出的上下文與參考上下文的一致性,從而引導模型提升上下文理解能力。

  • 復雜邏輯推理能力激勵

此外,為激勵模型發展更復雜的推理能力,還利用LLM評估其推理過程是否成功融合了多模態信息,并應用了反思、演繹、歸納等高級邏輯分析技術。其中,上下文獎勵的計算基于生成文本的上下文部分,而邏輯獎勵則關聯到生成文本的上下文和推理兩部分。

  • 優化的GRPO訓練策略

基于Qwen2.5-Omni-Thinker,對GRPO訓練方法進行了關鍵改進,包括引入令牌級損失以克服長序列不平衡、移除問題級歸一化項以消除優化偏差,并應用動態KL散度以提升探索能力和訓練穩定性,從而全面提升了模型的訓練效率、公平性與魯棒性。

核心方法

圖片

在模型設計方面,以Qwen2.5-Omni-Thinker為基礎模型,并在此基礎上,對GRPO (Group Relative Policy Optimization)的基于最新研究的改進,以實現更高效、更穩定的訓練

首先,為了有效應對長序列訓練中普遍存在的不平衡問題,引入令牌級損失(Token-level Loss),這種細粒度的損失計算能夠確保在處理長樣本數據時,模型對每個Token的學習都能得到充分且平衡的優化,避免某些部分因序列過長而被忽視,從而顯著提升了訓練的效率和質量。

其次,移除了傳統的問題級歸一化項(Question-level Normalization Term)。經驗表明,該歸一化項可能導致不同問題在目標函數中擁有差異化的權重,進而引入優化上的難度偏差,影響模型對不同難度的學習效率。通過取消這一項,確保了優化過程對所有問題的一致性,從而促進模型更全面、更公平地學習和理解各類問題。

此外,為了進一步提升模型探索能力并確保訓練穩定性,巧妙地引入了動態KL散度(Dynamic KL Divergence)策略。這一機制能夠有效避免在訓練初期過度限制模型的自由探索空間,充分發揮其潛力;同時,也能防止在訓練后期模型行為出現發散,確保訓練過程的穩健性。動態KL散度的應用使得模型在整個訓練周期內能夠進行更充分的策略探索,并顯著提升了訓練的穩健性。

構建基于全局上下文的強化推理范式:針對現有模型全局上下文理解不足和推理捷徑問題,提出了一套創新的推理范式,包括:

強制性結構化響應格式(……),要求模型顯式地總結多模態上下文并進行反思性邏輯推理;

LLM驅動的多維獎勵機制,為確保模型準確解讀多模態上下文信息,引入了由大語言模型判斷的上下文獎勵(Context Reward),并輔以格式獎勵(Format Reward)和準確性獎勵(Accuracy Reward)。這使得模型能在生成響應時,更好地對齊人類的意圖和偏好。為了提升模型的復雜推理能力,進一步利用LLM評估其推理過程是否成功融合了反思、演繹、歸納等高級邏輯方法與多模態信息,提供邏輯性獎勵(Logical Reward)。通過上下文獎勵和邏輯獎勵(結合因果掩碼精確應用)來精確評估和激勵模型對多模態上下文的理解以及復雜的邏輯推理能力。

構建高質量數據集與基準

訓練MLLMs進行推理極具挑戰,主要原因在于缺乏大規模的人工標注推理數據。為此,創新性地構建了一個全模態推理訓練數據集,其中包含了圖像、視頻和音頻的理解任務,并融入了豐富的上下文信息,以支持模型在復雜場景下的推理學習。該數據集同時提供了多模態輸入的總結和推理路徑,適用于模型的冷啟動訓練和強化學習階段。

在開發全模態推理模型時面臨的另一個挑戰是缺乏有效的相關基準來評估其性能。為此,隆重推出了IntentBench,一個創新性的全模態基準,旨在評估模型在復雜場景中理解人類行為和意圖的能力。該基準包含633個視頻和2,689個相關問題,這些問題緊密關聯視頻中的聽覺和視覺線索,并要求模型對全局上下文、細致觀察和復雜社會關系有深刻的理解和推理。與主要側重于一般感知場景的Daily-Omni 和 WorldSense 相比,IntentBench更專注于評估全模態模型理解和推理復雜人類意圖和情感的能力。

實驗與結果

HumanOmniV2 在多個基準數據集上取得了突破性成果,它在開源全模態模型中取得了最佳性能,在Daily-Omni上達到58.47%,在WorldSense上達到47.1%,在全新引入的IntentBench上更是高達69.33%。相比當前其他開源全模態模型取得了顯著領先的成果。這標志著多模態AI在理解人類復雜意圖方面邁出了堅實一步,為未來更智能、更人性化的人工智能應用奠定了基礎。

圖片圖片圖片

核心貢獻總結:

創新性的推理范式: 提出模型在推理之前應先對多模態輸入進行上下文總結,旨在解決跳過關鍵多模態信息和上下文理解不足的問題。同時,通過上下文獎勵和邏輯獎勵激勵模型準確總結上下文并促進復雜推理。

高質量數據集與評測基準: 提供了一個包含多模態輸入總結和推理路徑的全模態推理訓練數據集,適用于冷啟動訓練和強化學習階段。此外,還精心策劃了一個以人為中心的全模態評估基準IntentBench,它要求模型同時理解視頻和音頻、全局上下文、復雜的社會關系以及細致的觀察。

領先的模型性能: 提出的HumanOmniV2在包括全新IntentBench、Daily-Omni和WorldSense在內的多個全模態基準測試中,相比現有開源全模態方法取得了最佳性能。

github:https://github.com/HumanMLLM/HumanOmniV2
arxiv:https://arxiv.org/abs/2506.21277
modelscope:https://modelscope.cn/models/iic/humanomniv2
huggingface:https://huggingface.co/PhilipC/HumanOmniV2
intentbench:https://huggingface.co/datasets/PhilipC/IntentBench

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-09-18 11:41:26

論文3D

2025-05-06 08:40:00

2025-10-23 09:17:30

2017-12-17 17:01:23

限界上下文系統模型

2025-02-27 07:48:25

2025-05-28 11:46:52

強化學習模型AI

2025-04-17 14:19:46

2024-06-17 00:00:00

MiCo模態人腦

2025-10-27 09:38:26

2025-07-16 13:05:15

2025-06-03 08:49:00

2025-04-27 09:19:00

強化學習模型AI

2025-08-07 09:16:41

2025-04-30 09:00:00

模型推理AI

2025-05-09 09:15:00

2024-07-30 13:42:57

2025-05-09 08:40:00

2025-12-09 09:28:54

2025-10-31 01:00:00

點贊
收藏

51CTO技術棧公眾號

国产裸体免费无遮挡| 一区二区三区视频在线播放| 日韩精选视频| 欧美一区二区三区视频免费播放 | 一区二区中文字幕在线观看| 精品亚洲夜色av98在线观看 | 欧美日韩高清在线一区| 综合亚洲视频| 亚洲free性xxxx护士hd| 欧美日本二区| 精品久久精品久久| 青青草国产精品97视觉盛宴| 手机福利在线视频| 成人午夜av在线| 免费激情视频在线观看| 国产精品成人网| 992tv成人国产福利在线| 精品欧美国产一区二区三区| 国产专区在线| 911精品产国品一二三产区 | 欧美一级在线观看| 国内老司机av在线| 中文字幕日韩专区| 成午夜精品一区二区三区软件| 久久久视频在线| 日韩欧美精品| 日本视频精品一区| www.日韩大片| 疯狂做受xxxⅹ高潮视频免费| 亚洲高清中文字幕| 国产原厂视频在线观看| 亚洲精品中文字幕女同| 精品国产三区在线| 国产精品第100页| 一区精品久久| avove在线观看| 国产精品卡一卡二| 高清在线观看av| 亚洲欧美在线播放| 婷婷精品视频| 久久国产精品一区二区三区| 日本中文字幕一区二区有限公司| 国产精彩视频一区二区| 亚洲摸摸操操av| 国产私拍精品| 亚洲精品理论电影| 免费一区二区| 欧美精品v日韩精品v国产精品| 国产成人午夜精品影院观看视频 | 老妇喷水一区二区三区| 强开小嫩苞一区二区三区网站 | 欧美日韩亚洲高清| 午夜小视频在线观看| 亚洲午夜未删减在线观看 | 日本不卡一区二区三区| 3d动漫一区二区三区| 一区二区免费看| 丰满诱人av在线播放| 777精品视频| 日本中文字幕一区二区有限公司| wwwwxxxx日韩| 正在播放一区二区| 精品国产一区二区三区成人影院| 国产精品一区而去| 91老司机福利 在线| av资源在线观看免费高清| 亚洲网在线观看| 欧美一区激情| 蜜臀久久99精品久久久酒店新书 | 精品视频在线一区二区| 68精品久久久久久欧美| 国产精品伦理在线| 欧洲午夜精品| 337p粉嫩大胆噜噜噜鲁| 欧美日韩综合一区| 国产videos久久| 少妇一级淫免费播放| 午夜精品久久久99热福利| 琪琪一区二区三区| 7777kkk亚洲综合欧美网站| 国产mv久久久| 亚洲特黄一级片| av日韩中文| 97在线免费观看视频| 美女黄色成人网| 91精品91久久久中77777老牛| 亚洲国产高清在线观看视频| 免费免费啪视频在线观看| 亚洲人成在线一二| 国产欧美一区二区精品久导航| 高h视频在线播放| 国产69精品99久久久久久宅男| 91老师国产黑色丝袜在线| 欧美成人在线免费观看| 国产欧美一区二区三区网站| 黄色片免费在线观看| 欧美精品www在线观看| 日日嗨av一区二区三区四区| 日本成年免费网站| 中文字幕国产精品| 国产精品腿扒开做爽爽爽挤奶网站| 国内自拍视频网| 国产视频亚洲精品| 伊人久久成人| 在线观看视频色潮| 91精品国产沙发| 99视频精品在线| 91av亚洲| 国产伦精品一区二区| 亚洲成av人片在线| 久久免费视频66| aa在线免费观看| 日韩精品一区二区视频| 噜噜爱69成人精品| 97人人在线| 91麻豆蜜桃| 精品免费在线视频| 国产精品免费大片| 成人在线播放网站| 欧美福利在线观看| 91在线视频播放地址| 欲香欲色天天天综合和网| 欧美重口乱码一区二区| 日本国产一区二区| 亚洲精品在线观看91| 免费男女羞羞的视频网站主页在线观看 | 在线观看视频你懂的| 国产91精品青草社区| 中文字幕成人在线观看| 日韩精品亚洲专区在线观看| 欧美二区在线视频| 久久久国产一区二区| 99re成人精品视频| 亚洲欧美专区| 黄色a级片免费| 久久久999精品视频| 99久久精品免费精品国产| 黄色成人小视频| 久久久久狠狠高潮亚洲精品| 久久精品久久久久久| 成人不卡免费av| 国产精品视频一区二区三区综合 | 国产精品videosex性欧美| 区一区二日本| 日本午夜精品理论片a级appf发布| 亚洲日本欧美天堂| 精品国产一区二区三区小蝌蚪 | 2020国产精品| 色悠久久久久综合先锋影音下载| 久久久免费视频网站| 欧美精品亚州精品| 中文字幕av一区二区三区高| 久久aimee| 国产欧美精品日韩| 精品国产一二| 欧美成在线视频| 久久av老司机精品网站导航| av资源中文在线| 免费国产黄色网址| 欧美激情久久久久久| 亚洲福利视频一区| 国产视频久久| 欧美人体一区二区三区| 丰满少妇大力进入| 国内精品久久久久| 欧美日韩国产色| 久久久久久久欧美精品| 成人做爰免费视频免费看| 电影天堂久久| 欧美日韩免费观看一区| 亚洲欧美成人网| 国产精品免费丝袜| 雨宫琴音一区二区在线| 偷拍中文亚洲欧美动漫| 3344永久| 欧美精品一区二区三区在线看午夜| 亚洲视频一区二区三区| 欧美激情无毛| 欧美久久久网站| 一本一道久久a久久精品蜜桃| www.亚洲免费| 97中文字幕在线| 国产91色在线免费| 亚洲第一精品久久忘忧草社区| 久久久久久9999| 亚洲一级电影| 日韩黄色三级在线观看| 亚洲一区二区三区成人| 潘金莲一级淫片aaaaa免费看| 97色在线观看| 日韩午夜在线观看视频| 国产精品天天摸av网| 久色成人在线| 美女一区2区| 国产丝袜在线| 97涩在线观看视频| avove在线观看| 国产高清一区视频| 午夜精品一区二区三区在线| 日韩精品一二三四区|