国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

4秒看完2小時電影!阿里發布通用多模態大模型mPLUG-Owl3 | 開源

人工智能 新聞
盡管mPLUG-Owl3超越了現有模型,但其準確率遠未達到優秀水平,只能說這一測評方法揭示了所有模型未來需要進一步提升的長序列下的抗干擾能力。

4秒看完2小時電影,阿里團隊新成果正式亮相——

推出通用多模態大模型mPLUG-Owl3,專門用來理解多圖、長視頻。

圖片

具體來說,以LLaVA-Next-Interleave為基準,mPLUG-Owl3將模型的First Token Latency縮小了6倍,且單張A100能建模的圖像數目提升了8倍,達到了400張圖片,實測4秒就能看完一部2小時的電影。

換句話說,模型的推理效率有了極大提升。

而且不犧牲模型的準確性

mPLUG-Owl3還在多模態大模型所涉及的各種場景,包括單圖、多圖、視頻領域的諸多Benchmarks上達到了SOTA

圖片

論文作者來自阿里mPLUG團隊,他們一直深耕多模態大模型底座,在此之前還提出了:

  • 高效多模態底座mPLUG系列
  • 模塊化多模態大語言模型底座mPLUG-Owl系列
  • 文檔理解底座mPLUG-DocOwl系列

下面就讓我們來了解一下本次發布的mPLUG-Owl3究竟帶來了什么黑科技吧。

玩法解鎖

團隊展示了mPLUG-Owl3的幾種常見用法。

多模態檢索增強

一般來說,對于模型沒有學過的知識,通過檢索系統進行補充是常見的做法。這需要模型能準確理解傳入的多模態知識,并用于解答問題。

在下面這個例子中,mPLUG-Owl3不僅能基于檢索知識正確回復,還能給出它基于哪一條知識做出的判斷,并且給出詳細的判斷依據。這對于下游研發人員開發和調試都是非常友好的。

檢索部分:以下是為你檢索到的幾個多模態知識,供你做出決定。

提問:根據你對上面四張狗的照片的觀察,你能對圖片5中的狗進行分類嗎?給出理由。

回答:根據對四張狗的照片的觀察,圖片5中的狗可以被歸類為愛爾蘭梗犬。圖片1中的狗被描述為愛爾蘭梗犬,圖片5中的狗與圖片1中的狗在身體特征上有相似之處……

圖片

多圖推理

生活中經常會出現這樣的情況——

很多用戶并非只圍繞一張圖片進行對話,而是用戶可能有幾份材料,需要模型能正確理解不同材料中的內容的關系。

在下面這個例子中,mPLUG-Owl3能通過兩張圖像所見,激活語言模型的常識知識,并圍繞兩張圖片進行推理。

提問:左邊的動物能在右邊的環境中存活嗎?需要回答并給出解釋。

回答(正確答案標綠):大意是,不能存活,因為環境太冷了。

圖片

在另一個例子中,mPLUG-Owl3不僅能察覺兩張圖片風格上的差異性,并且也能意識到兩張圖中的人物雖然風格不同,但其實是同一個角色。

第一次提問:圖片中描繪了哪些藝術風格,它們有何不同?

回答:第一張是像素風,第二張是卡通風格……(給出理由)

第二次提問:在兩幅畫中都出現了誰?他們的特征是什么?

回答:在兩幅畫中,都出現了一個戴著牛仔帽的男人,他被兩種不同的風格描繪。

圖片

長視頻理解

觀看超長視頻是現在大部分模型都無法端到端完成的任務,若是基于Agent框架,則又難以保證響應速度。

mPLUG-Owl3能夠看一部2小時電影,并且4秒就能開始回答用戶的問題

不管用戶是對電影的開頭、中間和結尾的非常細致的片段進行提問,mPLUG-Owl3都能對答如流。

圖片

咋做到的?

與傳統模型不同,mPLUG-Owl3不需要提前將視覺序列拼接到語言模型的文本序列中

換句話說,不管輸入了啥(幾十張圖或幾小時視頻),都不占用語言模型序列容量,這就規避了長視覺序列帶來的巨額計算開銷和顯存占用。

有人可能會問了,那視覺信息如何融入到語言模型中呢?

為實現這一點,該團隊提出了一種輕量化的Hyper Attention模塊,它可以將一個已有的只能建模文本的Transformer Block擴展成一個能夠同時做圖文特征交互和文本建模的新模塊。

圖片

通過在整個語言模型中稀疏地擴展4個Transformer Block,mPLUG-Owl3就能用非常小的代價將LLM升級成多模態LLM。

視覺特征在從視覺編碼器抽取出來后,會通過一個簡單的線性映射把維度對齊到語言模型的維度。

隨后,視覺特征只會在這4層Transformer Block與文本交互,由于視覺Token沒有經過任何壓縮,所以細粒度的信息都能得到保留。

下面來看一下Hyper Attention內又是如何設計的

Hyper Attention為了讓語言模型能感知到視覺特征,引入了一個Cross-Attention操作,將視覺特征作為Key和Value,將語言模型的hidden state作為Query去析取視覺特征。

近年也有其他研究考慮將Cross-Attention用于多模態融合,比如Flamingo和IDEFICS,但這些工作都沒能取得較好的性能表現。

在mPLUG-Owl3的技術報告中,團隊對比了Flamingo的設計,來進一步說明Hyper Attention的關鍵技術點

圖片

首先,Hyper Attention沒有采用Cross-Attention和Self-Attention級聯的設計,而是嵌入在Self-Attention區塊內。

它的好處是大幅度降低了額外引入的新參數,使得模型更容易訓練,并且訓練和推理效率也能進一步提升。

其次,Hyper Attention選擇共享語言模型的LayerNorm,因為LayerNorm所輸出的分布正是Attention層已經訓練穩定的分布,共享這一層對于穩定學習新引入的Cross-Attention至關重要。

事實上,Hyper Attention采取了一種并行Cross-Attention和Self-Attention的策略,使用共享的Query去與視覺特征交互,通過一個Adaptive Gate融合兩者的特征。

這使得Query可以根據自身語義針對性地選擇與之相關的視覺特征。

團隊發現,圖像在原始上下文中與文本的相對位置關系對于模型更好的理解多模態輸入非常重要。

為了建模這一性質,他們引入了一種多模態交錯的旋轉位置編碼MI-Rope來給視覺的Key建模位置信息。

具體來說,他們預先記錄了每張圖片在原文中的位置信息,會取這一位置來計算對應的Rope embedding,而同一張圖的各個patch會共享這個embedding。

此外,他們也在Cross-Attention引入了Attention mask,讓原始上下文中在圖片之前的文本不能看到后面的圖片對應的特征。

概括而言,Hyper Attention的這些設計點,為mPLUG-Owl3帶來了進一步的效率提升,并且保障了它仍然能具備一流的多模態能力。

實驗結果

通過在廣泛的數據集上進行實驗,mPLUG-Owl3在大多數單圖多模態Benchmarks都能取得SOTA的效果,甚至不少測評還能超過模型尺寸更大的模型。

圖片

同時,在多圖測評中,mPLUG-Owl3同樣超越了專門針對多圖場景優化的LLAVA-Next-Interleave和Mantis。

圖片

另外,在LongVideoBench(52.1分)這一專門評估模型對長視頻理解的榜單上更是超越現有模型。

圖片

研發團隊還提出了一個有趣的長視覺序列測評方法

眾所周知,真實的人機交互場景,并非所有圖片都是為了用戶問題服務的,歷史上下文中會充斥著與問題無關的多模態內容,序列越長,這一現象越嚴重。

為了評估模型在長視覺序列輸入中的抗干擾能力,他們基于MMBench-dev構建了一個新的測評數據集

通過為每一個MMBench循環評估樣本引入無關的圖片并打亂圖片順序,再針對原本的圖片進行提問,看模型是否能穩定地正確回復。(對于同一個問題,會構造4個選項順序和干擾圖片均不同的樣本,全都答對才記一次正確回答。)

實驗中根據輸入圖片數目分為了多個層級。

可以看出,沒有經過多圖訓練的模型例如Qwen-VL和mPLUG-Owl2很快就敗下陣來。

圖片

而經過多圖訓練的LLAVA-Next-Interleave和Mantis在最開始能和mPLUG-Owl3保持近似的衰減曲線,但隨著圖片數目達到了50這個量級,這些模型也不再能正確回答了。

而mPLUG-Owl3堅持到了400張圖片還能保持40%的準確率

不過有一說一,盡管mPLUG-Owl3超越了現有模型,但其準確率遠未達到優秀水平,只能說這一測評方法揭示了所有模型未來需要進一步提升的長序列下的抗干擾能力。

更多詳情歡迎查閱論文及代碼。

論文:https://arxiv.org/abs/2408.04840
代碼:https://github.com/X-PLUG/mPLUG-Owl/tree/main/mPLUG-Owl3
demo(抱抱臉):https://huggingface.co/spaces/mPLUG/mPLUG-Owl3
demo(魔搭社區):https://modelscope.cn/studios/iic/mPLUG-Owl3
7B模型(抱抱臉):https://huggingface.co/mPLUG/mPLUG-Owl3-7B-240728
7B模型(魔搭社區)https://modelscope.cn/models/iic/mPLUG-Owl3-7B-240728

責任編輯:張燕妮 來源: 量子位
相關推薦

2023-05-08 10:14:07

模型AI

2023-08-14 07:20:10

2023-05-30 10:23:45

模型研究

2023-12-23 23:35:13

語言視覺

2024-11-13 09:39:13

2024-09-10 12:11:18

2024-04-23 13:37:00

數據訓練

2024-08-30 14:35:00

2025-01-08 08:21:16

2024-03-25 12:40:19

訓練模型

2024-03-25 12:30:18

AI訓練開源

2024-10-14 14:10:00

大模型AI開源

2024-04-02 09:17:50

AI數據開源

2025-12-03 08:21:33

2024-01-22 13:59:00

模型訓練

2025-09-16 09:35:52

2023-08-29 13:54:00

AI技術
點贊
收藏

51CTO技術棧公眾號

一本一道久久a久久精品综合蜜臀| 日本婷婷久久久久久久久一区二区| 99精品电影| 日韩国产欧美三级| 日本中文字幕成人| 成人av影院在线观看| 国产日韩欧美在线一区| 日本视频一区在线观看| 欧美日韩在线二区| 久久精品精品电影网| 2021国产在线| 欧美午夜女人视频在线| 妞干网在线免费视频| 久久久久免费| 成人中心免费视频| 欧美日韩中出| 尤物九九久久国产精品的分类| 91精品国产aⅴ一区二区| 欧美在线一区二区三区四区| 日韩一级电影| 伊人久久男人天堂| 青春草免费在线视频| 在线影视一区二区三区| 黄色毛片视频| 国产精品久久毛片a| 婷婷无套内射影院| 国产主播一区二区| 亚洲欧美日产图| 国产精品亚洲产品| 97自拍视频| 99精品在线观看| 国产精品视频免费在线| 亚洲精品国模| 日本国产一区二区三区| avtt综合网| 美女视频黄免费的亚洲男人天堂| 不卡一二三区| 亚洲精品国产福利| 超碰在线视屏| 精品国产一区二区三区四区四| 精品高清美女精品国产区| 91成人天堂久久成人| 韩国一区二区三区视频| 中文字幕亚洲天堂| 亚洲电影有码| 在线视频亚洲欧美| 国外成人福利视频| 久久精品久久久久久| 超碰国产精品一区二页| 久久久国产精彩视频美女艺术照福利| 伊人久久视频| 国产一区二区三区视频在线观看 | 国产肉体ⅹxxx137大胆| 另类小说综合欧美亚洲| 在线观看一区欧美| 国产精品一二三| 欧美二区在线视频| 国产精品女主播av| 91美女在线| 日本道免费精品一区二区三区| 99青草视频在线播放视| 日韩美女天天操| 欧美极品免费| 久久久国产精彩视频美女艺术照福利| 精品国模一区二区三区欧美| 久久久久久久久久久成人| 妖精一区二区三区精品视频| 91精品久久久久久久久久| 91精品国产自产在线观看永久∴ | 99国产精品| 日本在线观看一区二区| 国模一区二区三区白浆| 干日本少妇首页| 亚洲激情网站免费观看| 久久久久久久影视| 欧美一卡2卡3卡4卡| 日本精品不卡| 国产精品爽爽爽爽爽爽在线观看| 欧美91大片| 中文字幕欧美日韩一区二区三区| 91年精品国产| 精品欧美不卡一区二区在线观看| 欧美va在线播放| 精品视频成人| 3d动漫啪啪精品一区二区免费| 日韩国产在线观看| 91最新在线观看| 欧美性猛交xxxx免费看漫画| 麻豆福利在线观看| 午夜欧美大片免费观看| 99国产精品| 波多野结衣作品集| 欧美体内she精视频| 在线天堂资源| 日韩av日韩在线观看| 日韩高清在线观看| wwwav91com| 正在播放一区二区| 日韩中文字幕在线一区| 成人免费福利在线| 国产一区二区电影| 我要看一级黄色大片| 欧美一级夜夜爽| а√中文在线天堂精品| 精品日产一区2区三区黄免费 | 日韩欧美久久| 亚洲qvod图片区电影| 国产精品一二三四| 亚洲综合色视频在线观看| 日韩欧美亚洲一区二区| 啪啪国产精品| 亚洲一区二区三区四区中文| 国产欧美久久久精品影院| 老司机精品视频在线观看6| 久久国产精品电影| 99国产精品| eeuss在线播放| 日韩国产在线看| 色男人天堂综合再现| 大陆极品少妇内射aaaaa| 欧美日韩小视频| 亚洲激情播播| 国产片侵犯亲女视频播放| 欧美在线视频日韩| 亚洲精品无吗| 国产精品一线二线三线| 色婷婷综合久久久中文一区二区| 在线成人免费| 亚洲高清视频一区二区| 亚洲大片精品永久免费| 精品国产亚洲一区二区三区| 亚洲精品一区二区三| 在线视频你懂得一区| 精品无人乱码一区二区三区| 91青草视频久久| 99久久精品免费| 国产美女福利在线观看| 国产二区不卡| 亚洲电影在线播放| 亚洲日产av中文字幕| 欧美视频第三页| 亚洲人成在线播放| 亚洲伊人网站| 国产福利片在线| 亚洲精品欧美日韩| 亚洲免费在线视频一区 二区| 成人18视频在线观看| 在线观看欧美激情| 亚洲国产精品高清久久久| 久久av最新网址| 黄网站在线免费看| 国产一区国产精品| 欧美日韩国产一级片| 黄色在线一区| av影片免费在线观看| 成人91视频| 色综合视频一区二区三区高清| 久久av免费看| 国产香蕉视频在线观看| 国产精品免费视频xxxx| 亚洲综合在线观看视频| 日本久久一二三四| 伊人网站在线| 国产精品theporn88| 欧美精品一级二级| 天堂蜜桃一区二区三区| 91黄页在线观看| 免费在线观看污污视频| 亚洲男人天堂九九视频| 国产suv一区二区三区88区| av亚洲一区二区三区| 欧美日韩一道本| 久久亚洲国产精品| 国产精品久久久一本精品| 久久久久观看| 狠狠操在线视频| 97人人澡人人爽| 欧美日韩精品欧美日韩精品一综合| 精品1区2区3区4区| 欧美黄色视屏| 无码粉嫩虎白一线天在线观看| 久久久成人的性感天堂| 一区二区三区中文在线| 欧美日本二区| av电影院在线看| 黄色片久久久久| 国产精品青草久久久久福利99| 日本二三区不卡| 日产国产高清一区二区三区| 91精品国产66| 石原莉奈一区二区三区高清在线| 成人免费看片网站| 亚洲国产成人久久| 91美女视频网站| 天天影视综合| heyzo在线欧美播放| 妞干网在线免费视频| 欧美中在线观看| 欧美日本一区二区| 成人激情校园春色|