国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

開源模型突破原生多模態大模型性能瓶頸,上海AI Lab代季峰團隊出品

人工智能 新聞
上海AI Lab代季峰老師團隊,提出了全新的原生多模態大模型Mono-InternVL。

原生多模態大模型性能瓶頸,迎來新突破!

上海AI Lab代季峰老師團隊,提出了全新的原生多模態大模型Mono-InternVL

與非原生模型相比,該模型首個單詞延遲最多降低67%,在多個評測數據集上均達到了SOTA水準。

圖片

與常見的采用CLIP等結構進行視覺編碼的模塊化多模態大模型不同,Mono-InternVL將視覺感知和多模態理解均集成到大語言模型中。

相比于現有多模態大模型,Mono-InternVL有以下技術亮點:

  • 開源原生多模態架構最優解:無需額外的視覺編碼器,通過內嵌視覺專家打通了一條從大語言模型到原生多模態模型擴展的新路徑,2B模型多模態能力優于7B參數的現有原生多模態模型,多個指標超越InternVL1.5。
  • 兼具視覺靈活性和部署高效性:支持高達2M像素輸入的動態圖像分辨率,在原生多模態架構中感知精度最高。相比于InternVL1.5,在部署框架上首個單詞延遲最多降低67%,整體吞吐量提高31%。

圖片

破解原生多模態大模型遺忘問題

現有的多模態大模型(MLLM)通常采用視覺編碼器-對齊模塊-語言模型的結構,將視覺編碼和語言解碼分別進行處理。

具體來說,這些模型通常通過將預訓練的視覺編碼器(例如CLIP)與大語言模型(LLM)結合來實現,即模塊化MLLM。

最近新興的Chameleon、EVE等原生MLLM,將視覺感知和多模態理解直接集成到一個LLM中,可以更方便地通過現有工具進行部署、具備更高的推理效率。

然而,由于原生MLLM缺乏視覺能力,視覺相關的訓練通常不可避免,但視覺預訓練過程中語言基座能力常常出現災難性遺忘問題,導致現有原生MLLM的性能仍顯著低于模塊化MLLM。

為此,Mono-InternVL提出了采用增量預訓練的方法,解決此前原生MLLM中的災難性遺忘問題。

因此,作者在預訓練的LLM中嵌入了專門服務于視覺建模的視覺專家,通過MoE的方式實現稀疏化的建模。

基于此,作者通過僅優化視覺參數空間來進行視覺預訓練,同時保留了語言基座的預訓練知識。

原生多模態結構

具體來說,Mono-InternVL 由視覺文本嵌入和多模態MoE結構兩部分組成:

  • 視覺和文本嵌入:與使用CLIP等視覺編碼器的模塊化 MLLM 相比,Mono-InternVL 通過patch embedding直接將圖像轉換為patch序列。文本嵌入模塊則直接使用LLM的分詞器。
  • 多模態MoE結構:Mono-InternVL 的核心是將視覺專家FFN嵌入到預訓練的 LLM 中。視覺FFN從預訓練LLM中的文本FFN初始化。由此不僅可以利用預訓練的 LLM 知識促進視覺預訓練,還能顯著緩解災難性遺忘問題。

圖片

內生視覺預訓練

作者提出內生視覺預訓練(EViP)方法,旨在通過在大規模噪聲數據和合成數據上進行預訓練來最大化Mono-InternVL的視覺能力。

EViP被設計為一個從基本視覺概念到復雜語義知識的逐步學習過程,包括三個階段:

  • 概念學習,用于掌握基本的視覺概念;
  • 語義學習,用于捕捉高層次語義知識,例如世界知識;
  • 對齊學習,用于將知識與下游任務對齊。

在視覺預訓練完成后,Mono-InternVL通過指令微調處理復雜的多模態任務。

在前兩個階段中保持預訓練LLM的參數固定,僅訓練視覺部分的嵌入模塊和視覺FFN,而在第三階段和指令微調中逐步放開LLM中的multi-head attention和文本FFN。

得益于這一架構和預訓練策略,Mono-InternVL的視覺可擴展性得到了充分釋放,隨著預訓練數據規模的增加,其下游性能持續提高。

圖片

原生多模態大模型性能大幅提升

作者基于InternLM2-1.8B開發了Mono-InternVL-2B模型,在16個多模態基準上進行了廣泛的實驗。

下圖展示了中英文OCR、問答、圖表解析等任務的可視化樣例,體現了Mono-InternVL的實際效果。

如圖,模型成功識別出了圖中的“諾貝爾物理學獎2024”標題,Hopfield、Hinton等人名,以及瑞典皇家科學院落款等文本。

圖片

對于動漫風格的圖片,模型識別出了形狀扭曲的NEC、PANASONIC等品牌名,并提供了細致生動的圖像描述。

圖片

在Grounding任務上,Mono-InternVL可以精準定位照片中的美短的坐標。

圖片

對于中文的手寫文本同樣具備不錯的識別能力。

圖片

在代碼生成任務上也表現較為出色。

圖片

數據上看,實驗結果也表明,1.8B激活參數的Mono-InternVL可以大幅超越此前的7B參數原生多模態模型EVE,平均提升15.5%

與最先進的模塊化MLLM InternVL-1.5相比,Mono-InternVL在6個多模態基準上表現更優。

圖片

通過LMDeploy的部署實驗表明,Mono-InternVL與模塊化模型InternVL-1.5相比,首個token延遲減少了67%,整體吞吐量提高31%。

圖片

消融實驗結果,也驗證了視覺專家和增量預訓練的有效性。

圖片

下游任務性能與預訓練數據規模的曲線圖表明,在三階段的EViP的幫助下,Mono-InternVL 的能力隨著數據規模增加而不斷提升。

圖片

作者可視化了不同層的注意力圖,展示了模型淺層部分所存在的視覺局部性、視覺文本交互較少等問題,為未來原生MLLM 的設計提供啟發。

圖片

作者簡介

本文的共同一作為羅根 (上海人工智能實驗室博士后研究員),楊學(上海人工智能實驗室青年研究員),竇文涵(清華大學本科生),王肇凱(上海交通大學&上海人工智能實驗室聯培博士生)

本文的通訊作者是朱錫洲,他的研究方向是視覺基礎模型和多模態基礎模型,代表作有 Deformable DETR、DCN v2等。

圖片

論文地址:https://arxiv.org/abs/2410.08202
項目主頁:https://internvl.github.io/blog/2024-10-10-Mono-InternVL/
推理代碼&模型鏈接:https://huggingface.co/OpenGVLab/Mono-InternVL-2B

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-10-21 13:20:00

視頻數據集

2025-11-03 08:40:00

2025-03-13 09:47:29

2025-08-07 02:00:00

2025-01-08 08:21:16

2024-06-17 18:04:38

2025-10-20 09:02:00

2025-02-18 09:10:00

2025-09-16 09:35:52

2025-02-27 13:00:00

2024-06-20 10:49:15

2025-01-15 13:40:00

2024-03-06 09:00:00

大語言模型人工智能

2025-06-09 08:42:23

2023-09-28 08:23:18

AI模型

2025-06-18 09:06:00

2024-09-10 12:11:18

2024-03-25 12:30:18

AI訓練開源

2025-08-07 16:24:19

小紅書開源dots.vlm1
點贊
收藏

51CTO技術棧公眾號

精品欧美一区二区三区在线观看| 亚洲人成影院在线观看| 日韩中文字幕91| 97高清免费视频| 在线免费福利| 亚洲国产日韩欧美在线| 91视频在线看| 国产精品成久久久久三级| 久久亚洲精品中文字幕蜜潮电影| 日韩免费电影一区| 91av视频导航| 久久久亚洲精品无码| 电影天堂国产精品| 国产清纯白嫩初高生在线观看91 | 9l视频自拍九色9l视频成人| 一区二区三区日韩视频| 欧美一区91| 丰满少妇久久久久久久| 亚洲天堂av在线播放| 一区二区视频国产| 午夜精品在线| 欧洲一区二区三区在线| 久久精品日产第一区二区三区精品版| av网站在线免费观看| 蜜桃精品在线观看| 97久久久久久| 青青青草原在线| 久久高清精品| 日韩成人在线播放| 忘忧草在线影院两性视频| 亚洲精品一区二区三区影院| 自拍日韩亚洲一区在线| 欧美日韩精品一本二本三本 | 日韩成人久久久| 国产91在线亚洲| 亚洲精品国产setv| 成人免费xxxxx在线观看| 97蜜桃久久| 欧美日韩激情视频| 国产九一视频| 成人免费在线视频观看| 四虎精品一区二区永久在线观看| 国产午夜精品一区二区三区嫩草 | 一区二区三区国产精品| 国产黄色特级片| 成人黄色综合网站| 青草全福视在线| 国产一区二区h| youjizz.com亚洲| 国内精品伊人久久久久av影院 | 六九午夜精品视频| 亚洲人和日本人hd| 日本视频一区在线观看| 一本色道久久综合亚洲精品不卡| 国产福利精品导航| 经典三级在线视频| 成人动漫在线一区| 国产真实乱子伦| 国产精品视频你懂的| 在线看的黄色网址| 亚洲精品videosex极品| 青柠在线影院观看日本| 色综合久久久久网| 国产激情在线观看| 亚洲欧美另类在线观看| 久久亚洲人体| 欧美亚洲激情在线| 91成人影院| 免费亚洲一区二区| 国产999精品久久久久久绿帽| 国产美女无遮挡网站| 国产精品久久久久久久久久久免费看| 看欧美ab黄色大片视频免费| 亚洲一区二区三区四区在线| 你懂的视频在线免费| 欧美日韩高清一区二区| gogo久久| 欧美精品午夜视频| 日韩综合精品| 国产伦理久久久| 日韩一区二区电影在线| 欧美孕妇毛茸茸xxxx| 在线电影一区二区| 亚洲三区在线| 亚洲国产精品精华液2区45| 一二三中文字幕在线| 亚洲国产精品小视频| 91精品国产乱码久久久竹菊| 国产日本欧美一区| 美日韩一区二区| 亚洲黄色小视频在线观看| 日本精品一区二区三区高清| 老牛影视精品| 国产va免费精品高清在线| 日韩av一级片| 国模大尺度私拍在线视频| 日韩一级大片在线观看| 97久久综合精品久久久综合| 国产亚洲精品美女久久久m| 91在线精品秘密一区二区| 精品久久久久一区二区三区| 中文字幕亚洲专区| 91精品秘密在线观看| 男人j进女人j| 亚洲444eee在线观看| 性欧美hd调教| 91精品黄色| 久久先锋影音av鲁色资源网| 91最新在线| 97超级碰在线看视频免费在线看 | 亚洲第一av网| 成久久久网站| 日韩亚洲欧美视频| 成人爽a毛片免费啪啪| 在线看你懂得| 亚洲精品国产综合区久久久久久久 | 视频一区二区欧美| 成人免费午夜电影| 国产精品99久久不卡二区| 中文字幕在线观看第一页| 中文字幕日韩欧美在线视频| 亚洲三级视频| 写真福利片hd在线观看| 久久久av亚洲男天堂| 日韩高清在线观看| 欧美女v视频| 欧美中文字幕精品| 91网站视频在线观看| 在线网址91| 91黄色精品| 一区二区三区四区在线| 99久久99九九99九九九| 亚洲午夜高清视频| 9191国产精品| 欧美日本精品| 国产不卡视频| 午夜精品理论片| 懂色av一区二区三区蜜臀| caopon在线免费视频| 国产欧亚日韩视频| 亚洲色图制服丝袜| 欧美高清一级片| 欧美在线一区视频| 精品一区二区三区四区在线| 久久午夜影院| 成人在线观看a| 久久中文字幕在线| 国产福利一区二区三区视频在线 | 欧美三级美国一级| 视色视频在线观看| 久久久999精品视频| 成人午夜精品在线| 免费欧美电影| 欧美天堂亚洲电影院在线观看 | 欧美精品日日鲁夜夜添| 久久伊人一区二区| 国产精品tv| 老子影院午夜伦不卡大全| 亚洲国产精品yw在线观看| 日韩在线卡一卡二| 亚洲图区一区| 青青草成人激情在线| 午夜先锋成人动漫在线| 中文字幕国内自拍| 97av在线播放| 亚洲一区二区视频| 欧美裸体在线版观看完整版| 丝袜美女写真福利视频| 国产精品久久久久国产a级| 亚洲一二三四久久| 日韩在线精品| yiren22亚洲综合伊人22| 久久精品成人一区二区三区蜜臀| 欧美精品aⅴ在线视频| 日韩在线一二三区| 国产精品高清乱码在线观看| 亚洲小视频在线播放| 亚洲一区二区久久| www国产精品av| 日韩精品社区| 欧美视频综合| 久热国产精品视频一区二区三区| 亚洲国产福利在线| 国产91高潮流白浆在线麻豆| 精品视频在线观看网站| 免费观看视频www| 久久中文字幕视频| 妺妺窝人体色www在线小说| 国产福利电影网| 超黄网站在线观看| 成人高清dvd| 欧美国产精品va在线观看| 亚洲美女免费在线| 综合久久久久| 国产网红在线观看| 少妇高潮大叫好爽喷水| 欧美黄网免费在线观看| 福利一区视频在线观看| 日本在线不卡视频一二三区| 97精品国产99久久久久久免费|