国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

多模態大模型最全綜述導讀 原創

發布于 2024-10-16 10:11
瀏覽
0收藏

多模態大模型最新研究綜述簡單版。

不知道最近微軟出的多模態大模型最全綜述  Multimodal Foundation Models: From Specialists to General-Purpose Assistants 大家有沒有看~

包含5大主題一共119頁,內容又干又多,目前網上找到的中文解讀干貨內容都比較全比較長,很容易迷失其中,一直難以看完。

多模態大模型最全綜述導讀-AI.x社區

本期來給大家做一個這篇論文相對簡單的導讀;如果大家有想要著重了解部分或感興趣的內容可以先針對性地看。

下面是一個快捷目錄。

1. 章節分布

2. 具體內容解讀?

章節分布

論文從目前已經完善的和還處于最前沿的兩類多模態大模型研究方向出發,全面總結了五個具體研究主題:

  • 視覺理解
  • 視覺生成
  • 統一視覺模型
  • LLM加持的多模態大模型
  • 多模態agent

這里瓦力畫了一個比較簡單的圖,大致總結一下各個主題的內容,大家可以參考。

多模態大模型最全綜述導讀-AI.x社區

多模態大模型最全綜述導讀-AI.x社區


具體內容解讀

具體的模型、算法大家都可以針對性地自己了解,這里先給大家總結一些比較關鍵的點:

1. 語言或視覺多模態的開發路線

多模態大模型最全綜述導讀-AI.x社區

上述四個類別中,第一類是任務特定模型,后面三類屬于基礎模型。

下面以語言為例,聊聊AI的演進趨勢:

  • Task-Specific Models:可以對標以前LSTM/RNN時代,需要一個任務訓練一個模型。
  • Pre-trained Models:transformer(BERT、GPT)時代,先有預訓練的權重,再繼續適配下游任務進行一次訓練,但還是不同下游任務適配的不一樣權重;這個時代大家站transformer比較多,GPT此類單向注意力的模型一般在生成任務且要求序列生成較穩定的情況下使用。
  • Unified Models with Emerging Capabilities開始,GPT3已經展現了一些涌現能力。
  • General-purpose Assistant時代:OpenAI堅定地走了GPT路線,并對生成結果進行了對齊,ChatGPT就此誕生了~

2. 多模態中經典的5個問題

論文中回答了經典的5個問題,也闡述了多模態基礎模型旨在解決的三個代表性問題:視覺理解任務、視覺生成任務和具有語言理解和生成的通用界面。

多模態大模型最全綜述導讀-AI.x社區

Q1:如何學習視覺表示?

Q2:如何做視覺生成?

Q3:如何不基于大語言模型訓練一個通用視覺模型?

Q4:如何訓練多模態大語言模型

Q5:如何為大語言模型鏈接一個多模態專家?

下面是論文中各章節及經典的模型推薦,其中橙色的部分,也就是視覺理解主題部分回答了Q1;綠色的部分,視覺生成主題部分回答了Q2;藍色的部分,回答了Q3~Q5。

多模態大模型最全綜述導讀-AI.x社區

下面我從文章摘取一些內容簡單回答來上述5個問題,如果大家需要詳細了解的話可以從上圖中對應章節去研讀:

Q1:如何學習視覺表示?

多模態大模型最全綜述導讀-AI.x社區

下圖比較清晰的展現了現有的四種方法:

多模態大模型最全綜述導讀-AI.x社區

此外,論文中還列出了上述方法的代表模型。

多模態大模型最全綜述導讀-AI.x社區

  • 監督學習
  • 對比語言-圖像預訓練


多模態大模型最全綜述導讀-AI.x社區


多模態大模型最全綜述導讀-AI.x社區

  • 純圖像自我監督學習(對比學習、非對比學習)

多模態大模型最全綜述導讀-AI.x社區

  • 掩碼圖像建模

多模態大模型最全綜述導讀-AI.x社區

Q2:如何做視覺生成?

現有方法的代表模型。

多模態大模型最全綜述導讀-AI.x社區

1) 具有代表性的文本到圖像生成模型

多模態大模型最全綜述導讀-AI.x社區

2)經典的擴散模型架構

多模態大模型最全綜述導讀-AI.x社區

3)未來研究趨勢:統一調優,實現人工對齊

具體又可以分為這三個方向:

  • 統一的圖像和文本輸入。
  • 調整以對齊為中心的損失和獎勵。
  • 多模態內容理解和生成的閉環。

Q3:如何不基于大語言模型訓練一個通用視覺模型?

現有方法的代表模型。

多模態大模型最全綜述導讀-AI.x社區

1)從封閉集到開放集

通過引入對比語言-圖像預訓練方法來訓練開放集模型,解決了傳統封閉集模型的局限性。如圖 4.2 (a) 所示,CLIP 不是學習從輸入到標簽的映射,而是使用數億個圖像-文本對學習對齊的視覺語義空間。

多模態大模型最全綜述導讀-AI.x社區

2)從特殊任務到通用

可分為I/O Unification 和Functionality Unification,也就是I/O統一和功能統一。

  • I/O統一:使用分詞器將各種任務中使用的不同模式的原始輸入和輸出 (I/O) 分詞化為連貫的序列(視覺或文本)分詞,然后利用統一的序列到序列模型。
  • 功能統一:最近許多研究都使用了類似于transformer 的 Encoder-Decoder 架構,需要復雜的模型設計來適應各種任務。

多模態大模型最全綜述導讀-AI.x社區

3)從靜態到可提示

這里的研究主要是一些增強靜態視覺模型的能力,目的是為了支持:(i) 多模態提示;(ii) 上下文提示。

Q4:如何訓練多模態大語言模型?

這里文中舉了兩個例子:

1)LMM 使用圖像-文本成對實例進行訓練

大多數 LMM 都是在大量圖像-文本對上訓練的,其中每個訓練樣本都是一對。

多模態大模型最全綜述導讀-AI.x社區


多模態大模型最全綜述導讀-AI.x社區

2)使用交錯圖像文本序列實例訓練的 LMM。

論文中以Flamingo為例, Flamingo 使用僅來自 Web 的互補大規模多模態數據的混合進行訓練,而不使用任何用于機器學習目的的注釋數據。訓練完成后,Flamingo可以通過簡單的few-shot learning 直接適應視覺任務,而無需任何額外的任務特定調整。

多模態大模型最全綜述導讀-AI.x社區

多模態大模型最全綜述導讀-AI.x社區

Q5:如何為大語言模型鏈接一個多模態專家?

這里以MM-ReAct為例,其系統范式由 Chat GPT 組成了多模態工具,用于多模態推理和動作。通過使用各種多模態工具增強純語言的 ChatGPT,MM-REACT 支持多模態的輸入和輸出,包括文本、圖像和視頻。

多模態大模型最全綜述導讀-AI.x社區

再下面是MM-REAC涌現的多模態推理和動作功能。

多模態大模型最全綜述導讀-AI.x社區

那么論文的簡單導讀就是這樣了,如果大家覺得論文過長文本看不進去還可以看論文中1.4節附上的視頻,B站和youtube都有;雖然是英文的,但結合PPT整體看下來是比較容易理解的。

參考文獻:

[2309.10020] Multimodal Foundation Models: From Specialists to General-Purpose Assistants (arxiv.org)


文轉載自公眾號瓦力算法學研所,作者:喜歡瓦力的卷卷

原文鏈接:??https://mp.weixin.qq.com/s/fTiUSPZi8q3qy-Lnt6_EZQ??


?著作權歸作者所有,如需轉載,請注明出處,否則將追究法律責任
已于2024-10-16 12:45:42修改
收藏
回復
舉報
回復
相關推薦
91免费欧美精品| 盗摄精品av一区二区三区| 激情自拍一区| 精品一区二区三区四区在线| 5566中文字幕一区二区| 激情小说激情视频| 国产第一亚洲| 国产91露脸合集magnet| 精品99一区二区| 高清孕妇孕交╳╳交| 久久精品国产在热久久| 精品99久久久久久| 国产传媒视频在线观看| 成人激情文学综合网| 狠狠色噜噜狠狠色综合久| 成人性生交大片免费看中文视频 | 国产精品成人免费电影| 美女福利一区二区三区| 欧美日韩国产在线观看| 国产精品视频免费一区二区三区| 超碰在线首页| 2020国产成人综合网| 一本久久a久久精品vr综合| av中文资源在线资源免费观看| 国产精品九九| 欧美男人的天堂一二区| 神马久久影视大全| 亚洲国产一区二区三区在线播放| 久久久97精品| 亚洲这里只有精品| 国产一区二区三区电影在线观看| 国产一区av在线| 超清av在线| 欧美一级久久久| 日韩精品久久一区二区三区| 91精品精品| 国产精品你懂得| 日本在线天堂| 一本一本大道香蕉久在线精品| 91手机视频在线观看| 国产成人澳门| 色综合男人天堂| 视频精品二区| 欧美视频二区36p| 成视频在线免费观看| 亚洲欧洲美洲一区二区三区| 在线观看免费黄色| 91精品国产乱码久久久久久久久| 欧美特级aaa| av男人一区| 美女精品视频一区| 成人教育av| 国产mv日韩mv欧美| 成人av在线播放观看| 久久精品av麻豆的观看方式| 欧美少妇在线观看| 99精品黄色片免费大全| 狠狠热免费视频| 日韩在线欧美| 国产在线精品自拍| 日本午夜大片a在线观看| 日韩免费成人网| www.成人69.com| 中文字幕一区二区三区四区| 国产va在线观看| 加勒比色综合久久久久久久久| 国产一区视频免费观看| 成人av网址在线观看| 免费一级特黄特色毛片久久看| 91麻豆国产精品久久| jlzzjlzz欧美大全| 欧美私人免费视频| 综合毛片免费视频| 午夜精品久久久久久99热| 欧美日韩中文字幕一区二区三区| 国产精品电影一区二区| 91麻豆福利| 欧美视频精品在线观看| 黄色在线网站噜噜噜| 欧美另类精品xxxx孕妇| 欧美电影一二区| 精品国产拍在线观看| 国产精品极品| 久久精品欧美| 精品日韩在线| 欧美国产视频在线观看| 久久久久亚洲蜜桃| 91九色在线porn| 欧美大片在线免费观看| 韩日欧美一区| 国产亚洲欧美在线视频| 欧美性xxxxxxxxx| 中文在线а√在线8| 国产成人精品亚洲精品| 四虎国产精品成人免费影视| 奇米影视亚洲狠狠色| 亚洲中字黄色| 国产精品91视频| 肉肉av福利一精品导航| 国产精品久久久久av| 裸体一区二区| 国产精品国产亚洲精品看不卡15| 国产一区二区伦理| 视频一区国产精品| 最新中文字幕一区二区三区| 欧美一级欧美一级| 亚洲一区二区精品视频| av中文在线资源| www国产精品视频| 欧美日韩女优| 亚洲精品成人在线| 91jq激情在线观看| 国产精品久久久久久久久久久久 | 高清国产一区二区| 黄色片在线播放| 性欧美大战久久久久久久久| 成人免费毛片播放| 69堂成人精品免费视频| 五月综合久久| 北条麻妃69av| 亚洲精品一区在线观看香蕉| 一区免费视频| 久草在线在线| 欧美激情在线观看| 国产精品18久久久久久vr| 米奇777四色精品人人爽| 色94色欧美sute亚洲线路二| 日本高清久久| 青春草在线视频免费观看| 欧美色综合影院| 欧美精品一区二区久久| 宅男噜噜噜66国产免费观看| 国产午夜精品全部视频播放| 日韩午夜在线电影| 午夜老司机精品| 日韩成人性视频| 最近最新mv在线观看免费高清| 亚洲精品在线视频| 激情综合自拍| 国产主播福利| 九九综合九九综合| 国产一区二区免费看| 欧美韩日亚洲| 精品999在线播放| 欧美色123| 欧美vide| 日本亚洲精品在线观看| 久久福利影院| 中文字幕v亚洲ⅴv天堂| a成人v在线| 日本一区美女| 91精品国产综合久久蜜臀| 亚洲国产精品日韩专区av有中文| ckplayer中文字幕| 韩国福利视频一区| 亚洲国产激情av| 在线精品视频一区| 国产 porn| 久久久久久欧美| 国产欧美日韩综合| 精品精品精品| 俄罗斯xxxx性全过程| 欧洲亚洲在线视频| 香蕉久久一区二区不卡无毒影院| 黄色的视频在线观看| 精品国产123区| 欧美美女黄色网| 日韩国产激情在线| 久久国产精品无码网站| 香蕉视频免费版| 国产亚洲精品资源在线26u| 日韩成人亚洲| 男人亚洲天堂网| 亚洲二区在线观看| 最好看的2019的中文字幕视频| 成人短视频app| 国产精品av免费观看| 中文字幕在线亚洲| 26uuu国产电影一区二区| 红杏视频成人| 欧美精品一二三区| 日本动漫理论片在线观看网站| 蜜桃999成人看片在线观看| 麻豆视频观看网址久久| www.51av欧美视频| 欧美 丝袜 自拍 制服 另类| 免费不卡在线观看| 999精彩视频| 91丨九色丨国产在线| 4438亚洲最大| 成人国产亚洲欧美成人综合网| 国产精品zjzjzj在线观看| 中文字幕视频免费在线观看| yellow视频在线观看一区二区| 日韩视频在线永久播放| 久久这里只有精品6| 午夜影院欧美| 是的av在线| 免费在线黄色av| 欧美成人福利视频|