国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

「多模態LLM」最新介紹!數據、論文集直接打包帶走

人工智能 新聞
全面了解多模態大語言模型,首個跟蹤MLLM進展的論文集合發布。

圖片

進展跟蹤鏈接(Awesome-MLLM,實時更新):https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models

近年來,大型語言模型Large Language Models(LLM)的研究取得了顯著的進展(例如GPT-3,LLaMa,ChatGPT,GPT-4),這些模型在各項自然語言處理(NLP)任務上展現了出色的性能。

通過在海量數據上預訓練,LLM獲得了豐富的知識以及強大的推理能力。只需要輸入一些用戶指令,這些模型就可以解析指令、進行推理并給出符合用戶預期的回答。

LLM具有的一些典型能力包括:

  • · 執行訓練時未見過的新任務;
  • · 通過少量樣例完成新任務;
  • · 通過推理鏈條執行復雜的推理任務;
  • · 協調各種模型與工具完成復合任務。

這些能力背后蘊含著眾多關鍵思想和技術,包括指令微調(Instruction Tuning),上下文學習(In-Context Learning)和思維鏈(Chain of Thought)等。

多模態大型語言模型

盡管大語言模型在NLP領域取得了長足的發展,相應的模型與技術在多模態領域則較少探索,且傳統視覺-語言模型仍存在著泛化性不足以及缺乏推理能力等局限。

為此,近期眾多學者將注意力轉向一個新興的方向:多模態大型語言模型Multimodal Large Language Models(MLLM)。

其主要思想是以LLM作為「大腦」對輸入的多模態信息進行整合、推理、分析和決斷,從而完成人類交付的任務。

圖片

從發展通用人工智能的視角看,相比于LLM,MLLM又向前邁進了一步,且具有以下優點:

· 更符合人類認知世界的習慣。人類具有多種感官,接受多種模態信息,這些信息常常是互補的、協同作用的。因此,使用多模態信息一般可以更好地認知與完成復雜任務;

· 更加強大與用戶友好(User-Friendly)的接口。通過支持多模態輸入,用戶可以通過更加靈活的方式傳達信息;

· 更廣泛的任務支持。LLM通常只能完成NLP相關任務,而MLLM通過接入多模態可以完成更多任務。

從系統設計的角度來看,MLLM可以分為兩類:

· LLM作為推理器的、支持多模態輸入的認知推理系統;

· LLM作為規劃器/調度器/決策器的多工具協作系統。

前者一般通過可訓練的多模態轉換接口將多模態信息轉化為LLM可以直接接收、處理的形態,使LLM可以基于這些多模態信息以及用戶指令進行認知與推理。

后者通常以LLM作為規劃器/調度器/決策器[1],將用戶交付的復雜任務分解為更簡單的子任務,并派發給合適的模型/工具,最后整合結果并輸出。

我們采取另一種視角,聚焦于MLLM背后的關鍵技術與實現方式,對相關工作進行了調研與總結,將MLLM劃分為以下幾類:

· 多模態指令微調(Multimodal Instruction Tuning)

· 多模態上下文學習(Multimodal In-Context Learning)

· 多模態思維鏈(Multimodal Chain-of-Thought)

· LLM輔助的視覺推理(LLM-Aided Visual Reasoning)

下面我們將對這幾類工作進行簡要介紹。

多模態指令微調(Multimodal Instruction Tuning)

多模態指令微調的基本做法是使用統一的模板將各類數據統一起來,并以指令的形式描述任務需求,形成多模態指令數據,再使用這種數據去微調MLLM。

由于訓練與測試時的指令形式具有一致性,LLM可以憑借其強大的語義理解和推理能力,更靈活地泛化到其他任務,獲得強大的零樣本學習能力。

多模態指令數據的基本形式可以概括為(指令,多模態輸入,回答)三元組。

一種直觀的獲得這種數據的方式是改造基準(Benchmark)數據集,我們以圖像描述(Image Captioning)為例,如下圖1所示:

圖片

圖1. 多模態指令數據示例

原本的Caption數據樣本包括一張圖片和一段文字描述(Ground Truth),這種數據-GT的配對數據自然構成了指令數據的多模態輸入和回答部分。

指令部分則為相應任務的描述,一般由人工編寫或者調用GPT生成。

在進行多模態指令微調時,MLLM轉化多模態輸入并送入LLM中,LLM基于多模態信息與指令文本預測答案。

多模態上下文學習(Multimodal In-Context Learning)

多模態上下文學習的核心思想是從類比中學習。比如,我們在學習時一般接觸到的形式如下:

圖片

通過學習例題,我們在遇到新的問題時,可以通過類比例題學習基本思想與方法,從而解決新的問題。

此外,例題還能規范我們的回答格式,更有利于得到正確的、符合預期要求的答案。

如下圖2所示,通過樣例讓模型預測3x7的計算結果。

圖片

圖2. 多模態上下文數據示例,通過樣例讓模型預測3x7的計算結果

多模態思維鏈(Multimodal Chain-of-Thought)

思維鏈即一系列中間推理步驟[2]。多模態思維鏈的基本思想是使模型學會逐步輸出中間步驟,最后推理出最終答案,如下圖3所示:

圖片

圖3. 多模態思維鏈數據示例

相比于直接輸出答案的方式,思維鏈:

· 更符合人類推理習慣:基于之前的推理步驟與結果,逐步導向最終答案;

· 適用于復雜的推理任務,將復雜問題分步求解,提高回答的準確性。

LLM輔助的視覺推理(LLM-Aided Visual Reasoning)

利用LLM作為決策與推理機構,調用各種多模態模型和工具并整合輸出,得到最后的答案。根據完成任務的方式一般可分為單輪模型與多輪模型。

單輪模型的基本思想是由LLM作為規劃器、調度器和決策器協調各個模型/工具完成任務,一般需要完成以下職能[1]:

· 規劃器:將復雜任務分解為可解的子任務;

· 調度器:將子任務派發給合適的模型/工具;

· 決策器:管理子任務執行順序,整合子任務結果得到最終答案。

多輪模型基于迭代的思想,不斷積累視覺認知,直到足夠自信得到最終答案。在這個過程中,LLM需要整合之前的步驟 (提出的問題與已獲得的視覺認知信息),判斷是否可以輸出最終答案[3]。

相關論文詳見:https://github.com/BradyFU/Awesome-Multimodal-Large-Language-Models

圖片

圖片

圖片

圖片

圖片

圖片

圖片

圖片


責任編輯:張燕妮 來源: 新智元
相關推薦

2014-07-22 13:30:10

大數據

2025-01-08 08:21:16

2024-12-18 18:57:58

2025-09-22 09:14:00

2017-01-10 14:10:16

大數據數據可視化工具

2025-08-08 14:00:10

計算機特斯拉超算

2018-08-29 10:25:57

Linux虛擬機Windows

2024-01-11 16:24:12

人工智能RAG

2024-08-08 13:04:28

2024-06-28 18:18:22

2021-03-19 08:52:28

驗證碼短信安全漏洞

2025-05-06 08:40:00

2024-12-16 07:00:00

2023-04-13 15:25:14

模型

2024-05-15 10:15:00

自動駕駛模型

2023-12-25 09:07:50

AI人工智能Ferret

2024-12-17 08:05:34

大型語言模型MetaAILLM

2023-11-29 15:00:00

數據訓練

2025-04-22 07:00:00

2024-12-17 12:08:21

IAA多模態LLM
點贊
收藏

51CTO技術棧公眾號

国产精品日韩一区二区| 精品乱码一区二区三四区视频| 97在线视频免费观看| 在线观看三级网站| 爱搞国产精品| 玖玖视频精品| 亚洲久久一区| 欧美丝袜自拍制服另类| av一区二区三区四区电影| 欧美日韩影视| 精品动漫一区| 51午夜精品国产| 亚洲国产精品一区二区第一页| 欧美13videosex性极品| 国产在线播放一区三区四| 亚洲国产成人91精品| 少妇高潮大叫好爽喷水| 久久三级视频| 欧美成熟毛茸茸复古| 美女高潮视频在线看| 337p亚洲精品色噜噜| 日韩成人影视| 国产精品18久久久| yellow中文字幕久久| 精品亚洲一区二区三区四区| 欧美影院三区| 亚洲成人xxx| 国产激情在线观看| 国产精品中文欧美| 69久久夜色精品国产7777| 精品一区二区三区视频在线播放| 中文字幕精品综合| 亚洲精品免费网站| 中文字幕在线直播| 欧美高清在线一区| 激情五月婷婷久久| 综合五月婷婷| 欲色天天网综合久久| 独立日3在线观看完整版| 天天综合国产| 亚洲人成77777在线观看网| 韩国视频一区二区三区| 哺乳挤奶一区二区三区免费看| 亚洲精品国产一区二区三区四区在线 | 欧美激情777| 日韩精品综合一本久道在线视频| 日韩一级特黄毛片| 中文无码日韩欧| 在线精品视频一区二区| 成人国产一区二区三区| 不卡av免费在线观看| 91精品久久久久| 国产传媒av在线| 亚洲国产精品免费| 最后生还者第二季在线观看| 青娱乐精品视频在线| 日本久久久久久久久久久| 大片免费在线看视频| 亚洲免费一级电影| 午夜影院在线| 国产成人一级电影| 男女免费网站| 精品无码三级在线观看视频| 国产精品91久久久久久| 中文字幕色婷婷在线视频| 色偷偷av亚洲男人的天堂| 在线播放毛片| 自拍偷拍亚洲欧美| 成人欧美在线| 日韩网站在线观看| 欧美黄污视频| 日韩国产欧美亚洲| 日韩av中文字幕一区二区| 日本a级片免费观看| 美女视频网站久久| 国产精华一区二区三区| 精品福利久久久| 久久九九热免费视频| 韩国av网站在线| 亚洲黄色尤物视频| 午夜dj在线观看高清视频完整版 | 日韩av一区二区三区在线 | 俺也去精品视频在线观看| 911精品美国片911久久久| 久久精品人人做人人爽| 日韩国产在线| 欧美专区在线播放| 一区二区三区在线资源| 久久riav| 黄色免费成人| 国产精品永久免费视频| 日韩欧美美女在线观看| 日韩视频精品在线| 精品91在线| 中文字幕2019第三页| 中文字幕高清不卡| 先锋成人av| 国产精品丝袜高跟| 91免费国产视频网站| 免费一级特黄特色毛片久久看| 天天色 色综合| 一级日本免费的| 中文字幕亚洲在线| 亚洲影院免费| 精品在线不卡| 性色一区二区三区| 德国一级在线视频| 久久久精品免费| 久久国产乱子精品免费女| 日韩免费中文专区| 精品久久在线播放| 中文字幕日韩在线| www.国产在线视频| 丁香一区二区三区| 国产亚洲欧美在线视频| 精品国产污网站| 在线观看a级片| 亚洲风情亚aⅴ在线发布| 午夜日韩电影| 欧美风狂大伦交xxxx| 黑人巨大精品欧美一区二区免费 | 夜夜精品视频| 亚洲精品中文字幕在线 | 成人aaaa| 美女张开让男人捅| 欧美激情中文网| 伊人久久大香线蕉无限次| 国产精选久久久久久| 欧美激情一区在线| 蜜桃臀av在线| 国产精品永久免费| 性感美女久久精品| 欧美14一18处毛片| 中文字幕亚洲一区二区三区五十路 | 日韩高清国产精品| 欧美一级日韩不卡播放免费| 爱啪视频在线观看视频免费| 久久久精彩视频| 91精品国产综合久久久久久久| 无码小电影在线观看网站免费| 日本高清一区| 99精品视频在线观看免费| 成人丁香基地| 欧美一区二区影院| 在线播放不卡| a天堂在线资源| 伊人伊人伊人久久| 国产成人久久精品77777最新版本| 最新中文字幕在线播放| youjizz.com在线观看| 亚洲欧美色图小说| 国产一级二级三级在线观看| 亚洲自拍偷拍色图| 色欧美88888久久久久久影院| 捆绑调教日本一区二区三区| 日韩精品一区二区三区外面 | 亚洲色图av在线| 99视频在线精品| 黄页网站免费在线观看| 国产区精品在线观看| 欧美特黄级在线| 欧美日韩亚洲国产| 国产高清视频一区三区| 一区二区三区免费看视频| 最新av在线播放| 在线看无码的免费网站| 国产精品污网站| 热久久天天拍国产| 国产一区久久精品| 日韩伦理在线免费观看| 欧美唯美清纯偷拍| 日本中文在线一区| 一区二区三区视频免费视频观看网站| 91破解版在线看| 中文字幕日韩有码| 国产精品久久久久四虎| 91福利区在线观看| 91久久国产精品91久久性色| 粉嫩aⅴ一区二区三区四区 | 欧美成人四级hd版| 久久尤物视频| 国产精品久久久久77777丨| 国产精品国产亚洲精品看不卡15| 亚洲第一中文字幕在线观看| 欧美高清一级片在线观看| 91精品国产乱码久久久久久久| 中日韩脚交footjobhd| 在线观看国产视频一二三| 日韩精品国内| 欧美在线视频a| 精品电影一区二区三区| 国产精品久久久久三级| 六月婷婷色综合| 免费在线观看av| 国产女精品视频网站免费| 911精品产国品一二三产区| 国产午夜精品久久久久久免费视 | 裸模一区二区三区免费| 性做久久久久久免费观看| 精品制服美女丁香|