国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺? 精華

發布于 2025-2-17 09:22
瀏覽
0收藏

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區

本文介紹了多模態大型語言模型(MLLM)的定義、使用挑戰性提示的應用場景,以及正在重塑計算機視覺的頂級模型。

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區

目錄

  1. 什么是多模態大語言模型(MLLM)?
  2. MLLM 在計算機視覺中的應用與案例
  3. 領先的多模態大型語言模型
  4. 未來展望

1. 什么是多模態大型語言模型(MLLM)?

簡單來說,多模態大型語言模型(MLLM)是結合了大型語言模型(LLM)(如 GPT-3 [2] 或 LLaMA-3 [3])的推理能力,同時具備接收、理解并輸出多種模態信息的能力。

示例:圖 1 展示了一個醫療領域的多模態 AI 系統 [4]。它接收兩個輸入:

  1. 一張醫學影像
  2. 一個文本查詢,如:“這張影像中是否存在胸腔積液?”該系統輸出一個關于該查詢的預測答案。


多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區


多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區



在本文中,可能會簡化“多模態大型語言模型”這一術語,直接稱其為“多模態模型”。

1.1 人工智能中的多模態崛起

近年來,人工智能經歷了重大變革,其中Transformer [5] 體系架構的興起極大推動了語言模型的發展 [6]。這一架構由 Google 于 2017 年提出,并對計算機視覺領域產生了深遠影響。


早期的示例包括視覺 Transformer(ViT) [7],它將圖像分割為多個補丁,并將其作為獨立的視覺 token 進行輸入處理。


隨著大型語言模型(LLM)的崛起,一種新的生成式模型,即多模態大型語言模型(MLLM),自然地誕生了。


如前面時間線圖所示,2023 年,大多數科技巨頭都推出了至少一種 MLLM。到了 2024 年,OpenAI 的 GPT-4o 在 5 月發布時成為行業熱點。

1.2 MLLMs vs VLMs vs 基礎模型

一些人認為 MLLMs 其實就是基礎模型(Foundation Models)。例如,Google 的 Vertex AI 將 Claude 3、PaliGemma 和 Gemini 1.5 等多模態大型語言模型歸類為基礎模型。??


另一方面,視覺語言模型(VLMs)[8] 是多模態模型的一個子類別,它們集成了文本和圖像輸入,并生成文本輸出。


MLLMs 和 VLMs 的主要區別在于:

  1. MLLMs 能處理更多模態,而不僅僅是文本和圖像(如 VLMs)。
  2. VLMs 的推理能力較弱,而 MLLMs 具有更強的邏輯推理能力。

1.3 體系架構

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區

如圖 3 所示,MLLM 的架構主要分為三個部分:

  1. 模態編碼器(Modality Encoder):該組件將視覺、音頻等原始數據轉換為緊湊的表示形式。通常使用預訓練編碼器(如 CLIP)進行遷移學習,以適配不同的模態輸入。
  2. LLM 主干(LLM Backbone):語言模型負責生成文本輸出,作為 MLLM 的“核心大腦”。編碼器接收圖像、音頻或視頻輸入并生成特征,由連接器(模態接口)處理后輸入 LLM。
  3. 模態接口(Modality Interface):連接編碼器和 LLM,確保 LLM 能夠理解不同模態的信息,并進行合理的推理和輸出。

2. 多模態模型在計算機視覺中的應用

為了驗證這些模型的能力,使用了 GPU 對三個頂級 MLLMs 進行測試,并使用了具有挑戰性的查詢(不再是貓??和狗??的簡單示例)。


測試的 MLLMs:

  • GPT-4o (OpenAI)
  • LLaVA 7b (開源,基于 LLaMA)
  • Apple Ferret 7b (Apple 開源)

2.1 目標遮擋情況下的物體計數

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區

任務: 計算圖像中出現的安全帽數量,并提供其位置(見圖 4)。

  • GPT-4o提供了詳盡的場景描述,但給出的坐標有誤。
  • LLaVA僅檢測到 3 個安全帽,并且沒有正確識別遮擋部分的安全帽。
  • Apple Ferret成功檢測到 4 個安全帽,包括左側被遮擋的那個!??

2.2 自動駕駛:風險評估與規劃

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區

任務: 從自動駕駛汽車的角度評估風險,并檢測車輛和行人(見圖 5)。

  • LLaVA未能識別前方的大卡車。
  • GPT-4o在文本分析方面表現優異,但檢測出的目標框位置錯誤。
  • Apple Ferret是唯一一個準確檢測出大部分物體并給出正確坐標的模型 ?。

2.3 體育分析:目標檢測與場景理解

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區

任務: 分析足球比賽場景,包括球員計數、球和守門員位置估計,并預測進球可能性(見圖 7)。

結果:

  • 所有模型均未能正確檢測所有球員,并區分不同球隊。
  • 相比之下,YOLOv8 這樣的單模態檢測模型表現更優。

這表明,MLLMs 在一些復雜任務上仍然存在局限性,它們尚未完全取代專門優化的計算機視覺模型。


下一步是否應該對 MLLMs 進行微調???

3. 領先的多模態大型語言模型

多模態大語言模型(MLLMs)如何重塑和變革計算機視覺?-AI.x社區

收藏
回復
舉報
回復
相關推薦
九九热线视频只有这里最精品| 欧美黑人疯狂性受xxxxx野外| 在线综合亚洲| 中文在线资源观看视频网站免费不卡 | 亚洲成人va| 精品福利一区二区| 国产精品视频一二三四区| 成人a'v在线播放| 亚洲欧美国内爽妇网| 青青草在线播放| 中文字幕国产一区| 中国一区二区三区| 亚洲激情另类| 午夜精品免费视频| 91av亚洲| 91精选在线观看| 瑟瑟在线观看| 一区二区三区成人| 久草福利视频在线| 国产一区二区三区四区在线观看| 亚洲aa中文字幕| 婷婷精品在线观看| 久久香蕉国产线看观看av| √天堂8资源中文在线| 色婷婷亚洲精品| 久久久久久77777| 国产日韩av一区| 黄色成人在线看| 国产精品中文字幕日韩精品| 免费国产在线精品一区二区三区| 婷婷激情综合| 国产精品美腿一区在线看| 深夜激情久久| 久久久精品亚洲| 青娱乐极品盛宴一区二区| 亚洲精品二三区| 成人免费观看在线观看| 亚洲丁香婷深爱综合| 欧洲性视频在线播放| 精品欧美久久久| av黄色在线| 欧美三区在线视频| 国产黄在线观看| 狠狠躁夜夜躁人人爽天天天天97| 国产主播色在线| 1区2区3区精品视频| 国产三区在线视频| 国产偷国产偷精品高清尤物| 精品久久久久久久免费人妻| 久久伊人中文字幕| 成人免费淫片在线费观看| 最新国产成人在线观看| 四虎4hu新地址入口2023| 亚洲黄色尤物视频| 水莓100在线视频| 欧美三级日韩三级| 色多多视频在线观看| 欧美日韩亚洲另类| 蜜桃av在线免费观看| 欧美videossexotv100| 污污在线观看| 国产婷婷色综合av蜜臀av| 成人看片网站| 欧美激情2020午夜免费观看| 日本亚洲不卡| 91免费国产网站| 亚洲综合丁香| 超级碰在线观看| 日本一二三不卡| 亚洲成人天堂| 91精品国产色综合久久ai换脸| 色资源二区在线视频| 欧美成年人在线观看| 亚洲精品蜜桃乱晃| 91精品久久久久久久久| 亚洲人成人一区二区三区| 一区视频二区视频| 国产香蕉久久精品综合网| www.aqdy爱情电影网| 色综合中文综合网| av黄色在线| 久久亚洲精品毛片| 91超碰国产精品| 一区二区三区在线观看www| 91免费国产在线观看| 中文在线天堂网| 日韩av在线播放资源| 豆花视频一区二区| 国内精品二区| av成人老司机| 在线免费福利| 亚洲精品在线91| 精品视频亚洲| 欧美一级免费在线观看| 国产精品素人视频| xvideos国产在线视频| 欧美激情免费在线| 性娇小13――14欧美| www日韩在线观看| 欧美精选一区二区| 成人看片黄a免费看视频| 成人综合电影| 成人综合婷婷国产精品久久蜜臀| www成人免费视频| 欧美区在线观看| 福利在线一区| 欧美日韩最好看的视频| 最新高清无码专区| 最新中文字幕在线播放| 国产日韩av在线播放| 国产精品自拍网站| 日本人妖在线| 久久国产精品久久久| 丝袜美腿高跟呻吟高潮一区| 国产天堂av| 色噜噜国产精品视频一区二区| 欧美视频亚洲视频| 国产成人综合美国十次| 日韩精品亚洲精品| 牛牛国产精品| 亚洲综合婷婷久久| 国产一区二区黑人欧美xxxx| 亚洲日本久久| 在线免费黄色毛片| 国内精品模特av私拍在线观看| 激情久久五月天| 国产午夜精品久久久久免费视| 国产精品h片在线播放| 国产精品亚洲成人| 成人在线免费观看| 欧美性做爰毛片| 国产91精品露脸国语对白| www.视频在线.com| 国产精品久久色| 欧美国产一区在线| 成人免费看黄| 人偷久久久久久久偷女厕| 欧美视频一二三| 丝袜久久网站| 国产精品丝袜久久久久久消防器材| 精品精品国产高清a毛片牛牛 | 欧美日韩国产不卡在线看| 亚洲三级电影全部在线观看高清| 欧美日韩五区| 一区二区精品免费视频| 欧美一区二区视频在线观看2020| 亚洲天堂免费| 小草av在线播放| 国产精品久久久久久久久免费看 | 国产一级二级三级精品| 一级日本不卡的影视| 国产亚洲成av人片在线观黄桃| 国产精品入口芒果| 亚洲午夜精品久久久久久久久久久久| 欧美亚洲一区| 黄色精品在线观看| 狠狠综合久久av| 欧美日韩一区高清| 亚洲私人影院| 在线免费观看黄| 精品国产乱码久久久久久丨区2区| 欧美日韩亚洲激情| 国产精品福利在线观看播放| 97国产在线| 国产精品视频最多的网站| 一区二区三区中文字幕电影| 女优一区二区三区| 特黄国产免费播放| 国产欧美欧洲在线观看| 亚洲午夜在线视频| 888久久久| 麻豆视频网站在线观看| 久久久久久99| 精品成人a区在线观看| 经典三级在线一区| 欧美××××黑人××性爽| 野外做受又硬又粗又大视频√| 日韩中文字幕视频| 中文天堂在线一区| 国产一区二区区别| 神马久久精品| 欧美在线3区| 伊人伊成久久人综合网站| 99视频精品在线| 亚洲第一二三区| 成人av毛片| 亚洲黄色成人久久久| 日韩在线视频播放| 亚洲精品水蜜桃| 影音先锋亚洲一区| 在线免费看h| xx欧美撒尿嘘撒尿xx| 亚洲在线一区二区| 日韩成人免费视频| 欧美激情一区在线观看| 一本精品一区二区三区| 涩涩涩视频在线观看| 自拍偷拍精选| 精品国产一区二区三区麻豆小说| 亚洲三级 欧美三级|