国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

GPT-4V慘敗!CV大神謝賽寧新作:V*重磅「視覺搜索」算法讓LLM理解力逼近人類

人工智能 新聞
多模態大模型GPT-4V也會「有眼無珠」。UC San Diego紐約大學研究人員提出全新V*視覺搜索算法逆轉LLM弱視覺宿命。

Sam Altman最近在世界經濟論壇上發言,稱達到人類級別的AI很快就會降臨。

但是,正如LeCun一直以來所言,如今的AI連貓狗都不如。現在看來的確如此。

圖片

GPT-4V、LLaVA等多模態模型圖像理解力足以讓人驚嘆。但是,它們并非真的能夠做的面面俱到。

CV大神謝賽寧稱有一個問題讓自己徹夜難眠——

不論分辨率或場景復雜程度如何,凍結的視覺編碼器通常只能「提取一次」全局圖像token。

舉個栗子,一張雜亂的桌面上放了一個「星巴克」陶瓷杯,而且logo圖案僅漏出一半的情況下。

對此,GPT-4V卻無法正確識別出來,還產生了幻覺。

圖片

再比如,圖片中小孩的鞋子是什么顏色這樣直觀的問題。

圖片

GPT-4V給出了「白色」的答案。

圖片

為了解決這個LLM圖像理解的隱疾,「視覺搜索」這一關鍵方法能夠為大模型提供視覺信息。

對此,來自UC San Diego和紐約大學的研究人員提出了V*——引導視覺搜索作為多模態LLM的核心機制。

圖片

論文地址:https://arxiv.org/pdf/2312.14135.pdf

具體來說,研究人員將VQA LLM與視覺搜索模型相結合。

借助大模型的世界知識,V*對視覺目標進行多輪引導搜索。它能夠提取局部特征,并將其添加到工作記憶中,然后,VQA LLM利用搜索到的數據生成最終反應。

圖片

有網友表示, V*模型和論文,在我看來意義重大。

就比如,GPT-4V無法解決的「谷歌機器人驗證」,V*就可以直接找到遺漏的最后一個交通燈。

圖片

圖片

「視覺搜索」神助攻

實現「人類智能」的標志之一,便是能夠處理和整合多感官信息,從而完成復雜的任務。

在我們涉及視覺信息的認知推理過程中,「視覺搜索」無處不在,即在雜亂的桌子上尋找鑰匙,或在人群中尋找朋友。

此外,對于需要多個推理步驟的復雜任務來說,「視覺搜索」也是一個不可或缺的步驟。

受人類能力的啟發,研究人員提出了SEAL(Show、SEArch和TelL),這是一種通用元架構,用于將LLM引導的視覺搜索機制集成到MLLM中,以解決模型的視覺限制。

圖片

再如上,GPT-4V識圖失敗的栗子,SEAL便可輕松完成。

一堆毛絨玩具中,一個猩猩抱著什么樂器?

GPT-4V:薩克斯

SEAL:吉他

圖片

繁華的都市中,一位男子手中提了一打礦泉水的瓶子是什么logo?

GPT-4V:看不清

SEAL:依云

圖片

還有行李箱上的小掛件是哪家公司的?

GPT-4V:Rubbermaid Commercial

SEAL:英特爾

圖片

在一個更直觀的中,籃球運動員的球衣數字是幾號?

GPT-4V:10

SEAL:8

類似的例子還是有很多,看得出不論是簡單的,還是復雜的視圖中,GPT-4V全軍覆沒。

那么,SEAL框架是由何構成的?

SEAL框架+V*視覺搜索算

具體來說,SEAL框架由「VQA LLM」和「視覺搜索模型」兩部分組成。

典型的MLLM模型可能會由于視覺編碼器的信息不足,而拒絕回答或瞎猜(即幻覺)。

與之不同,SEAL中的VQA LLM可以明確地查明缺失的視覺細節,從而為以下對象創建目標對象重點。

然后,利用豐富的世界知識和語言模型的常識,視覺搜索組件定位這些已識別的元素,并將它們添加到視覺工作記憶(VWM)中。

VWM中的這些附加視覺數據,使VQA語言模型能夠提供更準確、更明智的響應。

左側部分代表VQA LLM,它利用視覺工作記憶中的所有數據來回答問題。右側展示了V*視覺搜索算法流程

值得一提的是,SEAL的適應性使其能夠與各種MLLM基礎模型配合使用。

在論文的例子中,研究人員使用LLaVA作為視覺搜索模型中的VQA LLM和MLLM。

借助這種新的視覺搜索功能,MLLM能夠更好地處理,在高分辨率圖像中進行準確視覺基礎的情況。

人類的視覺搜索過程受自上而下的特征引導和上下文場景引導,因此作者設計了一種名為V*引導視覺搜索算法,其視覺搜索模型也遵循類似的原則。

對于人類來說,這種引導主要來自于他們對物理世界的知識和經驗。

因此,這一視覺搜索模型是建立在另一個MLLM的基礎上的,它涵蓋了關于世界的大量常識性知識,并能根據這些知識有效推理出目標在場景中的可能位置。

實驗評估

現有的MLLM基準主要側重于,提供跨各種任務類別的綜合評估,并且沒有充分挑戰上述當前范式的具體局限性。

為了彌補這一差距并評估全新框架,作者引入了V–Bench,這是一種新的專用VQA基準,專注于高分辨率圖像的視覺基礎。

V-Bench是一個以視覺為中心的基準測試,要求多模態模型準確地提供特定的視覺信息,而這些信息很容易被缺乏視覺搜索功能的標準靜態視覺編碼器所忽視。

在圖像和視頻等豐富而復雜的視覺內容日益占據主導地位的世界中,MLLM能夠積極關注關鍵視覺信息以完成復雜的推理任務至關重要。

該基準旨在強調這一基本機制的重要性,并指導MLLM的進化,以反映人類認知固有的多模態處理和推理能力。

圖片

如下是,V–Bench上不同搜索策略的評估結果。

圖片

在具體消融實驗中,使用了V*算法的Vicuna-7B的模型表現更優。

最后,視覺搜索幾十年來一直是cogsci/視覺科學的核心問題。有趣的是,與人眼注視相比,LLM引導V*可以達到與人類視覺搜索相當的效率!

LLM引導視覺搜索的過程如下。

圖片

作者介紹

Penghao Wu

Penghao Wu目前是加州大學圣迭戈分校計算機科學專業的碩士研究生。他于2018年在上海交通大學獲得電氣與計算機工程學士學位。從2023年6月開始,他便成為紐約大學研究實習生,導師是謝賽寧。

Saining Xie(謝賽寧)

謝賽寧目前是紐約大學計算機科學助理教授。據個人主頁介紹,他本科畢業于上海交通大學,18年獲加州大學圣迭戈分校CS博士學位。

畢業后,便在Facebook AI Research(FAIR)擔任研究科學家。

他還曾與何愷明大神共同提出了用于圖像分類的簡單、高度模塊化的網絡結構ResNeXt,這篇論文發表在了CVPR 2017上。

圖片

責任編輯:張燕妮 來源: 新智元
相關推薦

2024-06-27 13:10:21

2023-10-19 09:32:45

自動駕駛技術

2024-02-06 09:00:00

GPT-4VLLaVA大型語言

2025-04-14 09:38:00

2023-11-04 12:23:39

GPT-4AI

2023-10-23 12:28:18

AI訓練

2025-04-03 11:11:50

2023-12-03 08:43:55

機器人模型

2024-01-03 12:56:39

2023-12-29 09:55:03

視覺模型

2025-01-13 08:23:07

LLMMHAMLP

2025-08-15 14:53:43

2024-01-18 13:39:00

AI訓練

2024-04-07 13:39:55

2024-12-23 07:15:00

多模態大模型MLLM人工智能

2024-03-05 09:16:32

AI模型GPT-4

2021-07-19 14:37:04

AI 數據人工智能

2025-07-04 08:52:00

3D圖像生成AI

2023-12-04 16:58:27

2024-03-11 12:20:40

AI模型
點贊
收藏

51CTO技術棧公眾號

狠狠综合久久av一区二区蜜桃| 免费成人在线电影| 亚洲伊人春色| 五月综合激情日本mⅴ| 亚洲欧美在线网| 色老太综合网| 欧美国产一区二区| 国产精品久久久久久久久久免费| 天堂中文字幕——hd| 国产精品av一区二区| 亚洲精品电影久久久| 亚洲爆乳无码专区| 日韩在线a电影| 亚洲男人天堂九九视频| 在线免费观看黄| 疯狂欧美牲乱大交777| 日本粉色视频在线观看| 在线亚洲成人| 久久九九视频| 久久中文欧美| 你真棒插曲来救救我在线观看| 久久久综合网| 亚洲精品国产一区| 精品一区二区三区免费毛片爱 | 欧美丰满少妇xxxxx| 丁香花在线影院| 精品国偷自产国产一区| 黄色在线观看视频网站| 午夜国产精品一区| 黄色影院在线看| 伊人av综合网| 欧美一级做一级爱a做片性| 久热精品视频在线免费观看| 羞羞网站在线看| 这里只有精品视频在线| 精品久久电影| 久久精精品视频| 久久久久久久久99精品| 永久免费网站在线| 色中色综合影院手机版在线观看| 日韩电影免费网址| 鲁一鲁一鲁一鲁一澡| 中文字幕日本欧美| 97精品视频| 亚洲一级免费观看| 亚洲人成电影网站| 亚洲一卡久久| 日本午夜在线视频| 视频直播国产精品| 欧美综合自拍| 91色视频在线观看| 久久亚洲欧洲| 美女被人操视频在线观看| 亚洲午夜精品久久久久久久久久久久 | 中文字幕在线影院| 亚洲欧美国产精品久久久久久久 | 国产精品成人播放| 不卡的av中国片| 天堂av最新在线| 97色在线观看免费视频| 捆绑紧缚一区二区三区视频| 黑人与亚洲人色ⅹvideos| 午夜精品一区二区三区在线 | 日韩视频在线播放| 国产精品成人一区二区网站软件| 国产xxx69麻豆国语对白| 亚洲国产合集| 国产精品午夜视频| 日韩美脚连裤袜丝袜在线| 日韩av手机在线看| 日本久久成人网| 国产精品盗摄久久久| 国产精品正在播放| 成人在线观看亚洲| 久久国产主播精品| 欧美色视频在线观看| 日本在线观看不卡视频| av在线免费观看网站| 性欧美xxxx| 精品日韩视频在线观看| 最新亚洲视频| 欧美成人免费电影| 国产一区二区三区黄| 日韩欧美国产小视频| 国产韩国精品一区二区三区| 成人亚洲精品777777大片| 日韩一区二区中文| gogogo影视剧免费观看在线观看| 91理论片午午论夜理片久久| 91黄色免费观看| 爽爽淫人综合网网站| 欧美xx视频| 夜色资源站国产www在线视频 | 欧美一级裸体视频| 国产91色在线| 欧美精品日日鲁夜夜添| 99视频一区二区三区| 伊人春色之综合网| 久久uomeier| 日韩三级电影网站| 日韩免费在线看| 精品无人区乱码1区2区3区在线| 菠萝蜜视频在线观看一区| 99久久夜色精品国产亚洲96| 国内精彩免费自拍视频在线观看网址| 国产精品视频一区二区三区经| 国产亚洲精品综合一区91| 午夜精品福利一区二区三区av| 国产91综合一区在线观看| 欧美激情99| 日韩伦理三区| 成人综合影院| 九色在线视频观看| 日韩一区二区欧美| 欧美一区二区精美| 亚洲成人激情综合网| 国产精品免费视频观看| 免费在线播放第一区高清av| 欧美精品尤物在线观看| 午夜影院一区| 丝袜美女在线观看| 欧美日夜夜逼| 亚洲精品视频导航| 欧美在线观看黄| 午夜精品一区二区在线观看的| 精品国精品自拍自在线| 欧美视频在线播放| 午夜精品爽啪视频| 亚洲资源中文字幕| 亚洲一区二区三区三| 亚洲黄色性网站| 亚洲一区影音先锋| 精品久久久久久国产91| 亚洲欧美日韩成人高清在线一区| 亚洲一区一卡| 精品国产乱码久久| 日本va欧美va瓶| 亚洲欧美成人综合| 国产99精品一区| 成人精品电影| 亚洲精品韩国| 亚洲久色影视| 久久国内精品自在自线400部| 女生裸体视频一区二区三区| 精品国产亚洲日本| 人人草在线视频| www欧美在线观看| 人人爱人人干婷婷丁香亚洲| 天堂av资源在线观看| 国产在线黄色| av片在线观看免费| 涩涩视频在线播放| av在线女优影院| rebdb初裸写真在线观看| 伊人国产精品| 欧美日韩有码| 经典三级在线一区| 99精品视频一区二区三区| 欧美视频国产精品| 欧美交a欧美精品喷水| 一本综合精品| 色综合久久中文字幕| 久久久久国产成人精品亚洲午夜| 国产精品日韩精品欧美在线| 欧美天天综合| 成人精品国产福利| 欧美一区二区三区啪啪| 91av在线免费观看视频| 天天做天天爱天天高潮| 蜜桃视频在线观看网站| 日韩伦理一区二区三区| 99久久免费视频.com| 亚洲欧美国产精品专区久久| 日本在线观看不卡| 欧美韩日亚洲| 蜜臀久久久久久久| 日韩禁在线播放| 99热久久这里只有精品| 激情久久99| 国产精品―色哟哟| 国产精品国产三级国产aⅴ9色| 天天综合天天操| 国产精品白丝一区二区三区| 中文字幕中文乱码欧美一区二区| 97高清免费视频| 国产导航在线| 国产精品嫩草99av在线| 91精品国产欧美日韩| 国产传媒一区| 黄色在线免费网站| 一本一本久久| 伊人伊成久久人综合网小说| 97成人在线观看视频| 九七电影院97理论片久久tvb| 91丝袜呻吟高潮美腿白嫩在线观看| 欧美超级免费视 在线| 在线激情视频| 日韩av一区二区三区四区| 国产一区二区三区在线看| 污污网站免费观看|