国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

揭秘AI幻覺:GPT-4V存在視覺編碼漏洞,清華聯合NUS提出LLaVA-UHD

人工智能 新聞
近期很多工作發現 GPT-4V 在很多基本能力上卻意外的出現短板。例如,在微軟一篇長達 166 頁的技術報告《The Dawn of LMMs:Preliminary Explorations with GPT-4V (ision)》中,作者發現,對于一個不太復雜的圖像中的蘋果數量,GPT-4V 竟然怎么數也數不對。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.sunluscious.com.cn/aigc/

GPT-4V 的推出引爆了多模態大模型的研究。GPT-4V 在包括多模態問答、推理、交互在內的多個領域都展現了出色的能力,成為如今最領先的多模態大模型。

然而,近期很多工作發現 GPT-4V 在很多基本能力上卻意外的出現短板。例如,在微軟一篇長達 166 頁的技術報告《The Dawn of LMMs:Preliminary Explorations with GPT-4V (ision)》中,作者發現,對于一個不太復雜的圖像中的蘋果數量,GPT-4V 竟然怎么數也數不對。

圖片

然而,學術界和工業界尚不清楚導致這些問題的底層原因。

這個問題在清華大學、新加坡國立大學和中國科學院大學的一篇題為《LLaVA-UHD: an LMM Perceiving Any Aspect Ratio and High-Resolution Images》的論文中得到了解釋。

圖片

  • 論文鏈接:https://arxiv.org/pdf/2403.11703.pdf
  • 項目鏈接:github.com/thunlp/LLaVA-UHD

其原因在于 GPT-4V 很可能存在:視覺編碼漏洞。

該工作對當前最強的商業大模型 GPT-4V 和最受歡迎的開源模型 LLaVA-1.5 進行了實驗,揭示了目前多模態大模型中的視覺編碼漏洞。

漏洞 1:GPT-4V 將圖像進行有重疊的切片后再編碼

作者首先設計了一個實驗來觀察:圖像中的位置如何影響 GPT-4V 的計數回答。

具體來說,作者合成了如圖 1 (a) 所示的圖像,并向 GPT-4V 提問題:“圖像中有多少個圓圈?” 同時,通過改變圓圈的位置而保持提問不變,進一步生成了一系列圖像變體。

圖 1 (b) 中以熱圖的形式顯示了 GPT-4V 對圖像中每個位置平均回答的數量,作者發現了一個與圖像中目標位置高度相關的有趣模式如圖 1(b)所示,具體表現為被 256×256 的正方形網格分割的三種不同模式:

(1) 中央正方形區域展示了最高的響應數量,

(2) 中間邊緣區域的響應數量較低,

(3) 角落區域的響應數量最接近于真實值。

在對 GPT-4V 的響應進行數值區分后,作者發現除了正確答案和接近正確答案的情況,還有兩種異常答案(8 個圓和 16 個圓),這些異常答案呈現了答案數量翻倍或四倍的錯誤模式。結合 OpenAI 公開的信息,這一現象的最可能原因是,當圖像分辨率無法被 512 整除時,GPT-4V 處理圖像的切片之間會出現重疊。如圖 1 (e) 所示,兩個切片之間的重疊區域導致數量翻倍,而四個切片的交叉重疊區域會使得識別出的數量增加至四倍。

圖片

作者設計了另一個實驗來觀察:圖像分辨率如何影響 GPT-4V 的計數回答。

具體來說,作者將圖 2 (a) 中的圖像按比例縮放至連續遞增的分辨率,并詢問 GPT-4V 其中圓圈的個數。

圖片

圖 2 (b) 中展示了 GPT-4V 的回答結果。隨著圖像分辨率的變化,GPT-4V 的回答顯示出顯著的相位變化:(1)在第 1 階段,由于沒有圖像切片,大多數答案是正確的;(2)在第 2 階段,答案 12 在響應中占主導地位,可能是由于每個切片中的圓不完整;(3)第 3 階段顯示了 9、12 和 16 的混合答案。請注意,16 可以很好地解釋圖 1 (e) 中的錯誤模式。

以上兩個實驗結果揭示了 GPT-4V 在處理高分辨率圖像時存在重疊切片,導致錯誤響應,啟發作者需要進一步研究更合理的圖像預處理和編碼方式。

漏洞 2:LLaVA-1.5 進行大范圍的圖像填充(Padding)

LLaVA-1.5 作為出色的開源多模態大模型被學術界廣泛關注。

為了處理具有不同長寬比的圖像,LLaVA-1.5 在將圖像輸入視覺編碼器之前將其填充為正方形。這種編碼方法導致非正方形圖像的計算浪費。例如,將 1:4 圖像填充為正方形后,有效計算量僅為 25%。

更重要的是,LLaVA-1.5 實際上無法確定填充像素是來自圖像預處理還是原始輸入圖像的實際部分。

圖片

為了演示這個問題,作者合成了一系列輸入圖像,如圖 3(右)所示,其中不同長寬比的綠色矩形被灰色(即填充對應的 RGB 值)所包圍。給定輸入圖像,作者提示:“最左 / 最右 / 最上 / 最下區域的顏色是什么?” 從圖 3(左)的結果中,作者觀察到 LLaVA-1.5 忽略了灰色輸入區域(將其視為填充),并置信地回答了中心矩形的顏色。

綜合以上 2 個明顯的視覺編碼漏洞可以知道,多模態模型中的視覺策略必須謹慎設計。常見做法,如填充、形狀扭曲調整和重復切片,可能導致計算資源的浪費、模型能力的喪失,甚至容易受到對抗性攻擊。

于是,作者提出 LLaVA-UHD,該模型可以對 180 萬像素任意長寬比圖像進行編碼,相比于 LLaVA-1.5 在 9 個主流評測基準實現提升,訓練和推理計算開銷相比于 LLaVA-1.5 均有顯著下降。

圖片

LaVA-UHD 包括三個關鍵部分:一種圖像模塊化策略,將原始分辨率的圖像分成更小的可變大小的切片,以便進行高效和可擴展的編碼;一個壓縮模塊,進一步壓縮來自視覺編碼器的圖像 tokens,一個空間裝飾模式,用于為 LLMs 組織片段 tokens。

圖像模塊化策略中主要包含兩個部分:

1. 高分辨率圖像劃分策略(如圖 4 左側)。目標是確定高分辨率圖像的劃分方式,使每個切片的分辨率變化最小。給定圖像分辨率和和在固定分辨率上預訓練的 ViT,首先確定處理圖像所需的切片數。然后將切片數因式分解為和幾種劃分方式。為了選擇最合適的劃分,作者定義一個評分函數來衡量與 ViT 標準預訓練設置的偏差,進而選擇最佳的劃分方法。

2. 任意寬高比切片編碼(如圖 4 右側)。目的是等比例調整圖像以適應預訓練模型的位置嵌入數量。首先將 ViT 的 1D 位置嵌入轉換為 2D 格式,并進行插值以匹配動態切片分辨率,從而獲得自適應圖像尺寸的視覺編碼。實驗表明,此方法在保持 ViT 和位置嵌入參數不變的情況下,通過后期微調即可提升性能。此外,還編碼一張低分辨率概覽圖像,有助于提供全局語義信息,增強模型對圖像的整體理解。

LLaVA-UHD 利用壓縮模塊(Resampler)壓縮每張切片的 tokens,實現比 LLaVA-1.5 在 336×336 分辨率圖像中更低的計算成本來編碼 672×1008 分辨率的圖像。由于圖像切片在不同圖像之間是動態的,因此有必要通過位置修飾符來告知 LLM 圖像切片的相對位置。

圖片

表 1 報告了主要的實驗結果。在性能表現上,LLaVA-UHD 相對于 LLaVA-1.5 取得了顯著的改進。通過簡單地感知原生高分辨率圖像,LLaVA-UHD 在 TextVQA 上實現了 6.4 的準確率提升,在 POPE 上實現了 3.2 的準確率提升。原因在于低分辨率圖像中的模糊內容可能會阻止 LMMs 準確識別具有挑戰性的細粒度目標和 OCR 字符。在計算效率和可拓展性上,LLaVA-UHD 僅使用 94% 的推理計算即支持任意寬高比的 672×1088 分辨率圖像,能夠適應更大分辨率的拓展。

圖片

為了更直觀地展示 LMM 在處理高分辨率圖像方面的能力,在圖 5 中提供了 LLaVA-UHD 和 LLaVA-1.5 的定性結果。可以看到,LLaVA-UHD 可以正確識別課表上的密集內容,小海報上的文字以及手機上的圖標和文字,實現了細粒度的識別和推理。

未來展望

LLaVA-UHD 將圖像分辨率限制在最大 672×1008。但是在未來,考慮到其具有潛力的效率和可擴展性,將探索更高分辨率的圖像以及更具挑戰性的任務,如小目標檢測和分割。此外,目前圖像片段是獨立編碼的,只在 LLMs 中進行交互。計劃通過改進的視覺編碼策略,在圖像片段之間建立高效的連接,實現細粒度全局信息交互。

想了解更多AIGC的內容,請訪問:

51CTO AI.x社區

http://www.sunluscious.com.cn/aigc/

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-01-03 12:56:39

2024-02-06 09:00:00

GPT-4VLLaVA大型語言

2024-06-11 08:16:00

2023-10-17 12:34:04

2023-10-19 09:32:45

自動駕駛技術

2023-12-29 09:55:03

視覺模型

2023-12-12 12:43:19

AI訓練

2023-11-13 07:48:08

AI檢測

2025-09-04 14:25:04

2023-10-10 13:42:56

訓練數據

2023-10-23 12:28:18

AI訓練

2024-06-27 13:10:21

2024-01-04 17:21:08

訓練數據

2024-01-22 06:40:00

模型視覺

2024-11-27 14:00:00

模型訓練

2023-11-05 15:13:38

AI測評

2025-04-17 14:11:10

視覺AI模型

2023-10-31 12:23:17

GPT-4版本VLM

2021-05-25 14:20:20

數據模型系統

2024-12-18 14:50:00

AI訓練數據
點贊
收藏

51CTO技術棧公眾號

亚洲天堂2020| 最新不卡av| 大香伊人中文字幕精品| 中文字幕第一区二区| 国产精品入口免费视频一| 国产在线精彩视频| 亚洲电影一区二区| 日本aa在线观看| 91精品啪在线观看国产81旧版| 亚洲欧美日韩在线高清直播| 最近97中文超碰在线| 91网址在线看| 日韩精品最新在线观看| 日韩电影免费网站| 欧美精品中文字幕一区| 1区2区3区在线视频| 欧美性生交大片免费| 日韩av片网站| 韩国一区二区三区| 韩国精品一区二区三区六区色诱| 欧美极品在线观看| 久久亚洲精品成人| h片在线观看下载| 欧美日韩国产经典色站一区二区三区 | 精品一区电影国产| 蜜桃视频在线观看www社区| 亚洲图片欧美综合| 91福利免费在线| 国产欧美日本一区视频| 黄色a级片免费看| 亚洲麻豆一区| 国产传媒欧美日韩| 91精品国产91久久久久久密臀| 91成人免费观看网站| 国产精品亚洲综合在线观看| 亚洲欧洲在线看| 97se综合| 欧美激情亚洲激情| 超碰97久久国产精品牛牛| 欧美大片第1页| 视频国产精品| 91精品国产自产在线观看永久| 精品国产91久久久久久浪潮蜜月| 97人人做人人爱| 桃色av一区二区| 91久久国产婷婷一区二区| 亚洲欧美视频一区二区| 欧美日韩精品一区二区三区在线观看| 午夜免费在线观看精品视频| aaa国产精品视频| 国内精品国产三级国产a久久| 无码免费一区二区三区免费播放 | 欧美日韩一区二区三区在线免费观看| 在线观看免费黄网站| 国产肉丝袜一区二区| 精品久久久久久中文字幕2017| 久久综合给合久久狠狠狠97色69| 国产av无码专区亚洲精品| 国产清纯美女被跳蛋高潮一区二区久久w | 亚洲欧美一区二区三区久久 | 欧美第十八页| 日本一区免费在线观看| 91一区二区在线观看| 免费高清视频日韩| 欧美美女bb生活片| 国产精品久久免费视频| 97在线中文字幕| 成人白浆超碰人人人人| 最新国产在线| 亚洲欧美成人在线| 成人在线免费视频观看| 特级西西444www大精品视频| 亚洲欧美一区二区三区久本道91| 欧美xxxx黑人又粗又长| 国产999在线观看| 狠狠色狠狠色综合| 五丁香在线视频| 久久精品青青大伊人av| 日韩午夜一区| 美女网站色免费| 欧美精品一区二区三区很污很色的 | 四虎影院观看视频在线观看 | h片在线免费观看| 97人人模人人爽人人喊中文字| 新67194成人永久网站| 杨幂毛片午夜性生毛片| 欧美一区国产二区| 国产乱码精品一区二区三区四区| 一区二区免费在线观看| 午夜视频一区二区| 亚洲成人精品综合在线| 久久国产精品一区二区三区四区| 国产精品天干天干在观线| 免费在线观看的电影网站| 国产精品中文字幕久久久| 成人黄色国产精品网站大全在线免费观看 | 麻豆国产欧美日韩综合精品二区| xxxx影院| 亚洲视频自拍偷拍| 亚洲大片在线| 中文字幕第5页| 俺去了亚洲欧美日韩| 日韩国产欧美一区二区三区| 在线看片线路1| 欧美精品videosex牲欧美| 九色综合国产一区二区三区| 欧美日韩在线中文字幕| 欧美精品video| 国产成人亚洲综合a∨婷婷图片| 无遮挡的视频在线观看| 国产日韩中文字幕在线| 亚洲婷婷综合久久一本伊一区| 少妇精品视频在线观看| 91免费网站视频| 精品久久久久久久一区二区蜜臀| 第四色成人网| 日本女优北野望在线电影| 午夜美女久久久久爽久久| 久久午夜电影网| 久久国产三级| 国产毛片久久久久久国产毛片| 日韩视频在线你懂得| 久久精品国产www456c0m| 男裸体无遮挡网站| 欧美福利视频在线| 99视频有精品| 久久天天久久| 91好吊色国产欧美日韩在线| 国产亚洲欧洲在线| 风间由美性色一区二区三区| 外国成人直播| 人人干视频在线| 另类色图亚洲色图| 久久综合九色综合欧美亚洲| 免费成人高清在线视频| www国产精品内射老熟女| 日韩视频在线免费| 久久久久久久网| 国产伦精品一区二区三区免费优势| 国产情侣av自拍| 欧美激情免费视频| 亚洲人妖av一区二区| 国产亚洲一区| 一本大道香蕉久在线播放29| 91亚洲精品一区| 欧美在线一二三四区| 亚洲一区亚洲| 丰满的护士2在线观看高清| 日韩一区不卡| 永久免费毛片在线播放不卡| www成人在线观看| 97品白浆高清久久久久久| 国产字幕中文| 懂色一区二区三区av片| 日韩欧美国产综合一区 | 国产精品入口日韩视频大尺度| 亚洲一区二区黄色| 中文字幕一区二区av| eeuss影院www在线观看| 色综合影院在线观看| 色悠悠久久久久| 亚洲欧洲成人精品av97| 欧美精品国产一区| 91超碰在线| 97xxxxx| 国产精品久久9| 6080yy午夜一二三区久久| 国内成+人亚洲+欧美+综合在线 | 精品av综合导航| 91亚洲国产成人精品一区二区三 | 在线观看一区视频| 啊啊啊久久久| 国产又大又黄又粗的视频| 国产精品video| 日韩天堂在线观看| 成人美女视频在线看| 偷拍视屏一区| 成年人网站在线| 中文字幕第36页| 国产一区二区高清视频| 亚洲欧洲国产一区| 一区二区三区四区蜜桃| 午夜在线a亚洲v天堂网2018| 亚洲一区二区三区久久久| 日本在线中文电影| 色之综合天天综合色天天棕色| 色综合五月天导航| 欧美丰满少妇xxxxx高潮对白 | 亚洲激情图片一区| 肉色丝袜一区二区| 国产精品国产| 丝袜在线观看| 韩国版免费三体| 伊人av成人| 国产精品盗摄久久久| 日韩第一页在线| 懂色av影视一区二区三区| 波多野结衣视频一区| 91精品久久久久久久久久不卡| 成人国产精品|