国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

精確率提升7.8%!首個多模態開放世界檢測大模型MQ-Det登NeurIPS 2023

人工智能 新聞
MQ-Det在已有基于文本查詢的檢測大模型基礎上,加入了視覺示例查詢功能,同時保留了高泛化性能和細粒度多模態查詢,在ODinW-35基準上實現SOTA性能。

目前的開放世界目標檢測模型大多遵循文本查詢的模式,即利用類別文本描述在目標圖像中查詢潛在目標,但這種方式往往會面臨「廣而不精」的問題。

論文鏈接:https://arxiv.org/abs/2305.18980

代碼地址:https://github.com/YifanXu74/MQ-Det

為此,中科院自動化等機構的研究人員提出了基于多模態查詢的目標檢測MQ-Det,以及首個同時支持文本描述和視覺示例查詢的開放世界檢測大模型。

MQ-Det在已有基于文本查詢的檢測大模型基礎上,加入了視覺示例查詢功能。通過引入即插即用的門控感知結構,以及以視覺為條件的掩碼語言預測訓練機制,使得檢測器在保持高泛化性的同時支持細粒度的多模態查詢,為用戶提供更靈活的選擇來適應不同的場景。

其簡單有效的設計與現有主流的檢測大模型均兼容,適用范圍非常廣泛。

實驗表明,多模態查詢能夠大幅度推動主流檢測大模型的開放世界目標檢測能力,例如在基準檢測數據集LVIS上,無需下游任務模型微調,提升主流檢測大模型GLIP精度約7.8%AP,在13個基準小樣本下游任務上平均提高了6.3% AP。

從文本查詢到多模態查詢

一圖勝千言

隨著圖文預訓練的興起,借助文本的開放語義,目標檢測逐漸步入了開放世界感知的階段。

為此,許多檢測大模型都遵循了文本查詢的模式,即利用類別文本描述在目標圖像中查詢潛在目標。

然而,這種方式往往會面臨「廣而不精」的問題。

圖1 MQ-Det方法架構圖

例如,圖1中的細粒度物體(魚種)檢測,往往很難用有限的文本來描述各種細粒度的魚種;類別歧義,bat既可指蝙蝠又可指拍子。

然而,以上的問題均可通過圖像示例來解決,相比文本,圖像能夠提供目標物體更豐富的特征線索,但同時文本又具備強大的泛化性。

由此,如何能夠有機地結合兩種查詢方式,成為了一個很自然地想法。

獲取多模態查詢能力的難點:如何得到這樣一個具備多模態查詢的模型,存在三個挑戰:

1. 直接用有限的圖像示例進行微調很容易造成災難性遺忘;

2. 從頭訓練一個檢測大模型會具備較好的泛化性但是消耗巨大,例如,單卡訓練GLIP[1]需要利用3000萬數據量訓練480 天。

多模態查詢目標檢測:基于以上考慮,作者提出了一種簡單有效的模型設計和訓練策略——MQ-Det

MQ-Det在已有凍結的文本查詢檢測大模型基礎上插入少量門控感知模塊(GCP)來接收視覺示例的輸入,同時設計了視覺條件掩碼語言預測訓練策略高效地得到高性能多模態查詢的檢測器。

MQ-Det:即插即用的多模態查詢模型架構

門控感知模塊

如圖1所示,作者在已有凍結的文本查詢檢測大模型的文本編碼器端逐層插入了門控感知模塊(GCP),GCP的工作模式可以用下面公式簡潔地表示:

對于第i個類別,輸入視覺示例 v_i,其首先和目標圖像 圖片進行交叉注意力( X-MHA)得到圖片 以增廣其表示能力,而后每個類別文本 t_i 會和對應類別的視覺示例 圖片 進行交叉注意力得到 圖片,之后通過一個門控模塊gate 將原始文本 t_i 和視覺增廣后文本 圖片 融合,得到當前層的輸出圖片

這樣的簡單設計遵循了三點原則:(1)類別可擴展性;(2)語義補全性;(3)抗遺忘性,具體討論可見原文。

MQ-Det高效訓練策略

基于凍結語言查詢檢測器的調制訓練

由于目前文本查詢的預訓練檢測大模型本身就具備較好的泛化性,作者認為,只需要在原先文本特征基礎上用視覺細節進行輕微地調整即可。

在文章中也有具體的實驗論證發現,打開原始預訓練模型參數后進行微調很容易帶來災難性遺忘的問題,反而失去了開放世界檢測的能力。

由此,MQ-Det在凍結文本查詢的預訓練檢測器基礎上,僅調制訓練插入的GCP模塊,就可以高效地將視覺信息插入到現有文本查詢的檢測器中。

在文章中,作者分別將MQ-Det的結構設計和訓練技術應用于目前的SOTA模型GLIP[1]和GroundingDINO[2],來驗證方法的通用性。

以視覺為條件的掩碼語言預測訓練策略

作者還提出了一種視覺為條件的掩碼語言預測訓練策略,來解決凍結預訓練模型帶來的學習惰性的問題。

所謂學習惰性,即指檢測器在訓練過程中傾向于保持原始文本查詢的特征,從而忽視新加入的視覺查詢特征。

為此,MQ-Det在訓練時隨機地用[MASK] token來替代文本token,迫使模型向視覺查詢特征側學習,即:

圖片

這個策略雖然簡單,但是卻十分有效,從實驗結果來看這個策略帶來了顯著的性能提升。

實驗結果

Finetuning-free

相比傳統零樣本(zero-shot)評估僅利用類別文本進行測試,MQ-Det提出了一種更貼近實際的評估策略:finetuning-free

其定義為:在不進行任何下游微調的條件下,用戶可以利用類別文本、圖像示例、或者兩者結合來進行目標檢測。

在finetuning-free的設定下,MQ-Det對每個類別選用了5個視覺示例,同時結合類別文本進行目標檢測,而現有的其他模型不支持視覺查詢,只能用純文本描述進行目標檢測。

下表展示了在LVIS MiniVal和LVIS v1.0上的檢測結果。可以發現,多模態查詢的引入大幅度提升了開放世界目標檢測能力。

表1 各個檢測模型在LVIS基準數據集下的finetuning-free表現

從表1可以看到,MQ-GLIP-L在GLIP-L基礎上提升了超過7%AP,效果十分顯著!

Few-shot評估

表2 各個模型在35個檢測任務ODinW-35以及其13個子集ODinW-13中的表現

作者還進一步在下游35個檢測任務ODinW-35中進行了全面的實驗。由表2可以看到,MQ-Det除了強大的finetuning-free表現,還具備良好的小樣本檢測能力,進一步印證了多模態查詢的潛力。圖2也展示了MQ-Det對于GLIP的顯著提升。

圖片

圖2 數據利用效率對比;橫軸:訓練樣本數量,縱軸:OdinW-13上的平均AP

多模態查詢目標檢測的前景

目標檢測作為一個以實際應用為基礎的研究領域,非常注重算法的落地。

盡管以往的純文本查詢目標檢測模型展現出了良好的泛化性,但是在實際的開放世界檢測中文本很難涵蓋細粒度的信息,而圖像中豐富的信息粒度完美地補全了這一環。

至此我們能夠發現,文本泛而不精,圖像精而不泛,如果能夠有效地結合兩者,即多模態查詢,將會推動開放世界目標檢測進一步向前邁進。

MQ-Det在多模態查詢上邁出了第一步嘗試,其顯著的性能提升也昭示著多模態查詢目標檢測的巨大潛力。

同時,文本描述和視覺示例的引入為用戶提供了更多的選擇,使得目標檢測更加靈活和用戶友好。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-10-23 10:02:00

模型技術

2025-01-08 08:21:16

2025-11-11 08:45:00

2024-01-22 13:59:00

模型訓練

2024-10-14 14:10:00

大模型AI開源

2025-05-07 01:00:00

多模態大模型AI

2025-09-16 09:35:52

2025-08-06 09:10:10

2025-07-04 16:50:07

工具AI模型

2024-03-25 12:30:18

AI訓練開源

2023-12-15 09:51:02

3D檢測

2024-12-30 00:01:00

多模態大模型Python

2022-10-28 15:16:52

檢測數據

2024-12-18 18:57:58

2024-11-13 09:39:13

2024-09-23 08:20:00

模型訓練

2025-07-29 08:40:00

模型AILLM

2025-04-28 12:28:27

點贊
收藏

51CTO技術棧公眾號

国产成人看片| 国产精品久久久久av福利动漫| 久久久国产午夜精品| 亚洲欧美bt| 国产乱国产乱300精品| 成人午夜av电影| 亚洲国产成人午夜在线一区| 18欧美乱大交hd1984| 欧美自拍丝袜亚洲| 日韩一区二区在线观看| 精品视频在线观看日韩| 精品国产拍在线观看| 国产精品成人国产乱一区| 成人免费视频视频在| 免费观看黄色的网站| jizz欧美激情18| 538在线视频| 少妇免费视频| 爱福利视频一区二区| 在线综合视频网站| 久久久亚洲精品视频| 精品毛片乱码1区2区3区| 亚洲电影第三页| 福利视频第一区| 亚洲欧美日韩图片| 青草青草久热精品视频在线网站| 国产原创精品| 黄色动漫网站入口| 草草影院在线观看| crdy在线观看欧美| 国产精品大片免费观看| 99国内精品久久| 欧美精品久久久久久久多人混战| 日韩视频免费中文字幕| 国模精品娜娜一二三区| 岳毛多又紧做起爽| 欧美成人三区| 欧美挤奶吃奶水xxxxx| 日本aⅴ免费视频一区二区三区| 欧美激情一区二区三区蜜桃视频 | 福利网址在线| 国产精品一区二区免费福利视频 | 成人做爰66片免费看网站| 亚洲一级免费观看| 天堂中文av在线资源库| 红桃成人av在线播放| 国产精品 日产精品 欧美精品| 在线一区二区三区四区五区 | 啦啦啦在线视频免费观看高清中文 | 国产午夜一区二区三区| 精品人在线二区三区| 官网99热精品| 国产区精品在线观看| 日韩免费视频播放| 毛片在线网站| 日韩一区精品字幕| 欧美精品久久99久久在免费线 | 裸体大乳女做爰69| 激情网站在线| 免费高清在线观看免费| 超免费在线视频| 日本91福利区| 日韩午夜电影av| 精品国产aⅴ麻豆| 国产高清视频在线| 韩国在线视频一区| 欧美精品丝袜中出| 成人免费视频视频在| 伪装者在线观看完整版免费| 国产中文精品久高清在线不| 国产精品国产精品国产专区不蜜| 欧美日韩第一页| 亚洲黄色小视频在线观看| 欧美日韩一区二区三区在线电影 | 黄页在线播放| 日韩激情一区| 一本大道av伊人久久综合| 国产精品免费一区二区三区观看| 欧美日韩视频精品二区| 性8sex亚洲区入口| 亚洲精品一区二三区不卡| 日本精品www| av在线不卡顿| 欧美肥胖老妇做爰| 制服诱惑一区| 国产成人免费av一区二区午夜| 国产亚洲精品超碰| 国产精品白嫩初高中害羞小美女 | 日本大胆欧美人术艺术动态| 日韩小视频网址| 9191国产视频| 中文幕av一区二区三区佐山爱| 老司机精品视频一区二区三区| 国产精品美女一区二区三区 | 亚洲一区二区日韩| 亚洲影视一区| 粉嫩一区二区三区性色av| 中文字幕欧美区| 一区二区三区中文字幕| 亚洲国产成人高清精品| 夜夜躁日日躁狠狠久久88av| 成人三级在线| 欧洲视频一区二区三区| 欧美精品一区二区三区在线| 99re6热在线精品视频播放速度| 韩国成人免费视频| 欧美码中文字幕在线| 欧美成人一品| 亚洲网址在线| 成人av一区二区三区| 亚洲小视频在线| 美日韩黄色片| 狠狠色伊人亚洲综合成人| 亚州精品天堂中文字幕| aaa在线观看| 亚洲国产人成综合网站| 成人av番号网| 麻豆免费在线| 国产欧美日韩中文久久| 国产日韩一区欧美| 日本在线啊啊| 午夜激情久久久| 成人毛片100部免费看| 久久一区二区中文字幕| 亚洲国产精品va| 橘梨纱av一区二区三区在线观看| 影音国产精品| 亚洲3p在线观看| 成人黄色在线电影| 亚洲欧美日韩中文播放| 日韩一区二区电影在线观看| 警花av一区二区三区| 欧美日韩一区小说| 国产超碰在线播放| 麻豆精品91| 色妞一区二区三区| 北条麻妃在线| 亚洲免费成人av| 日韩人妻无码精品久久久不卡| 亚洲色图欧美| 97精品视频在线| 精品福利在线| 日韩av在线导航| caoporn国产精品免费视频| 国产欧美精品在线观看| 一个色的综合| 在线电影一区二区| 日韩av成人在线| 九九九九九九精品任你躁| 亚洲精品久久久久久久久久久久久| av成人动漫| 欧美国产日产图区| 国内自拍中文字幕| 色女人在线视频| 国产一区二区三区探花 | 欧美喷水视频| 91成人看片片| 久久精品国产精品青草色艺| 性欧美ⅴideo另类hd| 久久久影院官网| 欧美亚洲国产免费| 蜜桃成人365av| 国产精品嫩草影院av蜜臀| 97成人精品区在线播放| 麻豆视频免费在线观看| 亚洲电影中文字幕在线观看| 97av视频在线观看| 99国内精品久久| 男人艹女人在线观看| 中文字幕人成不卡一区| 国产免播放器视频| 色综合久久久久综合| 成人jjav| 日韩欧美高清在线| 91九色美女在线视频| 亚洲激情第一页| 亚洲日本中文| 久久久久久久一| 天天综合网网欲色| 欧美成ee人免费视频| 国产乱人伦精品一区二区在线观看 | 亚洲一区二区久久久久久| 亚洲五月综合| 视频一区二区三区在线观看 | xxxx欧美18另类的高清| 国产成人短视频在线观看| 国产精品我不卡| eeuss影院一区二区三区| 4kfree性满足欧美hd18| 欧美xfplay| 曰本一区二区三区视频| 在线视频精品一区| 亚洲国产日韩综合久久精品| 国产在线自天天| 亚洲三级免费看| 亚洲+变态+欧美+另类+精品| 成人高清视频在线| 一起操在线观看| 国产婷婷成人久久av免费高清| 澳门久久精品|