国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Swin Transformer遇DCN,可變形注意力Transformer模型優于多數ViT

人工智能 算法
本文中,來自清華大學、AWS AI 和北京智源人工智能研究院的研究者提出了一種新型可變形自注意力模塊,其中以數據相關的方式選擇自注意力中鍵值對的位置,使得自注意力模塊能夠專注于相關區域,并捕獲更多信息特征。

Transformer 近來在各種視覺任務上表現出卓越的性能,感受野賦予 Transformer 比 CNN 更強的表征能力。然而,簡單地擴大感受野會引起一些問題。一方面,使用密集注意力(例如 ViT)會導致過多的內存和計算成本,并且特征可能會受到超出興趣區域的無關部分的影響;另一方面,PVT 或 Swin Transformer 中采用的稀疏注意力與數據無關,可能會限制對遠程(long range)關系建模的能力。

為了緩解這些問題,清華大學、AWS AI 和北京智源人工智能研究院的研究者提出了一種新型可變形自注意力模塊,其中以數據相關的方式選擇自注意力中鍵值對的位置。這種靈活的方案使自注意力模塊能夠專注于相關區域并捕獲更多信息特征。

在此基礎上,該研究提出了可變形注意力 Transformer(Deformable Attention Transformer,DAT),一種具有可變形注意力的通用主干網絡模型,適用于圖像分類和密集預測任務。該研究通過大量基準測試實驗證明了該模型的性能提升。

論文地址:https://arxiv.org/abs/2201.00520v1

可變形注意力 Transformer

現有的分層視覺 Transformer,特別是 PVT 和 Swin Transformer 試圖解決過多注意力的挑戰。前者的下采樣技術會導致嚴重的信息損失,而后者的 Swin 注意力導致感受野的增長要慢得多,這限制了對大型物體進行建模的潛力。因此,需要依賴于數據的稀疏注意力來靈活地對相關特征進行建模,從而導致首先在 DCN [9] 中提出可變形機制。

然而,在 Transformer 模型中實現 DCN 是一個不簡單的問題。在 DCN 中,特征圖上的每個元素單獨學習其偏移量,其中 H ×W ×C 特征圖上的 3 × 3 可變形卷積具有 9 HWC 的空間復雜度。如果在注意力模塊中直接應用相同的機制,空間復雜度將急劇上升到 N_qN_kC,其中 N_q、N_k 是查詢和鍵的數量,通常與特征圖大小 HW 具有相同的比例,帶來近似于雙二次的復雜度。

盡管 Deformable DETR [54] 已經設法通過在每個尺度上設置較少數量的 N_k = 4 的鍵來減少這種開銷,并且可以很好地作為檢測頭,但由于不可接受的信息丟失(參見附錄中的詳細比較),在骨干網絡中關注如此少的鍵效果不佳。與此同時,[3,52] 中的觀察表明,不同的查詢在視覺注意力模型中具有相似的注意力圖。因此,該研究選擇了一個更簡單的解決方案,為每個查詢共享移位鍵和值,以實現有效的權衡。

模型架構

該研究在 Transformer(等式 (4))中的可變形注意力替換了 vanilla MHSA,并將其與 MLP(等式 (5))相結合,以構建一個可變形的視覺 transformer 塊。在網絡架構方面, DAT 與 [7, 26, 31, 36] 共享類似的金字塔結構,廣泛適用于需要多尺度特征圖的各種視覺任務。如下圖 3 所示,形狀為 H × W × 3 的輸入圖像首先被步長為 4 的 4 × 4 非重疊卷積嵌入,然后一個歸一化層獲得

補丁嵌入。

為了構建分層特征金字塔,主干包括 4 個階段,步幅逐漸增加。在兩個連續的階段之間,有一個步長為 2 的非重疊 2×2 卷積,對特征圖進行下采樣,將空間大小減半并將特征維度加倍。

在分類任務中,該研究首先對最后階段輸出的特征圖進行歸一化,然后采用具有池化特征的線性分類器來預測對數;在對象檢測、實例分割和語義分割任務中,DAT 在集成視覺模型中扮演主干的角色,以提取多尺度特征。該研究為每個階段的特征添加一個歸一化層,然后將它們輸入到以下模塊中,例如對象檢測中的 FPN [23] 或語義分割中的解碼器。

實驗

該研究在 3 個數據集上進行了實驗,以驗證提出的 DAT 的有效性。該研究展示了在 ImageNet-1K [10] 分類、COCO 目標檢測和 ADE20K 語義分割任務上的結果。此外,該研究提供了消融研究和可視化結果,以進一步展示該方法的有效性。

ImageNet-1K 分類

ImageNet-1K [10] 數據集有 128 萬張用于訓練的圖像和 5 萬張用于驗證的圖像。研究者在訓練分割上訓練 DAT 的三個變體,并報告驗證分割上的 Top-1 準確度,并與其他 Vision Transformer 模型進行比較。

該研究在下表 2 中給出了有 300 個訓練 epoch 的結果。與其他 SOTA 視覺 Transformer 模型相比, DAT 在具有相似計算復雜性的情況下在 Top-1 精度上實現了顯著提高。DAT 在所有三個尺度上都優于 Swin Transformer [26]、PVT [36]、DPT [7] 和 DeiT [33]。沒有在 Transformer 塊 [13, 14, 35] 中插入卷積,或在補丁嵌入 [6, 11, 45] 中使用重疊卷積,DAT 比 Swin Transformer [26] 實現了 +0.7、+0.7 和 +0.5 的增益。在 384 × 384 分辨率下進行微調時,該模型繼續比 Swin Transformer 性能好 0.3。

COCO 目標檢測

COCO 目標檢測和實例分割數據集有 118K 的訓練圖像和 5K 的驗證圖像。該研究使用 DAT 作為 RetinaNet [24]、Mask R-CNN [17] 和 Cascade Mask R-CNN [2] 框架中的主干,以評估該方法的有效性。該研究在 ImageNet-1K 數據集上對該模型進行 300 個 epoch 的預訓練,并遵循 Swin Transformer [26] 中類似的訓練策略來公平地比較該方法。該研究在 1x 和 3x 訓練計劃中報告在 RetinaNet 模型上的 DAT。如下表 3 所示,在微型和小型模型中,DAT 的性能優于 Swin Transformer 1.1 和 1.2 mAP。

當在兩階段檢測器(例如 Mask R-CNN、Cascade Mask R-CNN)中實現時,DAT 模型在不同尺寸的 Swin Transformer 模型上實現了一致的改進,如下表 4 所示。

下表 5 給出了在驗證集上各種方法的 mIoU 分數。

消融實驗

為了驗證 DAT 模型中關鍵組件設計的有效性, 該研究進行了消融實驗,報告了基于 DAT-T 的 ImageNet-1K 分類結果。對于幾何信息開發,該研究首先評估了所提可變形偏移和可變形相對位置嵌入的有效性,如下表 6 所示。

對于不同階段的可變形注意力,該研究用不同階段的可變形注意力替換了 Swin Transfomer [26] 的移位窗口注意力。如下表 7 所示,僅替換最后階段的注意力提高了 0.1,替換最后兩個階段導致性能增益為 0.7(達到 82.0 的整體準確度)。然而,在早期階段用更多可變形注意力替換會略微降低準確性。

可視化

該研究在 DAT 中可視化學習變形位置的示例,以驗證該方法的有效性。如下圖 4 所示,采樣點描繪在對象檢測框和實例分割掩碼的頂部,從中可以看到這些點已轉移到目標對象。

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2024-07-01 12:17:54

2024-12-17 14:39:16

2024-02-19 00:12:00

模型數據

2024-10-31 10:00:39

注意力機制核心組件

2023-07-29 13:26:51

模型AI

2024-12-04 09:25:00

2023-11-24 12:36:00

模型訓練

2023-07-25 13:57:28

模型AI

2024-11-21 16:06:02

2023-06-12 09:57:22

AIChatGPT

2024-11-04 08:45:00

2025-07-08 09:00:00

2024-10-09 15:30:00

2024-08-13 13:30:00

2025-06-17 09:05:00

2024-10-09 16:07:02

AI 架構

2025-04-07 07:47:00

模型訓練AI

2025-04-29 09:05:00

2024-12-04 15:55:21

2025-06-09 08:52:00

點贊
收藏

51CTO技術棧公眾號

久久久久99精品国产片| 欧美在线激情视频| 四虎4hu新地址入口2023| 久久国产麻豆精品| 欧洲亚洲一区| 亚洲综合电影一区二区三区| 成人天堂噜噜噜| 日韩免费特黄一二三区| 性色av一区二区三区免费| 91国内外精品自在线播放| 精品成a人在线观看| 成人免费网址| 日韩视频免费直播| av免费在线观看网址| 欧美人体做爰大胆视频| 午夜影院在线免费观看| 精品国产31久久久久久| 香蕉影院在线| 欧美午夜电影网| www免费网站在线观看| 欧美日韩aaaaa| 色婷婷av在线| 精品调教chinesegay| 色香欲www7777综合网| 一本色道久久综合狠狠躁篇的优点| aa级大片免费在线观看| 精品无人区乱码1区2区3区在线| 国产污视频在线播放| 亚洲欧美一区二区激情| 伦一区二区三区中文字幕v亚洲| 久久黄色av网站| 精品女人视频| 国产在线观看精品| 亚洲高清自拍| 99re99热| 国产女人18毛片水真多成人如厕| 91网址在线播放| 亚洲国产日韩在线一区模特| 色视频在线观看| 91精品国产欧美一区二区18| 国产高潮在线| 欧美激情第99页| 成人在线免费视频观看| 99www免费人成精品| 香蕉久久夜色精品国产| 老汉色影院首页| 国产精品妹子av| 99青草视频在线播放视| 日韩成人小视频| 卡通动漫精品一区二区三区| 99理论电影网| 国产成人午夜99999| 91制片厂毛片| 欧美丝袜自拍制服另类| 三级成人在线| 国产精品直播网红| 九九视频精品免费| 成人拍拍拍在线观看| 欧美色中文字幕| 日日夜夜一区| y111111国产精品久久婷婷| 狠狠狠色丁香婷婷综合激情| 羞羞小视频视频| 在线综合视频播放| 国产黄色精品| 91在线|亚洲| 国产精品一二三在| 青娱在线视频| 亚洲色图15p| 国产精品成久久久久| 超碰97免费观看| 亚洲欧美另类久久久精品2019| xvideos国产在线视频| 久久青草福利网站| 亚洲精选国产| www.99色.com| 日韩www在线| 婷婷伊人综合| 99草草国产熟女视频在线| 欧美视频在线不卡| 亚洲三级av| 日韩国产欧美一区| 亚洲人成精品久久久久久| xxx.xxx欧美| 国产精品成人品| 国产又粗又猛又爽又黄91精品| 在线观看黄网| 欧美激情视频一区二区三区不卡| 亚洲精品极品| 国产黄色免费电影| 中文字幕欧美国内| 亚洲专区欧美专区| 在线欧美成人| 欧美丰满片xxx777| 久久精品国产精品亚洲综合| 色婷婷综合缴情免费观看| 中文字幕欧美在线| 日韩高清国产一区在线| 日韩精品系列| 精品中文字幕在线2019| 丝袜国产日韩另类美女| 中文字幕中文字幕在线中文字幕三区 | 亚洲h色精品| 人妻丰满熟妇av无码区app| 欧美一区二区三区成人| 日韩电影在线视频| 国产九九在线观看| 日韩一区av在线| 老司机精品视频在线| 1区2区3区在线观看| 国产欧美精品一区二区三区介绍| 久久亚区不卡日本| 欧美jizz18| 欧美一级欧美一级| 亚洲美女av在线播放| 男男视频亚洲欧美| 成人在线免费看片| 精品无码久久久久久久动漫| 欧美日韩国产一区二区| 久操精品在线| 国产videos| 91精品国产自产91精品| 国产亚洲视频系列| 国产精品巨作av| 日日噜噜噜噜久久久精品毛片| 色999日韩欧美国产| 国产成人精品午夜视频免费| 欧美黑人疯狂性受xxxxx野外| 一区二区三区电影| 亚洲美女喷白浆| 国产成人av电影在线观看| 成人片免费看| 欧美大片在线播放| 久久精品91久久香蕉加勒比 | 国产清纯白嫩初高生在线观看91 | 亚洲精品观看| 欧美精品成人网| 久久99精品国产99久久6尤物| 2021中文字幕一区亚洲| 日本肉肉一区| 97国产精东麻豆人妻电影| 免费91在线视频| 亚洲欧美国产77777| 久久神马影院| 国产丝袜在线| 日本一区二区免费高清视频| 在线观看欧美日韩| 国产精品国产馆在线真实露脸| 女人丝袜激情亚洲| 免费在线黄色网址| 欧美一区二区三区在线播放 | 成人v精品蜜桃久久一区| 欧美aaa大片视频一二区| 2021狠狠干| zzjj国产精品一区二区| 久久久www免费人成精品| 成人av动漫| 在线成人福利| 日本一区二区精品| 中文字幕精品网| 亚洲欧美日本韩国| 精品成人国产| 国产网站在线| 黄色影院一级片| 欧洲日本亚洲国产区| 在线观看成人免费视频| 免费成人你懂的| 亚洲一区二区三区免费| 高清av影院| 国内外成人免费视频| 亚洲精品视频在线播放| 久久久久99精品国产片| 波多野结衣一区| 亚洲小说区图片| 精品99在线视频| 国产一区深夜福利| 亚洲国产日韩欧美在线99| 久久久国际精品| 亚洲欧美文学| 91精品xxx在线观看| 一个人看的免费视频色| 亚洲国产成人不卡| 欧美影院久久久| 精品久久久三级丝袜| 国产欧美一区二区精品久导航| 91精品啪在线观看国产81旧版| free性护士videos欧美| 四虎av网址| 中文字幕日韩一区二区三区 | 4438五月综合| 欧美高清成人| 国产精品12345| 成人网在线免费看| 在线精品91av| 欧美亚洲国产怡红院影院| www久久久久| 日日噜噜夜夜狠狠视频欧美人| 欧美wwwwww| 欧美片第一页| 九九在线视频|