国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

無卷積骨干網絡:金字塔Transformer,提升目標檢測/分割等任務精度(附源代碼)

人工智能 新聞
在將金字塔結構嵌入到Transformer結構用于生成多尺度特征,并最終用于稠密預測任務。

圖片


論文地址:https://arxiv.org/pdf/2102.12122.pdf

源代碼地址:https://github.com/whai362/PVT

背景

具有自注意力的Transformer引發了自然語言處理領域的革命,最近還激發了Transformer式架構設計的出現,并在眾多計算機視覺任務中取得了具有競爭力的結果。

如下是之前我們分享的基于Transformer的目標檢測新技術!

鏈接:ResNet超強變體:京東AI新開源的計算機視覺模塊!(附源代碼)

圖片

鏈接:利用TRansformer進行端到端的目標檢測及跟蹤(附源代碼)

圖片

鏈接:YOLOS:通過目標檢測重新思考Transformer(附源代碼)

圖片

在今天分享的工作中,研究者設計了一個新穎的Transformer模塊,針對稠密預測任務的主干網絡,利用Transformer架構設計進行了一次創新性的探索,將特征金字塔結構與Transformer進行了一次融合,使其可以更好的輸出多尺度特征,進而更方便與其他下游任務相結合。

前言

盡管卷積神經網絡 (CNN) 在計算機視覺方面取得了巨大成功,但今天分享的這項工作研究了一種更簡單、無卷積的主干網絡,可用于許多密集預測任務。

圖片

目標檢測

圖片

語義分割

圖片

實例分割

與最近提出的專為圖像分類設計的Vision Transformer(ViT)不同,研究者引入了Pyramid Vision Transformer(PVT),它克服了將Transformer移植到各種密集預測任務的困難。與當前的技術狀態相比,PVT 有幾個優點:

  1. 與通常產生低分辨率輸出并導致高計算和內存成本的ViT不同,PVT不僅可以在圖像的密集分區上進行訓練以獲得對密集預測很重要的高輸出分辨率,而且還使用漸進式收縮金字塔以減少大型特征圖的計算
  2. PVT繼承了CNN和Transformer的優點,使其成為各種視覺任務的統一主干,無需卷積,可以直接替代CNN主干
  3. 通過大量實驗驗證了PVT,表明它提高了許多下游任務的性能,包括對象檢測、實例和語義分割

例如,在參數數量相當的情況下,PVT+RetinaNet在COCO數據集上實現了40.4 AP,超過ResNet50+RetinNet(36.3 AP)4.1個絕對AP(見下圖)。研究者希望PVT可以作為像素級預測的替代和有用的主干,并促進未來的研究。

圖片

基礎回顧

CNN Backbones

CNN是視覺識別中深度神經網絡的主力軍。標準CNN最初是在【Gradient-based learning applied to document recognition】中區分手寫數字。該模型包含具有特定感受野的卷積核捕捉有利的視覺環境。為了提供平移等方差,卷積核的權重在整個圖像空間中共享。最近,隨著計算資源的快速發展(例如,GPU),堆疊卷積塊成功在大規模圖像分類數據集上訓練(例如,ImageNet)已經成為可能。例如,GoogLeNet證明了包含多個內核路徑的卷積算子可以實現非常有競爭力的性能。

圖片

multi-path convolutional block的有效性在Inception系列、ResNeXt、DPN、MixNet和SKNet中得到了進一步驗證。此外,ResNet將跳過連接引入到卷積塊中,從而可以創建/訓練非常深的網絡并在計算機視覺領域獲得令人印象深刻的結果。DenseNet引入了一個密集連接的拓撲,它將每個卷積塊連接到所有先前的塊。更多最新進展可以在最近的論文中找到。

圖片

新框架

圖片

該框架旨在將金字塔結構嵌入到Transformer結構用于生成多尺度特征,并最終用于稠密預測任務。上圖給出了所提出的PVT架構示意圖,類似與CNN主干結構,PVT同樣包含四個階段用于生成不同尺度的特征,所有階段具有相類似的結構:Patch Embedding+Transformer Encoder。

在第一個階段,給定尺寸為H*W*3的輸入圖像,按照如下流程進行處理:

  • 首先,將其劃分為HW/4^2的塊,每個塊的大小為4*4*3;
  • 然后,將展開后的塊送入到線性投影,得到尺寸為HW/4^2 * C1的嵌入塊;
  • 其次,將前述嵌入塊與位置嵌入信息送入到Transformer的Encoder,其輸出將為reshap為H/4 * W/4 * C1。

采用類似的方式,以前一階段的輸出作為輸入即可得到特征F2,F3和F4。基于特征金字塔F1、F2、F3、F4,所提方案可以輕易與大部分下游任務(如圖像分類、目標檢測、語義分割)進行集成。

Feature Pyramid for Transforme

不同于CNN采用stride卷積獲得多尺度特征,PVT通過塊嵌入按照progressive shrinking策略控制特征的尺度。

圖片

假設第i階段的塊尺寸為Pi,在每個階段的開始,將輸入特征均勻的拆分為Hi-1Wi-1/Pi個塊,然后每個塊展開并投影到Ci維度的嵌入信息,經過線性投影后,嵌入塊的尺寸可以視作Hi-1/Pi * Wi-1/Pi * Ci。通過這種方式就可以靈活的調整每個階段的特征尺寸,使其可以針對Transformer構建特征金字塔。

Transformer Encoder

對于Transformer  encoder的第i階段,它具有Li個encoder層,每個encoder層由注意力層與MLP構成。由于所提方法需要處理高分辨率特征,所以提出了一種SRA(spatial-reduction attention)用于替換傳統的MHA(multi-head-attention)。

類似于MHA,SRA同樣從輸入端接收到了Q、K、V作為輸入,并輸出精煉后特征。SRA與MHA的區別在于:SRA會降低K和V的空間尺度,見下圖。

圖片

圖片

Detailed settings of PVT series

實驗

圖片

ImageNet數據集上的性能對比,結果見上表。從中可以看到:

  • 相比CNN,在同等參數量與計算約束下,PVT-Small達到20.2%的誤差率,優于ResNet50的21.5%;
  • 相比其他Transformer(如ViT、DeiT),所提PVT以更少的計算量取得了相當的性能。

圖片

圖片

在語義分割中的性能對比,見上表。可以看到:不同參數配置下,PVT均可取得優于ResNet與ResNeXt的性能。這側面說明:相比CNN,受益于全局注意力機制,PVT可以提取更好的特征用于語義分割。

圖片

圖片

責任編輯:張燕妮 來源: 計算機視覺研究院
相關推薦

2024-06-26 10:16:41

2018-10-11 15:05:56

測試軟件自動化

2025-01-16 12:30:00

2017-08-02 00:12:50

CVPR 2017論文FPN網絡

2017-07-26 10:32:51

計算機視覺卷積神經網絡FPN

2025-06-05 02:15:00

Mamba視覺網絡

2025-03-10 08:47:00

模型AI訓練

2020-04-27 13:45:08

數據流沙Filecoin

2021-01-25 06:37:06

Css前端CSS 特效

2024-06-13 11:53:40

2024-07-02 10:04:09

2024-06-05 09:26:50

2021-10-13 17:28:33

AI 數據人工智能

2021-07-08 15:39:50

機器學習人工智能計算

2018-01-26 08:54:29

存儲SSDHDD

2022-12-13 15:41:41

測試軟件開發

2021-07-14 07:30:51

網絡建設互聯網骨干網絡

2009-11-04 10:51:19

程序員職業規劃

2013-03-14 09:46:05

移動創業諾基亞NEIC大師論道

2021-10-25 22:57:29

模型人工智能計算
點贊
收藏

51CTO技術棧公眾號

国产日韩欧美大片| 一区二区三区不卡在线视频 | 中文字幕中文字幕在线中文字幕三区| 国产精品一二二区| 国产一区二区三区四区五区加勒比| 狼人精品一区二区三区在线| 神马国产精品影院av| 忘忧草在线日韩www影院| 日韩三级视频在线观看| 欧美性videos| 色88888久久久久久影院野外| 超碰在线首页| 亚洲精品欧美激情| 热久久精品国产| 成人丝袜视频网| 日日摸日日碰夜夜爽无码| 国产成人综合在线播放| 综合视频在线观看| 毛片av一区二区| 亚洲欧洲一区二区| 三级欧美在线一区| 亚洲免费久久| 国产一本一道久久香蕉| www.国产亚洲| 91蝌蚪porny成人天涯| 男人女人黄一级| 国产精品美女久久福利网站| 亚洲性图一区二区| 亚洲精品免费播放| 尤物网站在线| 欧美日韩国产片| 色呦呦在线视频| 成人3d漫画免费无遮挡软件| 青青草国产成人99久久| 久久亚洲一区二区| 色男人天堂综合再现| 三上悠亚在线一区二区| 中文字幕av在线一区二区三区| 福利在线一区二区三区| 亚洲欧洲国产日韩| 在线的色视频| 欧美一级久久久| 欧美成人影院| 欧美第一页在线| av中文一区| 久久精品日韩精品| 国产成人精品三级麻豆| 国产天堂在线播放| 亚洲mv大片欧洲mv大片精品| 午夜视频在线| 色爱av美腿丝袜综合粉嫩av| 特黄特色欧美大片| 黄色99视频| 午夜亚洲伦理| 草草视频在线| yiren22综合网成人| 国产午夜亚洲精品午夜鲁丝片| 久久久久久久免费视频| 99久久婷婷国产综合精品电影| 在线观看免费视频高清游戏推荐| 亚洲一区二区在线观看视频| 天天在线视频色| 亚洲男人天堂2024| 伊人精品久久| a级国产乱理论片在线观看99| 日韩av网站免费在线| 日韩av综合在线观看| 亚洲va韩国va欧美va| 四虎影院观看视频在线观看 | 国产福利精品导航| 欧美性大战久久久久xxx | 又色又爽又高潮免费视频国产| 亚洲午夜在线电影| 天堂8中文在线| 久久久免费高清电视剧观看| 亚洲午夜视频| 日本精品久久久久中文字幕| 色狠狠一区二区三区香蕉| 欧美电影网站| 国产日韩综合一区二区性色av| 日本成人在线一区| 99爱视频在线观看| 亚洲电影在线看| 精品久久久久久久| 免费国产成人看片在线| 欧美日韩午夜剧场| 国产精品久久久久久吹潮| dy888夜精品国产专区| 91视频免费观看| av男人的天堂在线| 久久99国产综合精品女同| 亚洲一区中文| 影音先锋另类| 久久成人18免费网站| 男人的天堂亚洲| 在线成人动漫| 欧美成人免费网| 蜜臀av性久久久久蜜臀aⅴ四虎| 秋霞在线观看av| 色偷偷av一区二区三区乱| 国产精品久久久一区二区| 成人网18免费软件大全| 亚洲日韩第一页| 国产精品日本| 天堂аⅴ在线最新版在线| 久久夜色精品亚洲噜噜国产mv| 黄色成人在线网站| 一级毛片免费看| 久久久久在线观看| 国产福利电影一区二区三区| 在线观看的网站你懂的| 亚洲综合最新在线| 亚洲欧洲av另类| 99只有精品| 亚洲一区二区三区涩| 欧美吻胸吃奶大尺度电影 | 久久综合色影院| 极品少妇xxxx精品少妇| 一本色道亚洲精品aⅴ| 国产在线观看91一区二区三区 | 国产精品99久久久久久久女警| 蜜桃视频在线观看www社区| 在线视频亚洲自拍| 制服丝袜亚洲播放| 伊人久久大香线蕉综合网站| 日韩欧美电影在线| 中文字幕在线一区| 国产精品igao视频网网址不卡日韩| 日韩欧美三级在线| 综合久久99| 伊大人久久香线焦宗合一75大| 午夜精品在线视频| 一二三四社区在线视频6| 欧洲永久精品大片ww免费漫画| 国产精品美女久久久久高潮| av成人综合| 999www成人| 青草热久免费精品视频 | 久久久久久亚洲综合影院红桃| 韩日精品一区| av网站大全免费| 久久天天躁狠狠躁夜夜躁| 成人小视频在线| 成人国产精品久久| 99热com| 国产成人福利网站| 欧美日韩国产丝袜另类| 国内久久精品| 免费黄网站在线播放| 日本一区二区不卡高清更新| 精品香蕉一区二区三区| 成人激情视频网站| 超碰在线成人| 佐山爱痴汉视频一区二区三区| 国产午夜精品在线| 亚洲精品丝袜日韩| 激情婷婷综合网| 激情五月五月婷婷| 中文字幕不卡av| 激情伊人五月天久久综合| 国产精品一区hongkong| 公共露出暴露狂另类av| 欧美日本高清视频| 狠狠色狠狠色综合日日五| 奶水喷射视频一区| 久久亚洲国产精品尤物| av在线一区不卡| 99久久精品一区二区成人| 欧美精品资源| 视频黄页在线| 男插女免费视频| 国产精品免费观看高清| 日韩在线国产精品| 精品国产乱码久久久久久久| 色婷婷精品久久二区二区蜜臂av| 91香蕉视频污在线| 岛国av一区二区三区| 伦xxxx在线| 污片视频在线免费观看| 日韩中文字幕在线免费| 成人精品久久一区二区三区| 亚洲国产高清高潮精品美女| 一二三区精品视频| 免费成人av资源网| 欧美私人啪啪vps| 清纯唯美亚洲综合一区| 国产精品视频在线观看| 亚洲欧美一区二区三区国产精品 | 国产精品vip| 超碰成人免费| 捆绑调教美女网站视频一区| 国语自产精品视频在线看抢先版结局 | www.av亚洲| 日韩精选在线| 快射av在线播放一区| 奇米精品一区二区三区| 亚洲a中文字幕| 一区二区三区天堂av| 精品久久久中文| 国产精品性做久久久久久|