国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

美團(tuán)提出基于隱式條件位置編碼,性能優(yōu)于ViT和DeiT

開發(fā) 前端
Transformer 跨界計算機(jī)視覺的熱潮之下,有一個問題需要解決:如何像 CNN 一樣直接處理不同尺寸的輸入?對此,美團(tuán)提出了一種新型隱式條件位置編碼方法,基于該方法的 CPVT 模型性能優(yōu)于 ViT 和 DeiT。

 隨著 Facebook 的 DETR (ECCV 2020)[2] 和谷歌的 ViT (ICLR 2021)[3] 的提出,Transformer 在視覺領(lǐng)域的應(yīng)用開始迅速升溫,成為當(dāng)下視覺研究的第一熱點。但視覺 Transformer 受限于固定長度的位置編碼,不能像 CNN 一樣直接處理不同的輸入尺寸,這在很大程度上限制了視覺 Transformer 的應(yīng)用,因為很多視覺任務(wù),如檢測,需要在測試時動態(tài)改變輸入大小。

一種解決方案是對 ViT 中位置編碼進(jìn)行插值,使其適應(yīng)不同的圖片大小,但這種方案需要重新 fine-tune 模型,否則結(jié)果會變差。

最近,美團(tuán)提出了一種用于視覺 Transformer 的隱式條件位置編碼 CPE [1],放寬了顯式位置編碼給輸入尺寸帶來的限制,使得 Transformer 便于處理不同尺寸的輸入。實驗表明,應(yīng)用了 CPE 的 Transformer 性能優(yōu)于 ViT 和 DeiT。

論文地址:https://arxiv.org/pdf/2102.10882.pdf

項目地址:https://github.com/Meituan-AutoML/CPVT(即將開源)

背景

谷歌的 ViT 方法通常將一幅 224×224 的圖片打散成 196 個 16×16 的圖片塊(patch),依次對其做線性編碼,從而得到一個輸入序列(input sequence),使 Transformer 可以像處理字符序列一樣處理圖片。同時,為了保留各個圖片塊之間的位置信息,加入了和輸入序列編碼維度等長的位置編碼。DeiT [4] 提高了 ViT 的訓(xùn)練效率,不再需要把大數(shù)據(jù)集(如 JFT-300M)作為預(yù)訓(xùn)練的限制,Transformer 可以直接在 ImageNet 上訓(xùn)練。

對于視覺 Transformer,位置編碼不可或缺

在 ViT 和 CPVT 的實驗中,我們可以發(fā)現(xiàn)沒有位置編碼的 Transformer 性能會出現(xiàn)明顯下降。除此之外,在 Table 1 中,可學(xué)習(xí)(learnable)的位置編碼和正余弦(sin-cos)編碼效果接近,2D 的相對編碼(2D RPE)性能較差,但仍然優(yōu)于去掉位置編碼的情形。

美團(tuán)提出基于隱式條件位置編碼,性能優(yōu)于ViT和DeiT

美團(tuán)、阿德萊德大學(xué)提出新型位置編碼方法

位置編碼的設(shè)計要求

顯式的位置編碼限制了輸入尺寸,因此美團(tuán)這項研究考慮使用隱式的根據(jù)輸入而變化的變長編碼方法。此外,它還需要滿足以下要求:

保持很好的性能;

避免排列不變性(permutation equivariance);

易于實現(xiàn)。

基于上述要求,該研究提出了條件編碼生成器 PEG(Positional Encoding Generator),來生成隱式的位置編碼。

生成隱式的條件位置編碼

在 PEG 中,將上一層 Encoder 的 1D 輸出變形成 2D,再使用變換模塊學(xué)習(xí)其位置信息,最后重新變形到 1D 空間,與之前的 1D 輸出相加之后作為下一個 Encoder 的輸入,如 Figure 2 所示。這里的變換單元(Transoformation unit)可以是 Depthwise 卷積、Depthwise Separable 卷積或其他更為復(fù)雜的模塊。

美團(tuán)提出基于隱式條件位置編碼,性能優(yōu)于ViT和DeiT

將 PEG 插入到模型中(如 Figure 1 中添加在第一個 Encoder 后),即可對各個 Encoder 添加位置編碼信息。這種編碼好處在于不需要顯式指定,長度可以依輸入變化而變化,因此被稱為隱式的條件位置編碼。

美團(tuán)提出基于隱式條件位置編碼,性能優(yōu)于ViT和DeiT

實驗

ImageNet 數(shù)據(jù)集

該研究將添加了 PEG 的 Vision Transformer 模型命名為 CPVT(Conditional Position encodings Visual Transformer)。在 ImageNet 數(shù)據(jù)集上,相同量級的 CPVT 模型性能優(yōu)于 ViT 和 DeiT。得益于隱式條件編碼可以根據(jù)輸入動態(tài)調(diào)整的特性,基于 224×224 輸入訓(xùn)練好的模型可以直接處理 384×384 輸入(Table 3 最后一列),無需 fine-tune 就能直接獲得性能提升。相比之下,其他顯式編碼沒有 fine-tune 則會出現(xiàn)性能損失。

美團(tuán)提出基于隱式條件位置編碼,性能優(yōu)于ViT和DeiT

與其他編碼方式的對比

Table 5 給出了 CPVT-Ti 模型在不同編碼策略下的表現(xiàn)。其中在從第 0 個到第 5 個 Encoder 各插入一個 PEG 的性能最優(yōu),Top-1 準(zhǔn)確率達(dá)到 73.4%。CPVT 單獨使用 PEG 或與可學(xué)習(xí)編碼相結(jié)合也優(yōu)于 DeiT-tiny 在各種編碼策略下的表現(xiàn)。

美團(tuán)提出基于隱式條件位置編碼,性能優(yōu)于ViT和DeiT

PEG 在不同位置的作用

ViT 主干由 12 個 Encoder 組成,CPVT 對比了 PEG 位于 -1、0、3、6、10 等處的結(jié)果。實驗表明,PEG 用于第一個 Encoder 之后表現(xiàn)最好 (idx 0)。該研究認(rèn)為,放在第一個 encoder 之后不僅可以提供全局的接受域,也能夠保證模型盡早地利用到位置信息。

美團(tuán)提出基于隱式條件位置編碼,性能優(yōu)于ViT和DeiT

結(jié)論

CPVT 提出的隱式位置編碼是一個即插即用的通用方法。它放寬了對輸入尺寸的限制,因而有望促進(jìn) Vision Transformer 在分割、檢測、超分辨率等任務(wù)中的進(jìn)一步應(yīng)用,提升其性能。這項研究對后續(xù) Vision Transformer 的發(fā)展將產(chǎn)生積極的影響。

 

責(zé)任編輯:張燕妮 來源: 機(jī)器之心Pro
相關(guān)推薦

2024-03-07 12:51:08

模型訓(xùn)練

2025-06-20 09:00:00

智能體訓(xùn)練模型

2017-09-18 01:21:05

美團(tuán)IDC集群銳捷網(wǎng)絡(luò)

2022-02-23 21:24:21

索引SQL字符

2024-06-11 07:38:00

2018-04-04 09:30:23

美團(tuán)點評響應(yīng)式架構(gòu)

2016-11-27 20:43:26

云計算迭代

2015-05-28 09:54:33

美團(tuán)docker容器

2018-08-03 09:42:01

人工智能深度學(xué)習(xí)人臉識別

2018-10-19 14:16:09

Flink數(shù)據(jù)倉庫數(shù)據(jù)系統(tǒng)

2024-09-20 10:02:13

2013-08-20 13:11:58

技術(shù)美團(tuán)

2023-12-27 08:22:34

框架3D檢測

2022-02-08 15:43:08

AITransforme模型

2023-09-01 14:49:09

AI微軟

2010-11-16 15:11:52

Oracle隱式游標(biāo)

2017-06-01 10:52:35

互聯(lián)網(wǎng)

2018-04-23 09:50:54

2022-03-03 16:45:02

美團(tuán)述職反饋

2022-10-21 15:02:36

DeepFake技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號

国产亚洲精品激情久久| 老司机午夜免费福利视频| 午夜影视一区二区三区| 欧美日韩在线一区| 一区二区在线播放视频| 麻豆精品视频在线观看| 成人av网站观看| 91蜜臀精品国产自偷在线| 国产69精品99久久久久久宅男| 免费观看欧美大片| 亚洲国产古装精品网站| 中文字幕免费高清电视剧网站在线观看| 亚洲免费电影在线| 亚洲另类第一页| 国产亚洲欧美色| 浮妇高潮喷白浆视频| 福利电影一区二区三区| 青青草视频国产| 国产91精品免费| 欧美在线一区视频| 91在线视频官网| 黄色片视频在线免费观看| 成人国产精品免费观看动漫| 美女av免费观看| www.在线成人| 国产真实乱子伦| 97久久精品人人做人人爽| 国产av熟女一区二区三区| 国产成人小视频| 国产v片免费观看| 91美女福利视频| 蜜桃免费在线视频| 国产精品美女久久久久久2018 | av成人资源| 欧美剧在线观看| 国产伦乱精品| 国产精品久久久久免费a∨大胸| 成人在线免费观看视频| 亚洲一区二区三区香蕉| 亚洲小说欧美另类婷婷| 久久久久久九九九九| 美国欧美日韩国产在线播放| 日韩精品在线观看av| 国产视频亚洲色图| 黄网站app在线观看大全免费视频| 精品日韩视频在线观看| 麻豆最新免费在线视频| 亚洲欧美日韩区| 亚洲精品在线a| 国产精品视频免费在线| 国产午夜精品一区二区三区欧美| 亚洲精品成人久久久998| 91在线免费播放| 一个人看的免费视频色| 91精品欧美一区二区三区综合在| 日韩和的一区二在线| 国产成人av网| 日本欧美在线观看| 久久久久久久片| 色婷婷激情综合| yw.尤物在线精品视频| 国产精品xxxxx| 日本不卡不码高清免费观看| 亚洲成人福利在线观看| 欧美性色黄大片| 国产精品第一| av色综合网| 91香蕉视频污| 在线日本视频| 久久久久国产视频| 日韩中文字幕一区二区三区| 国产免费黄视频在线观看| 欧美成人欧美edvon| 精品在线观看入口| 经典三级在线视频| 欧美性极品xxxx做受| 欧美久久久网站| 久久精品一二三区| 亚洲欧美一区二区三区极速播放| 成人爽a毛片免费啪啪动漫| 日本中文字幕不卡免费| 美女视频第一区二区三区免费观看网站 | 国产成人精品国内自产拍免费看| 999亚洲国产精| 日本成人中文字幕在线| 欧美精品三级日韩久久| 高清一区二区三区| 久热国产精品视频一区二区三区| 国产女主播一区| 国内小视频在线看| 欧洲s码亚洲m码精品一区| 免播放器亚洲一区| 中文字幕乱在线伦视频乱在线伦视频| 日韩成人激情视频| 国产综合久久| 九色视频网站| 色视频www在线播放国产成人| 亚洲激情自拍| 中文字幕第5页| 久久久91精品国产一区不卡| 奶水喷射视频一区| 亚洲日本高清| 久久久久久久久久av| 国产一区二区看久久| 麻豆视频在线免费观看| 91精品视频在线看| 一区在线中文字幕| 日本午夜免费一区二区| 视频一区二区三区免费观看| 日本乱人伦aⅴ精品| 亚洲精品456| 成人18网站| 欧美人成在线视频| 成人激情文学综合网| av资源在线看片| 国产欧美综合精品一区二区| 亚洲国产乱码最新视频| 天堂资源在线亚洲| 成人免费xx| 久久亚洲精品视频| 国内成人精品2018免费看| 国产1区在线| 国产日韩在线一区二区三区| 亚洲成av人片在线观看无码| 丝袜美腿综合| 四色永久网址| 久久久久久综合网天天| 日本一区二区久久| 91精品国产乱码久久久竹菊| 免费国产成人av| 欧美第一淫aaasss性| av爱爱亚洲一区| 成人在线视频区| 777久久久精品一区二区三区| 亚洲天堂日韩电影| 成人午夜在线免费| 欧洲亚洲精品久久久久| 久久婷婷五月综合色国产香蕉| 久久精品电影一区二区| 国产欧美一区二区三区沐欲| 91久久偷偷做嫩草影院电| 日本 片 成人 在线| 51午夜精品视频| 亚洲成av人影院在线观看网| 亚洲精品国产成人影院| 成人福利在线| 日韩av一区二区三区美女毛片| 精品国产sm最大网站免费看| 狠狠色伊人亚洲综合成人| 欧美三级精品| 欧美日韩在线成人| 欧美一区二区.| 亚州成人在线电影| 在线亚洲自拍| 欧美办公室脚交xxxx| 免费成人在线视频网站| 国语自产偷拍精品视频偷| 亚洲三级小视频| 日韩系列欧美系列| 在线播放麻豆| 国产尤物av一区二区三区| 久久精品视频导航| 亚洲最大色网站| 亚洲每日在线| 性欧美freehd18| 成人观看网站a| 国产精品一码二码三码在线| 国产网站欧美日韩免费精品在线观看 | 日韩成人三级视频| 97热精品视频官网| 国产精品久久9| 自拍偷拍亚洲精品| 欧美日韩视频在线| 一卡二卡欧美日韩| 久久激情中文| 欧美激情无毛| 欧美成人中文| 国产日韩av网站| 国产suv精品一区二区| 欧美三级免费观看| 韩国欧美一区二区| 狠狠一区二区三区| 在线观看a视频| 欧美黄色免费影院| 高清日韩一区| 精品国模在线视频| 欧美色区777第一页| 99久久精品久久久久久清纯| 欧美第一精品| 本网站久久精品| 国产视频精品久久| 日韩av中文字幕第一页| 91黄色精品| 久久国产精品偷| 欧美年轻男男videosbes| 亚洲国产精品av| 日韩精品亚洲一区| japanese国产精品| 日本另类视频| 五月婷婷在线视频|