国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

斯坦福大學李飛飛團隊新作:孿生掩碼自編碼器SiamMAE,刷榜視覺自監督方法

人工智能 新聞
只需一個簡單操作擴展MAE,即可實現自監督學習新sota!

在計算機視覺領域,想要建立圖像和場景(scene)之間之間的對應關系是一項比較困難的任務,尤其是在存在遮擋、視角改變或是物體外觀發生變化的情況下。

最近,斯坦福大學李飛飛團隊對MAE進行擴展,提出了孿生掩碼自編碼器SiamMAE(Siamese Masked Autoencoders)以學習視頻中的視覺對應關系。

圖片

論文鏈接:https://siam-mae-video.github.io/resources/paper.pdf

先隨機采樣兩個視頻幀,并進行非對稱掩碼操作;然后SiamMAE編碼器網絡對兩個幀進行獨立處理,最后使用交叉注意層組成的解碼器來預測未來幀(future frame)中丟失的圖像塊。

通過對未來幀中的大部分(95%)圖像塊進行掩碼,同時保持過去幀(past frame)圖像不變,SiamMAE促使網絡專注于物體運動,并學習以物體為中心的表征。

圖片

盡管整個網絡的設計概念比較簡單,但通過SiamMAE學習到的特征在視頻物體分割、姿勢關鍵點傳播和語義部分傳播任務上都優于最先進的自監督方法。

SiamMAE在不依賴于數據增強、基于手工跟蹤的前置任務或其他技術來防止表征崩潰的情況下,實現了非常有競爭力的性能。

孿生掩碼自編碼器

研究人員的目標是開發一種自監督的方法來學習對應關系,主要是將掩碼自編碼器(MAE)模型擴展到視頻數據中。

圖片

Patchify

給定具有L幀的視頻剪輯,首先隨機采樣兩個視頻幀,兩幀之間的距離通過從預定的potential frame gaps范圍中選擇一個隨機值來確定。

與原始ViT模型類似,通過將每個幀轉換為一系列不重疊的N×N個patch來拼接視頻幀。

最后,把位置嵌入加到線性投影上,并附加一個[CLS]標記,需要注意的是沒有使用時序位置嵌入。

Masking

像圖像和視頻這樣的自然信號是高度冗余的,分別表現為空間和時空上的冗余。

為了創造一個具有挑戰性的預測性自監督學習任務,MAEs隨機掩碼了75%的圖像patch,視頻數據的掩碼率提升到90%,并且對每幀都使用相同的掩碼率。

這種設計可以使網絡無法利用和學習到時間上的對應關系,避免在對應關系學習基準上達到次優性能。

研究人員認為,不對稱的掩碼可以創造一個更有挑戰性的自監督學習任務,并且可以鼓勵網絡學習時間上的相關性。

所以對于采樣的兩個視頻幀,對第一幀選擇不掩碼,對第二幀選擇掩碼95%,這樣就可以將整個過去幀(entire past frame)作為輸入,網絡只需要將其擴散到未來中的適當位置即可,可以促進網絡對物體運動進行建模并關注物體的邊界。

圖片

為了進一步增加任務的難度,兩個視頻幀之間具有更大的時間間隔,盡管可能會導致對未來的預測變得模糊,并可能產生多種合理的結果,但為第二幀提供少量的patch作為輸入,可以讓網絡的自監督學習變得更困難。

編碼器

研究人員探索了兩種不同的編碼器配置來處理輸入幀。

聯合編碼器(joint encoder)是圖像MAEs在一對視頻幀上的擴展,把兩幀未掩碼的圖像patch串聯起來,然后輸入到標準的ViT編碼器中進行處理。

孿生編碼器(siamese encoder)是用于比較實體的權重共享神經網絡,是對比表征學習方法的一個重要組件,用于對應學習(corresponding learning)時通常需要一些信息瓶頸來防止網絡學習的解決方案,如使用顏色通道dropout來迫使網絡避免依賴顏色來匹配對應關系。

在這篇論文中,研究人員使用孿生編碼器來獨立處理兩幅圖像,使用非對稱掩碼作為信息瓶頸。

解碼器

編碼器的輸出通過線性層進行投影,并加入帶有位置嵌入的[MASK] token,以生成對應于輸入幀的所有token

研究人員探索了三種不同的解碼器配置:

聯合解碼器(joint decoder)在兩幀的token串聯上使用原版Transformer模塊,其主要缺點是對GPU內存的需求大幅增加,特別是在使用較小的patch尺寸時。

交叉自解碼器(cross-self decoder)與原版Transformer模型的編碼-解碼器設計類似,每個解碼器塊由一個交叉注意力層和一個自注意力層組成,來自第二幀的token通過交叉注意力層與第一幀的token進行注意力操作,然后通過自注意力層進行相互融合。

可以注意到,交叉注意力層在功能上類似于自監督對應學習方法中經常使用的affinity矩陣。

交叉解碼器(cross decoder)由交叉注意力層的解碼器塊組成,其中來自第二幀的token與來自第一幀的token進行注意力操作。

最后,解碼器的輸出序列被用來預測掩碼圖像塊中的歸一化像素值,在解碼器的預測和真實值之間使用L2損失。

實驗結果

圖片

視頻物體分割

在多物體分割基準數據集DAVIS 2017上,使用480p分辨率的圖像對模型進行評估。

實驗結果可以發現SiamMAE明顯優于VideoMAE(從39.3%提升到62.0%),研究人員將其歸因于VideoMAE中使用了tube掩碼方案,使得模型無法學習時間上的對應關系。

圖片

與DINO類似,研究人員也發現降低patch的尺寸會帶來明顯的性能提升。

并且文中使用的ViT-S/8(+9.4%)模型優于之前所有的對比學習和自監督的對應學習方法。

圖片

還可以注意到盡管較大的MAE-ST模型(ViT-L/16,304M參數)在隨機掩碼的情況下比VideoMAE表現更好,但其性能仍然落后于SiamMAE相當多。

而且在視頻上訓練的MAE與圖像MAE的表現相似,視頻與圖像的不同之處在于,圖像是(近似)各向同性的,時間維度是特殊的,并不是所有的時空方向都是同等可能的。

因此,對稱地處理空間和時間信息可能是次優的。

視頻部分分割(Video Part Segmentation)

在視頻實例解析(Video Instance Parsing, VIP)基準上對SiamMAE進行評估,該基準包括為20個不同的人體部位傳播語義掩碼。

與評估的其他數據集相比,VIP特別具有挑戰性,因為包括更長的視頻(最長120秒)。

與先前工作類似,使用560×560的圖像和單一背景幀進行評估后,可以發現ViT-S/8模型性能大大超越了DINO (從39.5提升到45.9)。

圖片

SiamMAE從更小的patch尺寸中,比DINO受益更多,實現了+8.6的mIoU評分,比DINO的+3.3 mIoU有所提高。

SiamMAE也優于之前所有的對比學習和自監督的對應關系學習方法。

姿勢追蹤(pose tracking)

在關鍵點傳播的任務上對SiamMAE進行了評估,需要傳播15個關鍵點,并且要求空間上的精確對應關系,使用320×320的圖像和一個單一的背景幀,SiamMAE的性能優于所有其他模型,并且比DINO更受益于較小的patch尺寸(+14.9到+10.9 PCK@0.1)

責任編輯:張燕妮 來源: 新智元
相關推薦

2018-06-28 09:07:58

2024-12-18 14:00:00

模型數據訓練

2025-03-20 14:24:21

2019-03-20 14:02:13

AI 行業 人工智能

2023-12-13 21:50:59

騰訊AI模型

2018-01-22 16:16:28

AI發展新趨勢機器學習

2020-04-07 15:22:56

李飛飛AI人工智能

2022-11-24 15:17:31

人工智能論文

2023-11-10 12:58:00

模型數據

2021-03-18 11:30:15

人工智能AI機器學習

2011-11-17 09:53:18

斯坦福大學iOS應用開發

2020-05-12 16:03:52

李飛飛推特AI

2009-05-07 08:49:11

鮑爾默斯坦福大學巴茨

2023-04-12 15:45:56

人工智能ChatGPT

2022-06-17 14:28:16

算法模型

2020-07-08 16:46:46

人工智能病毒技術

2025-04-10 11:52:55

2022-08-29 14:43:24

斯坦福大學李飛飛AI

2024-05-24 12:52:48

2022-10-13 16:01:38

技術大腦
點贊
收藏

51CTO技術棧公眾號

色影院视频在线| 亚洲欧美日韩在线观看a三区| 狠狠色狠色综合曰曰| 777久久久精品一区二区三区| 视频精品一区二区| 国产日韩亚洲精品| 日韩情爱电影在线观看| 91av在线精品| 欧美片网站免费| 在线播放精品一区二区三区| av网站大全在线| 欧美日韩在线一区二区| 在线一区观看| 亚洲一区在线看| 国产天堂在线观看| 亚洲免费在线观看| 九色视频一区| 亚洲激情中文1区| 日本中文视频| 亚洲午夜一区二区三区| 情趣视频网站在线免费观看| 亚洲自拍偷拍欧美| 在线欧美一级视频| 日韩欧美aaa| lutube成人福利在线观看| 欧美丝袜丝交足nylons| 亚洲成av人影片在线观看| 福利一区视频在线观看| porn亚洲| 日韩福利视频在线观看| 搜成人激情视频| 久久精品国产久精国产思思| 4438全国亚洲精品观看视频| 91精品国产色综合久久不卡98| 日韩三级视频| 亚洲一区中文字幕| 性一交一乱一区二区洋洋av| 日韩久久久久久久| 国产99久久久精品| 日韩欧美精品在线观看视频| 中文字幕一区二区不卡| 蜜桃臀av在线| 欧美日韩在线电影| 乡村艳史在线观看| 日韩视频一区在线| 亚洲欧美日本伦理| 亚洲va国产va天堂va久久| 亚洲网站视频| ijzzijzzij亚洲大全| 久久久精品综合| 中文字幕av高清在线观看| 欧美精品第1页| 午夜欧美巨大性欧美巨大| 欧美国产精品人人做人人爱| 久久福利影院| 制服诱惑一区| 国产精品免费视频观看| 亚洲精品套图| 亚洲精品久久久久中文字幕欢迎你| 欧美中文高清| 国产欧美一区二区三区视频| 久久精品欧洲| jizz大全欧美jizzcom| 欧美日韩一级二级三级| av成人在线观看| 国产欧美精品一区二区| 蜜臀av一级做a爰片久久| 在线观看亚洲色图| 91精品国产一区二区三区| 深夜福利亚洲| 国产免费高清一区| 久久久国产一区二区三区四区小说| 亚洲字幕成人中文在线观看| 亚洲美女精品久久| blacked蜜桃精品一区| 亚洲免费精品视频| 一区二区三区在线视频观看58 | 成年人网站大全| 精品动漫一区二区三区| a级片在线免费观看| 国产精品久久久久久中文字| 国产一区二区在线观看免费| 天堂资源av| 中文字幕国内精品| 在线不卡亚洲| 成人影院一区二区三区| 伊人久久精品视频| 久久精品日韩欧美| 在线观看av影片| 久久香蕉国产线看观看网| 日韩黄色一级片| 中文在线天堂库| 久久久噜噜噜久久久| 国产成人午夜视频| 性欧美ⅴideo另类hd| 成人精品福利视频| 1024亚洲合集| 国产精品欧美一区二区三区不卡| 亚洲电影一二三区| 欧美精品18+| 欧美二区视频| 黄色小视频在线播放| 久久免费精品日本久久中文字幕| 久99久精品视频免费观看| 国产三区四区在线观看| 国产精品成av人在线视午夜片| 99精品国产热久久91蜜凸| 大香伊人中文字幕精品| 国产精品国产精品国产专区蜜臀ah| 国产精品久久久久四虎| 未满十八勿进黄网站一区不卡| 亚洲一区二区高清视频| 91麻豆精品国产91久久久久久久久 | 成人高清视频观看www| 国产欧美中文在线| 精品福利在线| 午夜在线视频免费观看| 91精品国产色综合久久不卡电影| 亚洲国产一成人久久精品| 国内av免费| 日韩av男人的天堂| 亚洲天堂精品视频| 极品束缚调教一区二区网站| 一本久道中文无码字幕av| 日韩在线资源网| 99久久精品免费| 91成人在线网站| 久久久久久久中文| 色婷婷av一区二区三区在线观看| 国产99久久久国产精品免费看 | 欧美私人情侣网站| 不卡av电影院| 国产清纯美女被跳蛋高潮一区二区久久w| 日本欧美在线| 国产日韩成人内射视频 | 亚洲欧美另类综合偷拍| 国产一区二区三区四区五区| 最新在线地址| 国产91一区二区三区| 91麻豆精品国产91久久久久久| 久久国产福利| 91制片在线观看| 成人区一区二区| 欧美夫妻性生活xx| 亚洲永久精品大片| 狠狠色丁香久久综合频道| 超碰porn在线| 黄色一级大片免费| 久久久久久免费精品| 亚洲精品成a人| 午夜精品国产| 2021中文字幕在线| 91精品91久久久中77777老牛| 91精品国产99久久久久久| 亚洲成a人片在线不卡一二三区| 在线成人www免费观看视频| 大桥未久在线播放| 日本黄色三级大片| 国产精品久久久久久中文字| 欧美区在线观看| 粉嫩aⅴ一区二区三区四区五区 | 亚洲色图美腿丝袜| 91香蕉视频mp4| 国产伦精品一区二区三区千人斩| 欧美日本韩国一区二区| 在线观看精品视频| 久久久噜噜噜久久久| 欧美综合在线视频| 国产精品综合在线视频| 亚洲人成网站77777在线观看| 在线毛片网站| 亚洲 欧美 日韩 国产综合 在线| 日本成人免费在线| 精品国产青草久久久久福利| 日本一区二区三区在线不卡| 欧美日韩久久| 国产亚洲人成a在线v网站 | 国产乱码精品一区二三赶尸艳谈| 成熟了的熟妇毛茸茸| 成人网在线免费看| 日韩成人xxxx| 亚洲激情网站免费观看| 老牛嫩草一区二区三区日本| 136福利精品导航| 色影视在线观看| 色综合av综合无码综合网站| 亚洲va男人天堂| 日韩性生活视频| 欧美视频精品在线观看| 久久伊人蜜桃av一区二区| 亚洲第一伊人| 午夜视频在线观看精品中文| 日本欧美在线视频免费观看| 一区二区三区 欧美| 日韩午夜视频在线观看| 国产成人综合一区二区三区| 精品一区二区电影| 一本大道久久a久久综合| 久久精品综合网| 美女视频黄频大全不卡视频在线播放|