国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

微軟亞研提出TinyMIM,用知識蒸餾改進小型ViT

人工智能 新聞
在這篇工作中我們提出了 TinyMIM,其在保持 ViT 結構不變并且不修改結構引入其他歸納偏置(inductive bias)的基礎上、用蒸餾的方法遷移大模型上的知識到小模型。

一、研究動機

掩碼建模(MIM, MAE)被證明是非常有效的自監督訓練方法。然而,如圖 1 所示,MIM 對于更大的模型效果相對更好。當模型很小的時候(比如 ViT-T 5M 參數,這樣的模型對于現實世界非常重要),MIM 甚至可能一定程度上降低模型的效果。比如用 MAE 訓練的 ViT-L 比普通監督訓練的模型在 ImageNet 上的分類效果提升 3.3%,但是用 MAE 訓練的 ViT-T 比普通監督訓練的模型在 ImageNet 上的分類效果降低了 0.6%。

在這篇工作中我們提出了 TinyMIM,其在保持 ViT 結構不變并且不修改結構引入其他歸納偏置(inductive bias)的基礎上、用蒸餾的方法遷移大模型上的知識到小模型。

圖片


  • 論文地址:https://arxiv.org/pdf/2301.01296.pdf
  • 代碼地址:https://github.com/OliverRensu/TinyMIM

我們系統性的研究了蒸餾目標、數據增強、正則化、輔助損失函數等對于蒸餾的影響。在嚴格的只用 ImageNet-1K 作為訓練數據的情況下(包括 Teacher model 也只用 ImageNet-1K 訓練)和 ViT-B 作為模型,我們的方法實現了當前最好的性能。如圖所示:

圖片


把我們的方法(TinyMIM)和基于掩碼重建的方法 MAE,以及監督式學習的方法從頭開始訓練的 DeiT 作比較。MAE 在模型比較大的時候有顯著的性能提升,但是在模型比較小的時候提升幅度有限甚至會傷害模型的最終效果。我們的方法 TinyMIM 在不同模型的大小上都有大幅提升。

我們的貢獻如下:

1. 蒸餾的目標(Distillation targets):1)蒸餾 token 之間的關系比單獨蒸餾 class token 或者特征圖(feature map)更有效;2)用中間層作為蒸餾的目標更有效。

2. 數據增強和模型正則化(Data and network regularization):1)用帶掩碼的圖片效果更差;2)學生模型需要一點 drop path,但是 teacher 模型不需要。

3. 輔助損失函數(auxiliary losses):MIM 作為輔助損失函數沒有意義。

4. 宏觀蒸餾策略(Macro distillation strategy):我們發現序列化的蒸餾(ViT-B -> ViT-S -> ViT-T)效果最好。

二、方法

我們系統性的調研了蒸餾的目標,輸入的圖片,蒸餾目標模塊。

2.1 影響蒸餾效果的因素

1)特征:

a. 中間 block 特征和輸出特征

圖片

當 i=L 時,指的是 Transformer 輸出層的特征。當 i< L 時,指的是 Transformer 中間層的特征。

b. 注意力(Attention)特征和前饋層(FFN)層特征

圖片

Transformer 每一個 block 有 Attention 層和 FFN 層,蒸餾不同的層會帶來不同的影響。

c.QKV 特征

圖片

在 Attention 層內會有 Q,K,V 特征,這些特征用于計算注意力機制,我們也調研了直接蒸餾這些特征。

2)關系

圖片

Q,K,V 用于計算注意力圖,這些特征之間的關系也可以作為知識蒸餾的目標。

3)輸入:是否帶掩碼

傳統的知識蒸餾是直接輸入完整的圖片。我們的方法為了探索蒸餾掩碼建模模型,所以我們也探索了帶掩碼的圖片是否適合作為知識蒸餾時候的輸入。

2.2 知識蒸餾方法對比

1)Class Token 蒸餾:

最簡單的方法就是類似 DeiT 直接蒸餾 MAE 預訓練模型的 class token:

圖片

其中圖片指學生模型的 class token,而 圖片指老師模型的 class token。

2)特征蒸餾:我們直接參考了 feature distillation [1] 作為對比

圖片

圖片

3)關系蒸餾:我們提出了也是本文默認的蒸餾策略

圖片

三、實驗

3.1 主要實驗結果

我們的方法在 ImageNet-1K 上預訓練,而且教師模型也是在 ImageNet-1K 預訓練。然后我們將我們預訓練的模型在下游任務(分類、語義分割)上進行了微調。模型表現如圖:

圖片

我們的方法顯著超過之前基于 MAE 的方法,尤其是小模型。具體來講,對于超小的模型 ViT-T,我們的方法實現了 75.8% 的分類準確性,相比 MAE 基線模型實現了 4.2 的提升。對于小模型 ViT-S,我們實現了 83.0% 的分類準確性,比之前最好的方法提升了 1.4。對于 Base 尺寸的模型,我們的方法分別超過 MAE 基線模型和以前最好的模型 CAE 4.1 和 2.0。

同時我們也測試了模型的魯棒性,如圖所示:

圖片

TinyMIM-B 對比 MAE-B,在 ImageNet-A 和 ImageNet-R 分別提升了 + 6.4 和 +4.6。

3.2 消融實驗

1)蒸餾不同關系

圖片

同時蒸餾 QK,VV 關系而且在計算關系的時候有 Softmax 實現了最好的效果。

2)不同的蒸餾策略

圖片

TinyMIM 這種蒸餾關系的方法實現了比 MAE 基線模型,class token 蒸餾,特征圖蒸餾都更好的效果,在各種尺寸的模型上都是如此。

3)蒸餾中間層

圖片

我們發現蒸餾第十八層實現了最好的效果。

四、結論

在本文中,我們提出了 TinyMIM,它是第一個成功地使小模型受益于掩碼重建建模(MIM)預訓練的模型。我們沒有采用掩碼重建作為任務,而是通過以知識蒸餾的方式訓練小模型模擬大模型的關系來預訓練小模型。TinyMIM 的成功可以歸功于對可能影響 TinyMIM 預訓練的各種因素的全面研究,包括蒸餾目標、蒸餾輸入和中間層。通過大量的實驗,我們得出結論,關系蒸餾優于特征蒸餾和類標記蒸餾等。憑借其簡單性和強大的性能,我們希望我們的方法能夠為未來的研究提供堅實的基礎。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-10-31 11:19:09

微軟語音翻譯手語翻譯

2023-06-20 09:27:09

微軟研究

2021-10-13 17:53:14

AI 數據人工智能

2022-04-08 14:40:59

框架訓練模型

2013-11-07 09:14:01

微軟大數據

2025-11-04 08:44:00

AI模型推理

2025-03-10 08:20:00

微軟AI模型

2024-08-23 09:20:00

AI語言模型

2025-02-17 09:30:00

AI訓練模型

2023-04-03 09:56:22

模型系統

2012-08-16 13:19:33

OpenFlowSDN

2022-12-19 15:16:46

機器學習模型

2025-02-27 10:41:53

2024-08-09 12:48:35

2012-06-12 10:23:57

微軟操作系統

2025-12-02 06:00:00

2024-03-28 12:52:00

AI模型

2021-03-01 10:01:22

開發技能編碼

2012-04-10 14:25:09

惠普

2013-10-17 09:21:15

張亞勤云圖微軟
點贊
收藏

51CTO技術棧公眾號

国产精品秘入口| av高清久久久| 精品视频久久久久久久| h七七www色午夜日本| 成人午夜伦理影院| 正在播放一区| 丝袜脚交一区二区| 粉嫩精品一区二区三区在线观看| 色婷婷综合久久久久久| 久久亚洲精品国产亚洲老地址| 神马午夜在线视频| 精品久久99ma| 国产精品91久久久| 欧美男gay| 国产精品国产三级国产aⅴ浪潮| 狼人精品一区二区三区在线| 97婷婷涩涩精品一区| 激情亚洲另类图片区小说区| 91精品国产91久久久久| 日韩成人动漫在线观看| 国产精品高潮呻吟视频| 欧美军人男男激情gay| 国产精品一区av| 视频在线国产| 亚洲色图一区二区三区| 特黄aaaaaaaaa毛片免费视频| 亚洲精品视频免费看| 在线成人福利| 91精品综合久久久久久| 天堂√8在线中文| 少妇高潮久久77777| 视频二区欧美毛片免费观看| 九九久久久久久久久激情| 久久美女福利视频| 成人高清视频在线观看| 91淫黄看大片| 午夜欧美2019年伦理| 成人福利在线| 日韩av在线导航| 我要色综合中文字幕| 国产综合久久久久久| 日韩午夜电影| 日本男女交配视频| 国产精品久久久久久久久久免费看| 国产在线导航| 日韩三级免费观看| 国产精品视频500部| 国产主播一区二区| 欧美日韩激情视频在线观看| 亚洲综合丝袜美腿| av电影高清在线观看| 日韩性xxxx爱| 视频在线不卡免费观看| 亚洲mv在线看| 亚洲三级理论片| a天堂中文在线官网在线| 色噜噜狠狠色综合网图区| 欧美日韩在线播放视频| 国产精品成人一区二区艾草| 激情视频在线观看免费| 国产一区二区三区在线视频| 九九综合九九| 在线视频不卡国产| 一区二区三区四区视频精品免费| 久久bbxx| 国外色69视频在线观看| 久久亚洲综合| 激情小说激情视频| 欧美大片拔萝卜| 亚洲精品中字| 亚洲激情自拍视频| 99thz桃花论族在线播放| 午夜精品视频网站| 日本成人中文字幕在线视频| 久久婷婷国产91天堂综合精品| 色婷婷综合久久久久中文一区二区| 激情黄产视频在线免费观看| 国产精品aaa| 粉嫩av一区二区三区在线播放| 日本在线视频1区| 欧美成人一二三| 午夜在线a亚洲v天堂网2018| 在线观看欧美日韩| 加勒比久久综合| 欧美国产视频一区| 欧美三级视频在线观看| 日韩精品一区二区三区中文| 日韩精品福利视频| 亚洲午夜在线观看视频在线| 国产a亚洲精品| 狠狠色狠狠色综合人人| 亚洲欧美日韩中文播放| 成人午夜在线| 乱一区二区三区在线播放| 日韩免费精品| 亚洲一区二区中文| 久久网站最新地址| а√天堂8资源在线| 99在线首页视频| 亚洲天堂a在线| 亚洲男男av| 先锋影音男人资源| 91精品国产综合久久精品app | 91av在线免费观看视频| 三级理论午夜在线观看| 欧美成aaa人片在线观看蜜臀| 日韩成人一级片| 国产女人在线观看| 国产精品亚洲欧美导航| 国产精品久久久久久久久动漫| 成人在线黄色| 日韩精品一区二区三区四区五区| 日韩欧美在线视频| 深爱激情久久| 三上悠亚在线资源| 理论片在线不卡免费观看| 国产91高潮流白浆在线麻豆| 麻豆亚洲一区| 一区av在线播放| 精品一区免费| 男人的天堂网av| 国产精品xxx视频| 亚洲三级电影网站| 丝袜美腿综合| 午夜影院观看视频免费| 国产成人精品综合| 性做久久久久久免费观看| 欧美激情电影| 可以在线观看的av网站| 91九色视频导航| 欧美午夜激情视频| 日韩一区二区三区久久| 九九热这里只有在线精品视| 久久先锋影音av| 成人福利一区| 国产精品午夜久久久久久| 国产不卡av在线| 午夜精品久久久久久久99水蜜桃 | 久久.com| 国产精品r级在线| 精品日韩美女的视频高清| 天天干天天玩天天操| 性亚洲最疯狂xxxx高清| 亚洲影视资源网| 午夜精品偷拍| 欧美性爽视频| 激情五月婷婷六月| 欧美激情18p| 亚洲老司机在线| 欧美日韩国产色综合一二三四| 日本三级视频在线观看| 欧美日韩综合精品| 亚洲精品一区中文| 久久九九99视频| 伊人精品一区| 欧美成熟毛茸茸| 亚洲综合偷拍欧美一区色| 成人久久久久| 成人片在线看| 无码专区aaaaaa免费视频| 668精品在线视频| 色网站国产精品| 美女一区二区视频| 国产一区二区久久久久| 天海翼一区二区三区四区在线观看| 国产亚洲精品自在久久| 亚洲人成人99网站| 亚洲精品自拍动漫在线| 先锋a资源在线看亚洲| 91精品影视| 亚洲人成电影在线播放| 日韩一区在线免费观看| 亚洲精选在线| 成人在线中文| 在线视频手机国产| 中文字幕一区二区中文字幕| 久久全国免费视频| 欧美视频在线一区| www.99精品| 欧美日韩国内| 亚洲免费看片| 精品视频二区| 国产一区二区三区中文| 久久精品亚洲乱码伦伦中文| 国产精品伦理久久久久久| heyzo一区| heyzo在线观看| 日本一区二区三不卡| 国语自产在线不卡| 精品噜噜噜噜久久久久久久久试看| 国产精品午夜免费| 久久久综合网| 九九热线有精品视频99| 亚洲精品福利电影| 三区在线视频| 爆乳熟妇一区二区三区霸乳| 欧美连裤袜在线视频| 国产成人免费91av在线| 久久99精品国产麻豆不卡| 免费一区二区三区在线视频|