国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

改進Hinton的Dropout:可以用來減輕欠擬合了

人工智能 新聞
深度學習三巨頭之一 Geoffrey Hinton 在 2012 年提出的 dropout 主要用來解決過擬合問題,但近日的一項工作表明,dropout 能做的事情不止于此。

2012 年,Hinton 等人在其論文《Improving neural networks by preventing co-adaptation of feature detectors》中提出了 dropout。同年,AlexNet 的出現開啟了深度學習的新紀元。AlexNet 使用 dropout 顯著降低了過擬合,并對其在 ILSVRC 2012 競賽中的勝利起到了關鍵作用。可以這么說,如果沒有 dropout,我們目前在深度學習領域看到的進展可能會被推遲數年。

自 dropout 推出以后,它被廣泛用作正則化器,降低神經網絡中的過擬合。dropout 使用概率 p 停用每個神經元,防止不同的特征相互適應。應用 dropout 之后,訓練損失通常增加,而測試誤差減少,從而縮小模型的泛化差距。深度學習的發展不斷引入新的技術和架構,但 dropout 依然存在。它在最新的 AI 成果中繼續發揮作用,比如 AlphaFold 蛋白質預測、DALL-E 2 圖像生成等,展現出了通用性和有效性。

盡管 dropout 持續流行,但多年來其強度(以drop rate p 表示)一直在下降。最初的 dropout 工作中使用了 0.5 的默認drop rate。然而近年來常常采用較低的drop rate,比如 0.1,相關示例可見訓練 BERT 和 ViT。這一趨勢的主要動力是可用訓練數據的爆炸式增長,使得過擬合越來越困難。加之其他因素,我們可能很快會遇到更多欠擬合而非過擬合問題。

近日在一篇論文《Dropout Reduces Underfitting》中,Meta AI、加州大學伯克利分校等機構的研究者展示了如何使用 dropout 來解決欠擬合問題。

論文地址:https://arxiv.org/abs/2303.01500

他們首先通過對梯度范數的有趣觀察來研究 dropout 的訓練動態,然后得出了一個關鍵的實證發現:在訓練初始階段,dropout 降低小批量的梯度方差,并允許模型在更一致的方向上更新。這些方向也更與整個數據集的梯度方向保持一致,具體如下圖 1 所示。

因此,模型可以更有效地優化整個訓練集的訓練損失,而不會受到個別小批量的影響。換句話說,dropout 抵消了隨機梯度下降(SGD)并防止訓練早期采樣小批量的隨機性所造成的過度正則化。

圖片

基于這一發現,研究者提出了 early dropout(即 dropout 僅在訓練早期使用),來幫助欠擬合模型更好地擬合。與無 dropout 和標準 dropout 相比,early dropout 降低了最終的訓練損失。相反,對于已經使用標準 dropout 的模型,研究者建議在早期訓練 epoch 階段移除 dropout 以降低過擬合。他們將這一方法稱為 late dropout,并證明它可以提升大模型的泛化準確率。下圖 2 比較了標準 dropout、early 和 late dropout。

圖片

研究者在圖像分類和下游任務上使用不同的模型來評估 early dropout 和 late dropout,結果顯示二者始終比標準 dropout 和無 dropout 產生了更好的效果。他們希望自己的研究發現可以為 dropout 和過擬合提供新穎的見解,并激發人們進一步開發神經網絡正則化器。

分析與驗證

在提出 early dropout 和 late dropout 之前,該研究探討了是否可以使用 dropout 作為減少欠擬合的工具。該研究使用其提出的工具和指標對 dropout 的訓練動態進行了詳細分析,并比較了 ImageNet 上兩個 ViT-T/16 的訓練過程(Deng et al., 2009):一個沒有 dropout 作為基線;另一個在整個訓練過程中有 0.1 的 dropout 率。?

梯度范數(norm)。該研究首先分析了 dropout 對梯度 g 強度的影響。如下圖 6(左)所示,dropout 模型產生范數較小的梯度,表明它在每次梯度更新時采用較小的步長(step)。

模型距離。由于梯度步長更小,我們期望 dropout 模型相對于其初始點移動的距離比基線模型更小。如下圖 6(右)所示,該研究繪制了每個模型與其隨機初始化的距離。然而,令人驚訝的是,dropout 模型實際上比基線模型移動了更大的距離,這與該研究最初基于梯度范數的預期相反。

圖片

梯度方向方差。該研究首先假設 dropout 模型在小批量中產生更一致的梯度方向。下圖 7 所示的方差與假設基本一致。直到一定的迭代次數(大約 1000 次)以后,dropout 模型和基線模型的梯度方差都在一個較低的水平波動。

圖片

梯度方向誤差。然而,正確的梯度方向應該是什么?為了擬合訓練數據,基本目標是最小化整個訓練集的損失,而不僅僅是任何一個小批量的損失。該研究在整個訓練集上計算給定模型的梯度,其中 dropout 設置為推理模式以捕獲完整模型的梯度。梯度方向誤差如下圖 8 所示。

圖片

基于上述分析,該研究發現盡早使用 dropout 可以潛在地提高模型對訓練數據的擬合能力。而是否需要更好地擬合訓練數據取決于模型是處于欠擬合還是過擬合狀態,這可能很難精確定義。該研究使用如下標準:

  • 如果一個模型在標準 dropout 下泛化得更好,則認為它處于過擬合狀態;
  • 如果模型在沒有 dropout 的情況下表現更好,則認為它處于欠擬合狀態。

模型所處的狀態不僅取決于模型架構,還取決于所使用的數據集和其他訓練參數。

然后,該研究提出了 early dropout 和 late dropout 兩種方法

early dropout。在默認設置下,欠擬合狀態下的模型不使用 dropout。為了提高其適應訓練數據的能力,該研究提出 early dropout:在某個迭代之前使用 dropout,然后在其余的訓練過程中禁用 dropout。該研究實驗表明,early dropout 減少了最終的訓練損失并提高了準確性。

late dropout。過擬合模型的訓練設置中已經包含了標準的 dropout。在訓練的早期階段,dropout 可能會無意中造成過擬合,這是不可取的。為了減少過擬合,該研究提出 late dropout:在某個迭代之前不使用 dropout,而是在其余的訓練中使用 dropout。

該研究提出的方法在概念和實現上都很簡單,如圖 2 所示。實現時需要兩個超參數:1) 在打開或關閉 dropout 之前等待的 epoch 數;2)drop rate p,類似于標準的 dropout rate。該研究表明,這兩種超參數可以保證所提方法的穩健性。

實驗及結果

研究者在具有 1000 個類和 1.2M 張訓練圖像的 ImageNet-1K 分類數據集上進行了實證評估,并報告了 top-1 驗證準確率。

具體結果首先如下表 1(上部)所示,early dropout 持續提升測試準確率,降低訓練損失,表明早期階段的 dropout 有助于模型更好地擬合數據。研究者還展示了使用 drop rate 為 0.1 時與標準 dropout、隨機深度(s.d.)的比較結果,這兩者都對模型具有負面影響。

此外,研究者將訓練 epoch 增加一倍并減少 mixup 和 cutmix 強度,從而改進了這些小模型的方法。下表 1(底部)的結果表明,基線準確率顯著提升,有時甚至大大超越了以往工作的結果。

圖片

為了評估 late dropout,研究者選擇了更大的模型,即分別具有 59M 和 86M 參數的 ViT-B 和 Mixer-B,使用了基礎的訓練方法。

結果如下表 3 所示,與標準 s.d. 相比,late s.d. 提升了測試準確率。這一提升是在保持 ViT-B 或增加 Mixer-B 訓練損失的同時實現的,表明 late s.d. 有效降低了過擬合。

圖片

最后,研究者在下游任務上對預訓練 ImageNet-1K 模型進行微調,并對它們進行評估。下游任務包括 COCO 目標檢測與分割、ADE20K 語義分割以及在 C-100 等五個數據集上的下游分類。目標是在微調階段不使用 early dropout 或 late dropout 的情況下評估學得的表示。

結果如下表 4、5 和 6 所示,首先當在 COCO 上進行微調時,使用 early dropout 或 s.d. 進行預訓練的模型始終保持優勢。

圖片

其次對于 ADE20K 語義分割任務而言,使用本文方法進行預訓練的模型優于基準模型。

圖片

最后是下游分類任務,本文方法在大多數分類任務上提升了泛化性能。

圖片

更多技術細節及實驗結果請參閱原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2016-12-06 12:48:32

開源設計

2017-10-05 13:38:22

LSTM過擬合欠擬合

2022-02-09 10:56:09

ReactJS組件前端

2009-12-14 10:57:34

Ruby調試器

2023-04-10 11:22:34

CIOIT運營成本

2011-02-25 10:12:09

GoWeb

2014-08-15 09:24:54

2019-06-27 22:23:56

谷歌Android開發者

2024-04-29 14:54:36

機器學習過擬合模型人工智能

2018-07-18 15:05:01

2021-09-07 13:06:32

Eslint Fix 功能算法

2016-12-05 17:11:53

開源GIMP網頁設計

2022-01-21 07:57:06

Windows 11微軟微軟賬戶

2020-04-14 11:34:15

Linux命令行查看圖像

2021-11-15 10:52:06

Red HatRHEL容器

2010-03-04 16:33:21

Ubuntu cvs

2017-11-24 13:12:45

大數據幼教幼師

2022-10-17 09:34:18

2020-03-27 12:12:02

CarKeyiPhone汽車鑰匙

2013-06-09 15:47:44

Wi-FiWiSee
點贊
收藏

51CTO技術棧公眾號

我看黄色一级片| 国产成人澳门| 26uuu精品一区二区三区四区在线| 国产精品国模大尺度私拍| 校花撩起jk露出白色内裤国产精品| 日韩在线视频国产| 欧美大胆成人| 亚洲毛茸茸少妇高潮呻吟| 先锋影音在线资源站91| 欧美一区日本一区韩国一区| 番号在线播放| 在线看不卡av| 成人在线二区| 精品视频一区 二区 三区| 久草在线青青草| 在线精品视频免费播放| 免费理论片在线观看播放老| 日韩欧美在线视频日韩欧美在线视频| 深夜福利视频一区| 欧美日韩精品一区二区三区四区| 欧美18hd| 亚洲精品动漫久久久久| 欧美色网在线| 久久夜色精品国产亚洲aⅴ| 在线播放一区二区精品视频| 国产+人+亚洲| 波多野结衣在线观看一区二区三区| 国产激情91久久精品导航| www.爱色av.com| 日韩欧美黄色动漫| 蜜桃视频一区二区三区在线观看| 日本福利在线观看| www.色综合| 无罩大乳的熟妇正在播放| 老鸭窝91久久精品色噜噜导演| www.久久久精品| 精品婷婷伊人一区三区三| 视频一区中文字幕精品| 亚洲午夜在线观看| 日本不卡123| 蜜桃视频在线观看www社区| 69av视频在线播放| 日韩丝袜美女视频| 欧美精品99久久久**| 国产精品女人毛片| 在线视频精品| 国产私拍精品| 国产精品美女www爽爽爽视频| 亚洲视频在线一区二区| 丝袜中文在线| 亚洲第一区在线观看| 在线精品国产亚洲| 成人av免费看| 91精品国产综合久久婷婷香蕉 | 校园春色 亚洲色图| 欧美色涩在线第一页| www.精品国产| 蜜桃av噜噜一区二区三区| 3atv在线一区二区三区| 一区二区三区导航| 免费黄网站在线观看| 69av一区二区三区| 99国产精品久久久久久久成人热| 国产av人人夜夜澡人人爽| 久久天天躁狠狠躁夜夜躁2014| 成人av中文字幕| h片在线观看视频免费| 亚洲女人天堂网| 成人在线视频你懂的| 欧美wwwwwww| 美女日批免费视频| 久久久精品美女| 国产精品影音先锋| 99久久精品网站| 精品亚洲一区二区三区四区五区高| 欧美一级日韩一级| 国产日韩欧美三级| 日韩精品免费在线观看| 亚洲国产激情| 成人污版视频| 欧美日韩激情视频在线观看| 日韩av在线直播| 亚洲一区二区三区高清| 在线观看欧美日韩电影| 免费看一级大黄情大片| 亚洲国产精品99久久| 国产精品v日韩精品v欧美精品网站 | 国产精品日韩三级| www.亚洲色图| 人与动性xxxxx免费视频| 亚洲成人黄色在线| 久久久综合色| 欧美成人免费高清视频| 日韩美女在线视频| 国产精品久久久久一区二区三区厕所 | 国产福利电影在线| 国内精品在线一区| 国产精品伊人色| 免费在线观看黄色网| 国产精品69精品一区二区三区| 北条麻妃一区二区三区| 欧美videossex| 粉嫩高清一区二区三区精品视频| 中文字幕日韩精品一区| av成人在线观看| 亚洲精品成人久久久998| 色噜噜狠狠色综合中国| 一区二区三区视频播放| 国产美女主播在线播放| 日韩av一区二区在线观看| 亚洲精品乱码| 超碰国产在线观看| 91视频免费网站| 午夜精品在线视频一区| 精品国产美女| 成人免费淫片95视频观看网站| 久久亚洲精品网站| 成人午夜免费av| 中文字幕不卡三区视频| 免费看成人午夜电影| 欧美午夜寂寞影院| 欧美精品首页| 五月婷婷在线观看| 欧美日韩视频在线一区二区观看视频| 欧美色大人视频| 亚洲欧美久久久| 丁香高清在线观看完整电影视频| 欧美一级二级三级九九九| 日韩欧美一区电影| 蜜桃视频在线观看一区| 久久电影tv| 欧美aⅴ在线观看| 久久久久久亚洲精品中文字幕 | 欧美视频精品一区| 自由日本语亚洲人高潮| 户外极限露出调教在线视频| 国产99在线播放| 在线综合亚洲欧美在线视频| 国产日韩综合| а√天堂8资源在线| 91免费国产精品| 久久中文字幕国产| 国产精品久久久一本精品| 欧美精选视频在线观看| 日本一级在线观看| 快播亚洲色图| 日韩免费福利电影在线观看| 国产原创一区二区| 久久天堂av| 国产理论在线播放| 日韩av手机在线看| 日本精品视频一区二区三区| 久久久亚洲一区| 另类一区二区| 黄网在线播放| 久久国产精品 国产精品| 亚洲精品美女久久| 国产欧美日韩综合精品一区二区| 欧美军人男男激情gay| 超碰在线无需免费| 无码 制服 丝袜 国产 另类| 97视频在线免费观看| 日本韩国欧美国产| 国产美女久久久久| 美国成人xxx| 日韩黄色影院| 性欧美大战久久久久久久| 日韩美女免费视频| 欧美成人三级电影在线| 久久精品亚洲麻豆av一区二区| 国产亚洲欧美日韩在线观看一区二区 | 久久久久国产一区二区三区四区| 校花撩起jk露出白色内裤国产精品| 日韩美女一级视频| 亚洲v国产v在线观看| 欧美尺度大的性做爰视频| 精品福利樱桃av导航| 久久99精品久久只有精品| 久久久久亚洲精品中文字幕| 免费在线黄色电影| www.xxx麻豆| 成人激情在线观看| 亚洲欧洲国产精品| 舔着乳尖日韩一区| 国产91精品久久久久久久网曝门| 欧美日韩高清| 日韩在线短视频| 欧美xxx.com| 日韩激情免费视频| 91成人免费观看| www.久久久久久.com| 欧亚一区二区三区| 欧美国产国产综合| 日本欧美一区二区| 久久资源中文字幕| 亚瑟国产精品| 国产调教视频在线观看| 国产视频青青| 91精品一区二区三区四区| 亚洲自拍偷拍一区|