国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

拋棄歸一化,深度學(xué)習(xí)模型準(zhǔn)確率卻達(dá)到了前所未有的水平

人工智能 深度學(xué)習(xí)
我們知道,在傳遞給機(jī)器學(xué)習(xí)模型的數(shù)據(jù)中,我們需要對(duì)數(shù)據(jù)進(jìn)行歸一化(normalization)處理。

我們知道,在傳遞給機(jī)器學(xué)習(xí)模型的數(shù)據(jù)中,我們需要對(duì)數(shù)據(jù)進(jìn)行歸一化(normalization)處理。

在數(shù)據(jù)歸一化之后,數(shù)據(jù)被「拍扁」到統(tǒng)一的區(qū)間內(nèi),輸出范圍被縮小至 0 到 1 之間。人們通常認(rèn)為經(jīng)過(guò)如此的操作,最優(yōu)解的尋找過(guò)程明顯會(huì)變得平緩,模型更容易正確的收斂到最佳水平。

然而這樣的「刻板印象」最近受到了挑戰(zhàn),DeepMind 的研究人員提出了一種不需要?dú)w一化的深度學(xué)習(xí)模型 NFNet,其在大型圖像分類任務(wù)上卻又實(shí)現(xiàn)了業(yè)內(nèi)最佳水平(SOTA)。

拋棄歸一化,深度學(xué)習(xí)模型準(zhǔn)確率卻達(dá)到了<span><span><span><i style=前所未有的水平">

該模型(紅色)與其他模型在 ImageNet 分類準(zhǔn)確度和訓(xùn)練時(shí)間上的對(duì)比。

該論文的第一作者,DeepMind 研究科學(xué)家 Andrew Brock 表示:「我們專注于開發(fā)可快速訓(xùn)練的高性能體系架構(gòu),已經(jīng)展示了一種簡(jiǎn)單的技術(shù)(自適應(yīng)梯度裁剪,AGC),讓我們可以訓(xùn)練大批量和大規(guī)模數(shù)據(jù)增強(qiáng)后的訓(xùn)練,同時(shí)達(dá)到 SOTA 水平。」

該研究一經(jīng)提交,便吸引了人們的目光。

拋棄歸一化,深度學(xué)習(xí)模型準(zhǔn)確率卻達(dá)到了<span><span><span><i style=前所未有的水平">
  • 論文鏈接:https://arxiv.org/abs/2102.06171
  • DeepMind 還放出了模型的實(shí)現(xiàn):https://github.com/deepmind/deepmind-research/tree/master/nfnets

NFNet 是不做歸一化的 ResNet 網(wǎng)絡(luò)。具體而言,該研究貢獻(xiàn)有以下幾點(diǎn):

  • 提出了自適應(yīng)梯度修剪(Adaptive Gradient Clipping,AGC)方法,基于梯度范數(shù)與參數(shù)范數(shù)的單位比例來(lái)剪切梯度,研究人員證明了 AGC 可以訓(xùn)練更大批次和大規(guī)模數(shù)據(jù)增強(qiáng)的非歸一化網(wǎng)絡(luò)。
  • 設(shè)計(jì)出了被稱為 Normalizer-Free ResNets 的新網(wǎng)絡(luò),該方法在 ImageNet 驗(yàn)證集上大范圍訓(xùn)練等待時(shí)間上都獲得了最高水平。NFNet-F1 模型達(dá)到了與 EfficientNet-B7 相似的準(zhǔn)確率,同時(shí)訓(xùn)練速度提高了 8.7 倍,而 NFNet 模型的最大版本則樹立了全新的 SOTA 水平,無(wú)需額外數(shù)據(jù)即達(dá)到了 86.5%的 top-1 準(zhǔn)確率。
  • 如果在對(duì) 3 億張帶有標(biāo)簽的大型私人數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,隨后針對(duì) ImageNet 進(jìn)行微調(diào),NFNet 可以比批歸一化的模型獲得更高的 Top-1 準(zhǔn)確率:高達(dá) 89.2%。

研究方法

在沒有歸一化的情況下,許多研究者試圖通過(guò)恢復(fù)批歸一化的好處來(lái)訓(xùn)練深度 ResNet 以提升其準(zhǔn)確率。這些研究大多數(shù)通過(guò)引入小常數(shù)或可學(xué)習(xí)的標(biāo)量來(lái)抑制初始化時(shí)殘差分支上的激活尺度。

DeepMind 的這項(xiàng)研究采用并建立在「Normalizer-Free ResNet(NF-ResNet)」上,這是一類可以在沒有歸一化層的情況下,被訓(xùn)練成具有訓(xùn)練和測(cè)試準(zhǔn)確率的預(yù)激活 ResNet。

NF-ResNet 使用如下形式的殘差塊:

拋棄歸一化,深度學(xué)習(xí)模型準(zhǔn)確率卻達(dá)到了<span><span><span><i style=前所未有的水平">

其中,h_i 代表第 i 個(gè)殘差塊的輸入,f_i 代表由第 i 個(gè)殘差分支計(jì)算的函數(shù)。

用于高效大批量訓(xùn)練的自適應(yīng)梯度裁剪

為了將 NF-ResNet 擴(kuò)展到更大的批規(guī)模,研究者探索了一系列梯度裁剪策略。梯度裁剪通常被用于語(yǔ)言建模中以穩(wěn)定訓(xùn)練。近來(lái)一些研究表明:與梯度下降相比,梯度裁剪允許以更高的學(xué)習(xí)率進(jìn)行訓(xùn)練,從而加快收斂速度。這對(duì)于條件較差的 loss landscape 或大批量訓(xùn)練尤為重要。因?yàn)樵谶@些情況下,最佳學(xué)習(xí)率受到最大穩(wěn)定學(xué)習(xí)率的限制。因此該研究假設(shè)梯度裁剪應(yīng)該有助于將 NF-ResNet 有效地?cái)U(kuò)展到大批量設(shè)置。

借助一種稱為 AGC 的梯度裁剪方法,該研究探索設(shè)計(jì)了 Normalizer-Free 架構(gòu),該架構(gòu)實(shí)現(xiàn)了 SOTA 的準(zhǔn)確率和訓(xùn)練速度。

當(dāng)前圖像分類任務(wù)的 SOTA 大多是 EfficientNet 系列模型 (Tan & Le, 2019)取得的,該系列的模型經(jīng)過(guò)優(yōu)化以最大化測(cè)試準(zhǔn)確率,同時(shí)最小化參數(shù)量和 FLOP 計(jì)數(shù),但它們的低理論計(jì)算復(fù)雜度并沒有轉(zhuǎn)化為訓(xùn)練速度的提高。

拋棄歸一化,深度學(xué)習(xí)模型準(zhǔn)確率卻達(dá)到了<span><span><span><i style=前所未有的水平">

該研究通過(guò)手動(dòng)搜索設(shè)計(jì)導(dǎo)向來(lái)探索模型設(shè)計(jì)的空間,這些導(dǎo)向?qū)Ρ仍O(shè)備上的實(shí)際訓(xùn)練延遲,可帶來(lái) ImageNet 上 holdout top-1 的帕累托前沿面的改進(jìn)。它們對(duì) holdout 準(zhǔn)確率的影響如下表 2 所示:

拋棄歸一化,深度學(xué)習(xí)模型準(zhǔn)確率卻達(dá)到了<span><span><span><i style=前所未有的水平">

實(shí)驗(yàn)

表 3 展示了六個(gè)不同的 NFNets(F0-F5)與其他模型在模型大小、訓(xùn)練延遲和 ImageNet 驗(yàn)證準(zhǔn)確率方面的對(duì)比情況。NFNets-F5 達(dá)到了 86.0%的 SOTA top-1 準(zhǔn)確率,相比 EfficientNet-B8 有了一定提升;NFNet-F1 的測(cè)試準(zhǔn)確率與 EfficientNet-B7 相媲美,同時(shí)訓(xùn)練速度提升了 8.7 倍;NFNet-F6+SAM 達(dá)到了 86.5%的 top-1 準(zhǔn)確率。

拋棄歸一化,深度學(xué)習(xí)模型準(zhǔn)確率卻達(dá)到了<span><span><span><i style=前所未有的水平">

NFNets 和其他模型在 ImageNet 數(shù)據(jù)集上的準(zhǔn)確率對(duì)比。延遲是指在 TPU 或 GPU(V100)上運(yùn)行單個(gè)完整訓(xùn)練步驟所需要的毫秒時(shí)間。

此外,研究者使用了一個(gè) 3 億標(biāo)注圖像的數(shù)據(jù)集對(duì) NFNet 的變體進(jìn)行了預(yù)訓(xùn)練,并針對(duì) ImageNet 進(jìn)行微調(diào)。最終,NFNet-F4 + 在 ImageNet 上獲得了 89.2% 的 top-1 準(zhǔn)確率。這是迄今為止通過(guò)額外訓(xùn)練數(shù)據(jù)達(dá)到的第二高的驗(yàn)證準(zhǔn)確率,僅次于目前最強(qiáng)大的半監(jiān)督學(xué)習(xí)基線 (Pham et al., 2020) 和通過(guò)遷移學(xué)習(xí)達(dá)到的最高準(zhǔn)確率。

拋棄歸一化,深度學(xué)習(xí)模型準(zhǔn)確率卻達(dá)到了<span><span><span><i style=前所未有的水平">

表 5:使用額外數(shù)據(jù)進(jìn)行大規(guī)模預(yù)訓(xùn)練后,ImageNet 模型遷移性能對(duì)比。

Andrew Brock 表示,雖然我們對(duì)于神經(jīng)網(wǎng)絡(luò)信號(hào)傳遞、訓(xùn)練規(guī)律的理解還有很多需要探索的方向,但無(wú)歸一化的方法已經(jīng)為人們提供了一個(gè)強(qiáng)有力的參考,并證明了發(fā)展這種深度理解能力可以有效地在生產(chǎn)環(huán)境中提升效率。 

 

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心Pro
相關(guān)推薦

2021-01-08 15:07:02

光子處理器計(jì)算密度AI

2022-02-28 17:56:51

英偉達(dá)天氣預(yù)報(bào)神經(jīng)網(wǎng)絡(luò)

2023-11-13 15:29:42

模型AI

2020-04-15 11:07:34

存儲(chǔ)閃存技術(shù)

2012-10-29 13:06:57

蘋果一體機(jī)

2025-04-15 10:16:12

2021-10-28 11:02:35

比特幣加密貨幣貨幣

2011-10-03 21:41:48

蘋果iPhone 5需求

2022-07-28 10:08:32

物聯(lián)網(wǎng)航空業(yè)

2020-04-06 14:09:36

存儲(chǔ)閃存技術(shù)

2019-06-13 15:00:35

2022-01-11 10:05:27

加密貨幣比特幣貨幣

2023-10-08 07:01:55

大數(shù)據(jù)ERP供應(yīng)鏈

2021-04-03 12:45:03

人工智能遠(yuǎn)程醫(yī)療疫情

2010-02-12 09:36:29

2018-07-09 17:37:08

區(qū)塊鏈

2017-07-14 10:28:16

2017-08-10 15:20:35

大數(shù)據(jù)數(shù)據(jù)安全用戶數(shù)據(jù)

2009-07-19 10:24:14

2025-07-29 00:50:45

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

伊人情人综合网| 亚洲少妇中出一区| 成人午夜两性视频| 欧美主播一区二区三区美女 久久精品人| 欧美一区二区影院| 国产免费av在线| 免费成人小视频| 欧美主播一区二区三区| 日韩欧美精品一区二区综合视频| 国产成人高清视频| 亚洲国产精品一区在线观看不卡| 国产超碰在线一区| 国产1区2区在线| 中文字幕一区二区三区在线视频 | 男女男精品网站| 久久久噜噜噜久噜久久| 日本www在线| 亚洲人吸女人奶水| 欧美一二三四五区| 成人在线综合网站| 亚洲熟妇无码一区二区三区导航| 不卡一区在线观看| 伊人网在线视频| 男男成人高潮片免费网站| 激情六月婷婷| 亚洲精品www| 欧美片第1页综合| 日韩成人在线资源| 99久久国产综合精品色伊| 亚洲自偷自拍熟女另类| 91首页免费视频| www.av片| 国产精品影视在线观看| 一女被多男玩喷潮视频| 自拍偷拍欧美激情| 好吊日av在线| 久久久久亚洲精品| 黄色成人91| 91福利区在线观看| 色婷婷av一区| 色综合五月天| 免费看欧美一级片| 综合网日日天干夜夜久久| 污污网站在线看| 日韩精品在线免费观看视频| 日韩国产网站| 欧美一乱一性一交一视频| 91精品综合久久久久久久久久久 | 日韩有码在线观看| 国产精品久久久网站| 国产日韩欧美91| 久久成人精品| 久久久999免费视频| 午夜久久久影院| 婷婷色在线播放| 九九精品在线播放| 欧美三区美女| 日本黄网站免费| 在线观看免费成人| 黄色精品视频| 国产日本欧美一区| 狠狠色丁香久久婷婷综| 麻豆av观看| 精品在线观看国产| 久久美女视频| 国产xxxx振车| 日本道色综合久久| 亚洲国产精选| 国产专区一区二区三区| 国产日韩亚洲欧美综合| 激情视频在线观看| 亚洲2020天天堂在线观看| 亚洲国产高清一区二区三区| 国产九九九九九| 欧美性xxxxxx少妇| 国产福利资源一区| japanese在线视频| 懂色av一区二区三区| 欧美精品总汇| 国产欧美日韩一区二区三区| 国产清纯白嫩初高生在线观看91| 成人免费网站在线观看视频| 韩剧1988在线观看免费完整版| 爽好多水快深点欧美视频| 久草.com| 久久久国产精品亚洲一区| 国产日韩免费| 日本a级黄色| 丝袜情趣国产精品| 国产日本精品| 亚洲人成电影| 午夜精品一区二区三区视频免费看| 久久激情久久| 亚洲精品视频在线免费| 欧美激情第一页xxx| 国产在线一区观看| 第三区美女视频在线| 9.1国产丝袜在线观看| 高清不卡在线观看| 多野结衣av一区| 国产精品久久久久免费| 亚洲丝袜另类动漫二区| 国产精品久久久久久久久免费高清| 欧美二区在线| 在线观看日韩高清av| 日韩精品电影| 国产一级粉嫩xxxx| 欧美疯狂xxxx大交乱88av| 卡一卡二国产精品| 午夜激情视频在线| 91一区二区三区| 午夜精品影院在线观看| 国产日韩三级| 国产成人av影视| 久久综合网hezyo| 国产一区二区在线观看免费| 天堂а√在线官网| 国产精品日韩欧美一区二区| 亚洲成人免费在线| 精品国产一区一区二区三亚瑟| 三年中国国语在线播放免费| 亚洲人a成www在线影院| 狠狠色伊人亚洲综合成人| 七七久久电影网| 亚洲精品一品区二品区三品区| 91精品婷婷国产综合久久竹菊| 亚洲第一黄色| 午夜伦理在线| 欧美一区少妇| 精品日韩成人av| 精品一区二区在线免费观看| 久久男人天堂| 9色porny| 久久久亚洲精品视频| 一区二区三区中文在线| 水蜜桃精品av一区二区| 波多野结衣在线影院| 欧美日韩国产不卡在线看| 精品久久久久久久一区二区蜜臀| 日韩va亚洲va欧美va久久| 成年人视频免费在线播放| 蜜臀av.com| 日韩视频欧美视频| 中文字幕一区二区三区精华液| 国产毛片一区二区三区| 午夜成人影视| 日本免费高清一区| 亚洲欧美一区二区精品久久久| 国产91精品在线观看| 成人福利免费在线观看| 嫩草嫩草嫩草| 91情侣在线视频| 日韩欧美在线一区二区三区| 美女看a上一区| 亚洲成人精品综合在线| 中文字幕高清20页| 91亚洲精品视频| 精品久久久久久久久久久久久久久久久 | 久久久国产91| 亚洲色图另类专区| 天天干天天色天天爽| 交视频在线观看国产| 日韩av手机在线看| 亚洲成人一区二区| 亚洲国产一区二区三区在线播放| 国产在线观看黄| 欧美精品亚洲精品| 色青青草原桃花久久综合| 综合久久国产九一剧情麻豆| 亚洲人metart人体| 天天色天天射天天综合网| 亚洲国产精品va在线观看黑人| 国产精品三级在线| 先锋影音久久久| 欧美男人天堂| 欧美特级aaa| 成人动漫视频在线观看免费| 欧美一级xxx| 久久嫩草精品久久久精品| 国产成人澳门| 波多野结衣在线网站| 欧美xxxx吸乳| 欧美在线一区二区三区四| 欧美日韩色综合| av午夜一区麻豆| 希岛爱理一区二区三区| 中文字幕在线中文字幕在线中三区| 国产视频手机在线播放| 韩国成人av| 九九热精品视频| 欧美日本韩国一区二区三区视频| 大美女一区二区三区| 99精品一区| 国产一区高清| 成人在线二区| 久久精品一区二| 久久久久久久久一区| 国产+人+亚洲| 亚洲成人av资源网| 亚洲国产人成综合网站|