国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%

新聞 人工智能 算法
最近,谷歌大腦提出了一種新的二階預(yù)處理方法,帶來很大改進(jìn),優(yōu)于SGD、Adam和AdaGrad等一階算法,縮短了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間。

 本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請聯(lián)系出處。

機(jī)器學(xué)習(xí)的優(yōu)化步驟,目前都是一階方法主導(dǎo)。

無論是SGD還是Adam,此類優(yōu)化算法在都是計(jì)算損失函數(shù)的一階導(dǎo)數(shù)——梯度,然后按照某種規(guī)定的方式讓權(quán)重隨梯度下滑方向迭代。

其實(shí)二階梯度會(huì)有更好的特性,因?yàn)樗怯?jì)算梯度的導(dǎo)數(shù),能夠更快地找到最合適的下降方向和速度。

然而出于計(jì)算量和存儲(chǔ)成本的考慮,二階優(yōu)化算法很少用到。

最近,谷歌大腦提出了一種新的二階預(yù)處理方法,帶來很大改進(jìn),優(yōu)于SGD、Adam和AdaGrad等一階算法,縮短了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時(shí)間。

它在Transformer訓(xùn)練任務(wù)中比任何一階方法都快得多,而且能達(dá)到相同甚至更高的精度。連Jeff Dean也不禁在Twitter上點(diǎn)贊。

谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%

“洗發(fā)水”算法

這篇文章是對(duì)之前一種二階方法洗發(fā)水算法(Shampoo algorithm)做的實(shí)用化改進(jìn)。

為何叫“洗發(fā)水算法”?其實(shí)是對(duì)此類算法的一種幽默稱呼。洗發(fā)水的廣告詞一般是“搓揉、沖洗、重復(fù)”,表示簡單重復(fù)式的無限循環(huán),最后導(dǎo)致洗發(fā)水用盡(out of bottle)。

而這種算法用于機(jī)器學(xué)習(xí)優(yōu)化,最早來自于本文通訊作者Yoram Singer在2018年被ICML收錄的一篇文章Shampoo: Preconditioned Stochastic Tensor Optimization

洗發(fā)水算法需要跟蹤2個(gè)預(yù)條件算子(Preconditioner)的統(tǒng)計(jì)數(shù)值Lt和Rt。

然后計(jì)算這2個(gè)預(yù)條件算子的四次根再求逆。將這兩個(gè)矩陣分別左乘和右乘梯度向量,迭代出t+1步的梯度再由以下公式得出:

谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%

上述過程像不像一種簡單重復(fù),所以被作者自稱為“洗發(fā)水”。

2018年的那篇論文更側(cè)重于理論解釋,然而就是如此簡單的“洗頭”步驟實(shí)際應(yīng)用起來也會(huì)面臨諸多困難。

這一步中最大的計(jì)算量來自于Lt-1/4和Rt-1/4。計(jì)算這個(gè)兩個(gè)數(shù)需要用到代價(jià)高昂的奇異值分解。

實(shí)際上,四次逆根不僅可以用SVD方法算出,也可以用舒爾-牛頓法(Schur-Newton algorithm)算出,而且隨著矩陣維度的增大,后者節(jié)約的時(shí)間越來越可觀。

谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%

舒爾-牛頓法可以在普通CPU上計(jì)算,不必消耗GPU、TPU這類神經(jīng)網(wǎng)絡(luò)加速器的計(jì)算資源。

但即使是這樣,計(jì)算矩陣根的逆仍然相當(dāng)耗時(shí)。如果不解決這個(gè)問題,訓(xùn)練速度就不可能提高。

所以作者使用了異步計(jì)算的方法,并使用了TensorFlow中的Lingvo來對(duì)訓(xùn)練循環(huán)進(jìn)行改進(jìn)。

CPU負(fù)責(zé)收集和處理訓(xùn)練數(shù)據(jù)以及輔助活動(dòng),例如檢查點(diǎn)和訓(xùn)練狀態(tài)摘要。而在GPU、TPU等加速器運(yùn)行訓(xùn)練循環(huán)時(shí)通常處于空閑或低利用率狀態(tài),并自動(dòng)提供雙精度計(jì)算。

這使它們成為計(jì)算預(yù)條件算子的理想選擇,而不會(huì)增加訓(xùn)練消耗的資源。

使用異步計(jì)算

他們在每一步中都計(jì)算所有張量的預(yù)條件算子,但是預(yù)處理后的梯度卻是每N步計(jì)算一次,并交由CPU處理。

這期間,GPU或TPU依然在計(jì)算,過去的預(yù)條件算子在訓(xùn)練過程中會(huì)一直使用,直到獲得更新后的預(yù)訓(xùn)練算子為止。

谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%

計(jì)算過程像流水線一樣,并且異步運(yùn)行而不會(huì)阻塞訓(xùn)練循環(huán)。結(jié)果是,洗發(fā)水算法中最難計(jì)算的步驟幾乎沒有增加總的訓(xùn)練時(shí)間。

僅有這些還不夠,作者對(duì)洗發(fā)水算法又做了幾點(diǎn)改進(jìn),使它可以適應(yīng)大型模型的訓(xùn)練。包括解耦步長大小和方向、預(yù)處理大型張量還有將大型張量劃分成多個(gè)塊。

最高提速67%

在WMT’14英語到法語翻譯的Transformer訓(xùn)練任務(wù)中,該算法實(shí)現(xiàn)了1.67倍的加速,將時(shí)間減少了40%。

谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%

洗發(fā)水算法在和Adam或AdaGrad精度相同的情況下,只需后兩者實(shí)現(xiàn)了約一半的相同的精度AdaGrad或亞當(dāng)許多步驟,而且對(duì)學(xué)習(xí)率的寬容度比AdaGrad高。

之前異步計(jì)算中的N是一個(gè)可調(diào)參數(shù),決定了訓(xùn)練的計(jì)算量,N越大,計(jì)算量越小。當(dāng)然N也會(huì)對(duì)結(jié)果造成影響。我們需要在訓(xùn)練過程的性能和結(jié)果的質(zhì)量之間做出權(quán)衡。

實(shí)驗(yàn)表明,這種方法可以承受多達(dá)1200個(gè)步驟的延遲,而不會(huì)造成任何明顯的質(zhì)量損失。

谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%

洗發(fā)水也可以用在圖像分類任務(wù)中。

作者還在ImageNet-2012數(shù)據(jù)集上訓(xùn)練了ResNet-50模型,結(jié)果比帶動(dòng)量的SGD收斂更快,但是訓(xùn)練損失與SGD相近,但是在測試集上的效果不如后者。

谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%
谷歌提出“洗發(fā)水”二階優(yōu)化算法,Transformer訓(xùn)練時(shí)間減少40%

至于在泛化能力上的劣勢,洗發(fā)水算法還有待進(jìn)一步的改進(jìn)。

論文地址:

https://arxiv.org/abs/2002.09018

https://arxiv.org/abs/1802.09568

 

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2018-07-10 05:05:36

2021-07-13 17:59:13

人工智能機(jī)器學(xué)習(xí)技術(shù)

2021-08-03 23:05:31

Python導(dǎo)數(shù)實(shí)現(xiàn)

2023-05-26 10:15:34

模型訓(xùn)練

2024-04-26 08:58:54

if-else代碼JavaSpring

2022-07-08 15:14:34

神經(jīng)網(wǎng)絡(luò)谷歌機(jī)器學(xué)習(xí)

2019-10-28 14:07:29

研發(fā)管理技術(shù)

2023-11-06 13:11:22

Docker映像Builkit

2022-07-27 14:45:39

谷歌模型

2019-07-22 16:55:46

神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)圖形

2025-03-07 10:02:10

2022-11-02 14:02:02

強(qiáng)化學(xué)習(xí)訓(xùn)練

2024-08-28 08:43:58

2021-12-06 09:53:09

自然語言神經(jīng)網(wǎng)絡(luò)人工智能

2025-04-17 09:53:49

谷歌模型架構(gòu)

2011-05-13 17:58:21

軟件測試

2020-05-14 14:21:50

谷歌AI數(shù)據(jù)

2017-07-11 10:19:24

淺層模型機(jī)器學(xué)習(xí)優(yōu)化算法

2020-11-29 20:24:13

數(shù)據(jù)谷歌DeepMind
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

日韩精品成人在线观看| 欧美喷潮久久久xxxxx| 午夜大尺度福利视频| 亚洲综合999| 欧美猛烈性xbxbxbxb| 亚洲热线99精品视频| 色999久久久精品人人澡69| 国产999在线观看| 午夜久久久久| 日本三级中文字幕在线观看| 国产精品乱人伦中文| 日韩一二三四| 亚洲男女自偷自拍图片另类| 老司机在线精品视频| 国产精品18毛片一区二区| 国产美女在线观看一区| 日韩av片网站| 欧亚洲嫩模精品一区三区| 日韩制服一区| 成人午夜两性视频| 高清国产午夜精品久久久久久| 免费超爽大片黄| 狠狠综合久久av一区二区小说| 国产在线更新| 国产最新精品视频| 国产精品毛片| 加勒比一区二区三区| 日韩一区和二区| 日韩影视高清在线观看| 亚洲精品国产一区| 亚洲六月丁香色婷婷综合久久| 爱看av在线| 国产成人aa精品一区在线播放| 日韩电影在线观看一区| 国产精品秘入口18禁麻豆免会员| 色哟哟一区二区三区| 欧美va在线| 成人欧美一区二区三区视频xxx| 国内精品伊人久久久久av一坑| 神马久久久久| 欧美激情乱人伦一区| 另类图片国产| 97香蕉久久| 日韩中文字幕在线观看| 国产精品入口| 亚洲一区二区三区精品中文字幕| 日韩激情第一页| 偷拍自拍亚洲| 91青娱乐在线视频| 正义之心1992免费观看全集完整版| 久久精品亚洲欧美日韩精品中文字幕| 成人在线免费观看视频网站| 亚洲va欧美va天堂v国产综合| 亚洲人成网站在线在线观看| 国产主播喷水一区二区| 国产精品欧美久久久| 国产午夜精品久久| 久久国产精品免费一区| 亚洲免费观看在线视频| av成人免费| 欧美日韩视频免费播放| av成人资源网| 国产中文字幕在线免费观看| 欧美电视剧在线看免费| 很黄很黄激情成人| 一本到av在线| 国产成人亚洲综合青青| 久久精品免视看| 国产在线精彩视频| 精品国产一区二区三区麻豆免费观看完整版 | 亚洲综合色站| 蜜桃久久av一区| 国内精品一区视频| 欧美亚洲综合一区| 久久精品亚洲成在人线av网址| av免费观看国产| 精品福利视频一区二区三区| 精品96久久久久久中文字幕无| 精精国产xxxx视频在线动漫| 欧美国产日韩在线| 丁香天五香天堂综合| 国产社区精品视频| 中文字幕在线亚洲三区| 精品第一国产综合精品aⅴ| 免费看欧美美女黄的网站| 新片速递亚洲合集欧美合集| 男人和女人啪啪网站| 久久久久久久久久久人体| 一区二区三区鲁丝不卡| 午夜性色一区二区三区免费视频| 自拍视频在线| 超级碰在线观看| 久久免费国产视频| 五月开心婷婷久久| 国产精品视频| 精品三级在线| 九色视频网站| 鲁丝一区二区三区免费| 亚洲女同另类| 欧美14一18处毛片| 久久国产精品网| 欧美一二三视频| 欧美色综合天天久久综合精品| 麻豆久久一区二区| 51vv免费精品视频一区二区| 午夜黄色在线观看| 亚洲伊人婷婷| 538国产精品视频一区二区| 91福利区一区二区三区| 久久99国产精品久久| 黄色美女久久久| 日韩专区在线| 高清在线观看免费| 国产一区深夜福利| 亚洲国产精品99| 亚洲色图一区二区| 久久精品30| 成人动态视频| www在线观看播放免费视频日本 | 99久久精品免费看| 成人情趣视频| videos性欧美另类高清| 日本调教视频在线观看| 午夜老司机精品| 午夜精品久久久久久久99热| 欧美日本一区二区| 国产亚洲福利社区一区| 国产日韩综合| 伊色综合久久之综合久久| 男人的天堂在线视频免费观看 | 蜜臀久久99精品久久久酒店新书| 亚洲在线视频观看| 在线午夜精品自拍| 五月天欧美精品| 粉嫩蜜臀av国产精品网站| 一区二区影院| 精品国产亚洲一区二区三区大结局| 毛片在线免费| 色诱视频在线观看| 精品国产乱码久久久久久郑州公司| 美女少妇精品视频| 精品裸体舞一区二区三区| 亚洲夂夂婷婷色拍ww47| 国产成a人亚洲精| 亚洲精品乱码| 久久不见久久见免费视频7| 国产日韩电影| 成人在线免费观看| 亚洲人辣妹窥探嘘嘘| 色播亚洲视频在线观看| 成人激情视频在线| 久久久久久久久久久久av| 亚洲欧美日韩天堂一区二区| 在线看不卡av| 国产精品国产三级国产a| 国产成人精品三级| 国产欧美综合一区二区三区| 麻豆国产欧美一区二区三区r| 亚洲天堂手机| 18+视频在线观看| 中文字幕乱在线伦视频乱在线伦视频| 国产乱子伦农村叉叉叉| 亚洲一区二区三区加勒比| 精品视频一区二区三区四区| 国产又爽又黄的激情精品视频 | 韩国三级日本三级少妇99| 亚洲人成在线观| 精品久久久久久综合日本欧美| 在线看国产日韩| 五月婷婷综合在线| 亚洲婷婷综合久久一本伊一区| 久久综合九色综合久久久精品综合 | 欧美一区二区视频| 欧美18 19xxx| 久久久精品麻豆| 青青草精品视频在线| 一区二区视频在线观看| 欧美一二三四五区| 国产在线精品二区| 国产成人精品免费视频大全最热| 国产欧美一区二区三区久久人妖| 91av在线免费观看| 性色av一区二区咪爱| 欧美乱大交做爰xxxⅹ性3| 日韩在线免费观看视频| 中文字幕久久精品| 在线a欧美视频| 国产视频精品va久久久久久| 亚洲第一天堂av| 精品久久五月天| 精品处破学生在线二十三| 日韩欧美另类在线| 亚洲福利在线看| 亚洲美女www午夜| 亚洲欧洲偷拍精品| 在线精品视频视频中文字幕| 久久精品视频在线播放| 欧美激情图片区| 日韩**中文字幕毛片| 国产精品丝袜高跟|