国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

阿里巴巴開源大規模稀疏模型訓練/預測引擎DeepRec

原創
開源
開源深度學習框架都不能很好地支持稀疏場景中對于稀疏Embedding功能的需求、模型訓練性能需求、部署迭代和線上服務的需求。

經歷6年時間,在各團隊的努力下,阿里巴巴集團大規模稀疏模型訓練/預測引擎DeepRec正式對外開源,助力開發者提升稀疏模型訓練性能和效果。

一、DeepRec是什么

DeepRec(PAI-TF)是阿里巴巴集團統一的大規模稀疏模型訓練/預測引擎,廣泛應用于淘寶、天貓、阿里媽媽、高德、淘特、AliExpress、Lazada等,支持了淘寶搜索、推薦、廣告等核心業務,支撐著千億特征、萬億樣本的超大規模稀疏訓練。

DeepRec在分布式、圖優化、算子、Runtime等方面對稀疏模型進行了深度性能優化,同時提供了稀疏場景下特有的Embedding相關功能。

DeepRec項目從2016年開發至今,由阿里巴巴集團內AOP團隊、XDL團隊、PAI團隊、RTP團隊以及螞蟻集團AIInfra團隊共建,并且得到了淘寶推薦算法等多個業務算法團隊的支持。DeepRec的研發也得到了Intel CESG軟件團隊、Optane團隊和PSU團隊,NVIDIA GPU計算專家團隊及Merlin HughCTR團隊的支持。

二、DeepRec架構設計原則

在TensorFlow引擎上支持大規模稀疏特征,業界有多種實現方式,其中最常見的方式是借鑒了ParameterServer的架構實現,在TensorFlow之外獨立實現了一套ParameterServer和相關的優化器,同時在TensorFlow內部通過bridge的方式橋接了兩個模塊。這個做法有一定的好處,比如PS的實現會比較靈活,但也存在一些局限性。

DeepRec采取了另一種架構設計方式,遵循“視整個訓練引擎為一個系統整體”的架構設計原則。TensorFlow是一個基于Graph的靜態圖訓練引擎,在其架構上有相應的分層,比如最上層的API層、中間的圖優化層和最下層的算子層。TensorFlow通過這三層的設計去支撐上層不同Workload的業務需求和性能優化需求。

DeepRec也堅持了這一設計原則,基于存儲/計算解耦的設計原則在Graph層面引入EmbeddingVariable功能;基于Graph的特點實現了通信的算子融合。通過這樣的設計原則,DeepRec可以支持用戶在單機、分布式場景下使用同一個優化器的實現和同一套EmbeddingVariable的實現;同時在Graph層面引入多種優化能力,從而做到獨立模塊設計所做不到的聯合優化設計。

三、DeepRec的優勢

DeepRec是基于TensorFlow1.15、Intel-TF、NV-TF構建的稀疏模型訓練/預測引擎,針對稀疏模型場景進行了定制深度優化,主要包含以下三類功能優化:

1.模型效果

DeepRec提供了豐富的稀疏功能支持,提高模型效果的同時降低稀疏模型的大小,并且優化超大規模下Optimizer的效果。下面簡單介紹Embedding及Optimizer幾個有特色的工作:

  • EmbeddingVariable(動態彈性特征):

(1)解決了靜態Shape Variable的vocabulary_size難以預估、特征沖突、內存及IO冗余等問題,并且在DeepRec中提供了豐富的EmbeddingVariable的進階功能,包括不同的特征準入方式、支持不同的特征淘汰策略等,能夠明顯提高稀疏模型的效果。

(2)在訪問效率上,為了達到更優化的性能和更低的內存占用,EmbeddingVariable的底層HashTable實現了無鎖化設計,并且進行了精細的內存布局優化,優化了HashTable的訪問頻次,使得在訓練過程中前后向只需訪問一次HashTable。

  • DynamicDimensionEmbeddingVariable(動態彈性維度):

在典型的稀疏場景中,同類特征的出現頻次往往極度不均勻。通常情況下,同一個特征列的特征都被設置成統一維度,如果Embedding維度過高,低頻特征容易過擬合,而且會額外耗費大量內存;如果維度設置過低,高頻部征特征可能會由于表達不夠而影響效果。

Dynamic Dimension Embedding Variable提供了同一特征列的不同特征值,根據特征的冷熱自動配置不同的特征維度,高頻特征可以配置更高維度增強表達能力,而低頻特征因為給定低維度embedding緩解了過擬合的問題,而且可以極大程度節省內存(低頻長尾特征的數量占據絕對優勢)。

  • Adaptive Embedding(自適應Embedding):

當使用動態彈性特征功能時,低頻特征存在過擬合問題。EmbeddingVariable中所有的特征都從initializer設定的初始值(一般設為0)開始學起,對于一些出現頻次從低到高的特征,也需要逐漸學習到一個較好的狀態,不能共享別的特征的學習結果。AdaptiveEmbedding功能使用靜態Shape Variable和動態EmbeddingVariable共同存儲稀疏特征,對于新加入的特征存于有沖突的Variable,對于出現頻率較高的特征存于無沖突的EmbeddingVariable,特征遷移到EmbeddingVaraible可以復用在有沖突的靜態Shape Variable的學習結果。

  • Adagrad Decay Optimizer:

為支持超大規模訓練而提出的一種改進版Adagrad優化器。當模型訓練的樣本量大,同時持續增量訓練較長時間時,Adagrad優化器的梯度會趨近于0,導致新增訓練的數據無法對模型產生影響。已有的累積打折的方案雖然可以解決梯度趨近0的問題,但也會帶來模型效果變差的問題(通過iteration打折策略無法反映實際的業務場景特點)。Adagrad Decay Optimizer基于周期打折的策略,同一個周期內的樣本相同的打折力度,兼顧數據的無限累積和樣本順序對模型的影響。

此外,DeepRec還提供Multi-HashEmbedding、AdamAsyncOptimizer等功能,在內存占用、性能、模型效果等方面為業務帶來實際的幫助。

2.訓練性能

DeepRec針對稀疏模型場景在分布式、圖優化、算子、Runtime等方面進行了深度性能優化。其中,DeepRec對不同的分布式策略進行了深度的優化,包括異步訓練、同步訓練、半同步訓練等,其中GPU同步訓練支持HybridBackend以及NVIDIA HugeCTR-SOK。DeepRec提供了豐富的針對稀疏模型訓練的圖優化功能,包括自動流水線SmartStage、結構化特征、自動圖Fusion等等。DeepRec中優化了稀疏模型中數十個常見算子,并且提供了包括Embedding、Attention等通用子圖的Fusion算子。DeepRec中CPUAllocator和GPUAllocator能夠大大降低內存/顯存的使用量并顯著加速E2E的訓練性能。在線程調度、執行引擎方面針對不同的場景提供了不同的調度引擎策略。下面簡單介紹分布式、圖優化、Runtime優化方面幾個有特色的工作:

  • StarServer(異步訓練框架):

在超大規模任務場景下(幾百、上千worker),原生開源框架中的一些問題被暴露出來,譬如低效的線程池調度、關鍵路徑上的鎖開銷、低效的執行引擎、頻繁的小包rpc帶來的開銷導致ParameterServer在分布式擴展時成為明顯的性能瓶頸。StarServer進行了包括圖、線程調度、執行引擎以及內存等優化,將原有框架中的send/recv語義修改為pull/push語義,并且在子圖劃分上支持了該語義,同時實現了ParameterServer端圖執行過程中的lockfree,實現了無鎖化的執行,大大提高了并發執行子圖的效率。對比原生框架,能夠提升數倍的訓練性能,并且支持3000worker規模的線性分布式擴展。

  • SmartStage(自動流水線):

稀疏模型訓練通常包含樣本數據的讀取、Embedding查找、Attention/MLP計算等,樣本讀取和Embedding查找非計算密集操作,同時并不能高效利用計算資源(CPU、GPU)。原生框架中提供的dataset.prefetch接口可以異步化樣本讀取操作,但Embedding查找過程中涉及特征補齊、ID化等復雜的過程,這些過程無法通過prefetch進行流水線化。SmartStage功能能夠自動分析圖中異步流水線化的邊界并自動插入,可以使并發流水線發揮最大的性能提升。

  • PRMalloc(內存分配器):

如何做到既高效又有效的使用內存,對于稀疏模型的訓練非常關鍵,稀疏場景模型訓練中大塊內存分配使用造成大量的minor pagefault,此外,多線程分配效率存在比較嚴重的并發分配效率問題。針對稀疏模型訓練前向、后向,Graph計算模式的相對固定、多輪反復迭代的特點,DeepRec設計了一套針對深度學習任務的內存管理方案,提高內存的使用效率和系統性能。使用DeepRec中提供的PRMalloc能夠極大降低訓練過程中minor pagefault,提高多線程并發內存分配、釋放的效率。

  • PMEM allocator(持久內存分配器):

基于PMDK的底層libpmem庫實現的PMEM allocator將從PMEM map出的一塊空間分為若干segment,每個segment又分成若干blocks,block是allocator的最小分配單元。分配block的線程為避免線程競爭,緩存一些可用空間,包括一組segment和free list。可用空間中為每種record size(若干個block)維護一個free list和segment。各record size對應的segment只分配該大小的PMEM空間,各record size對應的free list中的所有指針均指向對應record size的空閑空間。此外,為了均衡各thread cache的資源,由一個后臺線程周期地將thread cache中的free list移動到后臺的pool中,pool中的資源由所有前臺線程共享。實驗證明,基于持久內存實現的內存分配器在大模型的訓練性能方面與基于DRAM的訓練性能差別很小,但是TCO會有很大的優勢。

3.部署及Serving

  • 增量模型導出及加載:

時效性要求高的業務,需要頻繁的線上模型更新,頻率往往達到分鐘級別甚至秒級。對于TB-10TB級別的超大模型而言,分鐘級別的模型生成到上線很難完成。此外,超大模型的訓練和預測存在著資源浪費、多節點Serving延時加大等問題。DeepRec提供了增量模型產出及加載能力,極大加速了超大模型生成和加載。

Embedding多級混合存儲:

稀疏模型中特征存在冷熱傾斜的特性,這產生了某些冷門特征很少被訪問和更新導致的內存/顯存浪費問題,以及超大模型內存/顯存放不下的問題。DeepRec提供了多級混合存儲(支持最多四級的混合存儲HBM+DRAM+PMEM+SSD)的能力,自動將冷門特征存放到廉價的存儲介質中,將熱門特征存放到訪問更快、更貴的存儲介質上,通過多級混合存儲,使得單節點可以進行TB-10TB模型的Training和Serving。

通過多級混合存儲,能夠更大發揮GPU訓練稀疏模型的能力,同時降低由于存儲資源限制造成的計算資源浪費,可以使用更少的機器進行相近規模的模型訓練,或者使用相同數量的機器進行更大規模的訓練。多級混合存儲也能使得單機進行超大模型預測時避免分布式Serving帶來的latency增大問題,提高大模型的預測性能的同時降低成本。多級混合存儲功能也擁有自動發現特征的訪問特性,基于高效的熱度統計策略,將熱度高的特征放置到快速的存儲介質中,將低頻的特征offload到低速存儲介質中,再通過異步方式驅動特征在多個介質之間移動。

四、為什么開源DeepRec

開源深度學習框架都不能很好地支持稀疏場景中對于稀疏Embedding功能的需求、模型訓練性能需求、部署迭代和線上服務的需求。DeepRec經過阿里巴巴集團搜索、推薦、廣告等核心業務場景及公有云上各種業務場景的打磨,能夠支持不同類型的稀疏場景訓練效果和性能需求。

阿里巴巴希望通過建立開源社區,和外部開發者開展廣泛合作,進一步推動稀疏模型訓練/預測框架的發展,為不同業務場景中的搜推廣模型訓練和預測帶來業務效果和性能提升。

今天DeepRec的開源只是我們邁出的一小步。我們非常期待得到您的反饋。最后,如果你對DeepRec有相應的興趣,你也可以來轉轉,為我們的框架貢獻一點你的代碼和意見,這將是我們莫大的榮幸。

開源地址:https://github.com/alibaba/DeepRec

責任編輯:武曉燕 來源: 阿里開發者
相關推薦

2022-07-01 18:50:32

英特爾

2022-08-10 09:02:03

風控Flink阿里云

2021-04-19 11:02:06

阿里云達摩院AI

2018-12-14 11:00:18

2021-10-13 14:13:35

IPV6阿里巴巴網絡

2010-06-28 10:43:47

2019-12-18 10:48:52

運維架構技術

2019-01-28 10:10:36

開源技術 趨勢

2013-08-22 09:41:52

阿里巴巴去IOE王堅

2021-01-12 15:11:01

AI 數據人工智能

2023-10-26 06:55:46

大數據數據倉庫

2020-11-18 10:29:07

模型人工智能開源

2019-02-01 11:16:55

阿里巴巴Java開源

2025-05-30 06:48:53

2017-05-08 14:56:07

開源Prophet預測

2011-12-28 15:26:16

Spring\Dubb

2022-04-06 08:14:49

云原生混部系統開源

2017-08-07 11:09:19

機器學習用戶推薦轉化率

2009-02-27 10:46:32

DBA筆試題阿里巴巴
點贊
收藏

51CTO技術棧公眾號

国产一区欧美二区| 中文字幕乱码一区二区免费| 精品国产欧美成人夜夜嗨| 69国产精品视频| 久久国产精品亚洲77777| 77777亚洲午夜久久多人| 男人的天堂在线视频免费观看 | 亚洲人永久免费| 三级av在线| 国产精品久久久久久久久快鸭 | 午夜精品久久17c| 美女露胸视频在线观看| 精品美女国产在线| 黄色片在线免费| 国产另类ts人妖一区二区| 国新精品乱码一区二区三区18| 久久精品国产亚洲5555| 伊人久久男人天堂| 波多野在线观看| 在线亚洲人成电影网站色www| 成人网18免费软件大全| av一区二区久久| 三年中国中文在线观看免费播放| 欧美日韩精品一本二本三本| 热re91久久精品国99热蜜臀| 精品视频在线播放一区二区三区| 亚洲女人天堂av| 久久亚洲资源| 91精品国产综合久久久蜜臀粉嫩 | youjizz.com亚洲| 亚洲毛片一区| 91视频婷婷| 91亚洲人成网污www| 日本乱人伦a精品| 精品亚洲精品| 久久久在线视频| 日本精品在线观看| 久久国产精品电影| 日韩综合av| 色777狠狠综合秋免鲁丝| 一区二区电影免费观看| 亚洲精品v欧美精品v日韩精品| 国产激情视频在线| 日韩欧美亚洲另类制服综合在线| a级片国产精品自在拍在线播放| 欧美日韩精品一区二区在线播放| 国产精品久久一区二区三区不卡| 欧美在线免费观看亚洲| av电影在线观看网址| 欧美日韩精品免费观看视频| 日本三级视频在线播放| 日韩午夜在线观看视频| 成全电影大全在线观看| 亚洲第一区第一页| 成人va天堂| 久久视频在线直播| 成人在线tv视频| 国产精品美乳一区二区免费| 91成人精品视频| 黑人巨大精品欧美一区二区小视频| 国产综合亚洲精品一区二| 欧美日韩免费高清| 韩国女主播成人在线观看| 国产手机免费视频| 国产精品免费看片| 在线影视一区| 7777精品伊人久久久大香线蕉的 | 91九色在线观看| 99精品视频免费全部在线| 婷婷四月色综合| av在线不卡电影| 美女免费免费看网站| 日韩欧美一区二区三区久久| 老司机亚洲精品| 九色成人免费视频| 黄色在线视频观看网站| 欧美国产乱子伦| 成人精品一区二区三区| 超碰在线97国产| 91精品久久| 日韩精品一区二区三区视频在线观看| 欧美人动性xxxxz0oz| 在线成人激情黄色| 国产伦精品一区二区三区在线播放| 国产精品大片wwwwww| 精品69视频一区二区三区Q| 日韩av电影免费播放| 成人成人成人在线视频| 18av网站| 91麻豆精品91久久久久久清纯| 波多野结衣久久精品| 久久亚洲国产精品成人av秋霞| 蜜臀av一级做a爰片久久| 国产日韩欧美在线视频观看| 中文久久精品| 欧美黄网站在线观看| 亚洲一区二区中文在线| 亚洲第一图区| 久久久久国产精品www| 中文字幕免费一区二区| 色中文字幕在线观看| 国产精品久久久久7777按摩| 91社区在线观看播放| 自拍偷拍亚洲区| 欧美影视一区| 久久久亚洲国产精品| 亚洲精品第一国产综合野| 91麻豆免费在线视频| 欧美精品激情在线观看| 午夜在线精品| 激情校园亚洲图片| 日韩精品小视频| 久久久久久久久国产一区| 青青在线免费观看| 在线视频你懂得一区二区三区| www.成人| 亚洲国产精品123| 亚洲一二三级电影| 国产亚洲人成a在线v网站| www日韩av| 国产精品私人自拍| 国产乱码精品一区二三赶尸艳谈| 6080yy精品一区二区三区| 狠狠色丁香久久婷婷综| 欧美日本网站| 午夜精品一区二区三区在线| 狠狠色丁香婷婷综合久久片| 都市激情在线视频| 欧洲成人免费aa| 95精品视频在线| 99re6在线精品视频免费播放| 亚洲aa在线观看| 中文字幕不卡在线播放| 欧美日韩精品一区二区三区视频| 国内精品二区| 亚洲一区二区在线视频| 日韩成人久久| 男女视频网站在线观看| 亚洲第一av网站| 中文日韩在线| 国产三区四区在线观看| 国产精品久久久久9999| 欧美国产成人精品| 成人性片免费| 99亚洲国产精品| 亚洲国产精品免费| 丝袜亚洲另类欧美| 免费在线午夜视频| 国产精品嫩草在线观看| 黄色精品一区二区| 国产一区二区三区天码| 国产对白国语对白| 午夜伦理精品一区| 中文字幕欧美国产| 中文字幕视频精品一区二区三区| 黄色一级视频在线播放| 亚洲网站在线播放| 国内精品久久久久影院一蜜桃| xxxx成人| 在线丝袜欧美日韩制服| 亚洲国内精品视频| 久草中文综合在线| 久草在线资源福利站| 手机福利在线视频| 亚洲色图av在线| 国产一区二区电影| 久久精品超碰| 无码精品国产一区二区三区免费| 欧美另类在线观看| 日本一区二区视频在线观看| 91精品啪在线观看国产爱臀| 三上悠亚在线资源| 国产精品久久久久久久久久免费| 亚洲成人一二三| 在线精品一区二区| 四虎影院观看视频在线观看| 色吧亚洲视频| 一本色道久久综合狠狠躁篇的优点 | 久久久美女毛片 | 在线观看成人免费视频| 欧美三级乱码| 手机在线免费看av| 伊人天天久久大香线蕉av色| 亚洲一区二区福利| 国产亚洲欧美日韩在线一区| 国产精品欧美在线观看| 国产主播福利在线| 一本一本a久久| 中文字幕精品一区二区精品| 久久精品人人做人人爽97| 视频国产一区| 永久免费av在线| 男女啪啪免费观看| 欧美日韩福利电影| 亚洲成人久久影院| 久久黄色网页| 日韩三级久久| 黄色在线免费观看大全| 中国一级大黄大黄大色毛片| 欧美久久精品一级黑人c片|