国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

微信也在用的Transformer加速推理工具,現在騰訊開源了

新聞 開發工具
近年來,基于Transformer的模型,可以說是在NLP界殺出了一片天地。雖然在提高模型模型精度上,Transformer發揮了不容小覷的作用,但與此同時,卻引入了更大的計算量。

 本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

近年來,基于Transformer的模型,可以說是在NLP界殺出了一片天地。

雖然在提高模型模型精度上,Transformer發揮了不容小覷的作用,但與此同時,卻引入了更大的計算量

那么,這個計算量有多大呢?

來看下數據。

微信也在用的Transformer加速推理工具,現在騰訊開源了

因此,實現一個能充分發揮CPU/GPU硬件計算能力的Transformer推理方法,就成了急需解決的問題。

近日,騰訊便開源了一個叫TurboTransformers的工具,對Transformer推理過程起到了加速作用,讓你的推理引擎變得更加強大。

微信也在用的Transformer加速推理工具,現在騰訊開源了

這個工具已經在微信、騰訊云、QQ看點等產品中廣泛應用,在線上預測場景中可以說是“身經百戰”。

Turbo具有如下三大特性

  • 優異的CPU/GPU性能表現。
  • 為NLP推理任務特點量身定制。
  • 簡單的使用方式。

值得一提的是,TurboTransformers,是騰訊通過Github對外開源的第100個項目。

那么,具有如此“紀念意義”的開源工具,到底有多厲害?

接下來,我們將一一講解。

多項性能測試“摘桂冠”

Turbo在CPU/GPU性能上的表現可以說是非常優異。

在多種CPU和GPU硬件上獲得了超過pytorch/tensorflow和目前主流優化引擎的性能表現。

微信也在用的Transformer加速推理工具,現在騰訊開源了

CPU上的測試結果

首先,是在CPU 硬件平臺上,測試了 TurboTransformers 的性能表現。

選擇 pytorch、pytorch-jit 和 onnxruntime-mkldnn 和 TensorRT 實現作為對比。

性能測試結果為迭代 150 次的均值。為了避免多次測試時,上次迭代的數據在 cache 中緩存的現象,每次測試采用隨機數據,并在計算后刷新的 cache 數據。

下圖是Intel Xeon 6133 CPU的性能測試結果。

微信也在用的Transformer加速推理工具,現在騰訊開源了
微信也在用的Transformer加速推理工具,現在騰訊開源了

GPU上的測試結果

其次,是在GPU硬件平臺上,測試了 TurboTransformers 的性能表現。

選擇對比的對象分別是:pytorch、NVIDIA Faster Transformers、onnxruntime-gpuTensorRT。

性能測試結果為迭代 150 次的均值。

下圖是在NVIDIA RTX 2060 GPU的性能測試結果。

微信也在用的Transformer加速推理工具,現在騰訊開源了
微信也在用的Transformer加速推理工具,現在騰訊開源了

接下來,是在NVIDIA P40 GPU的性能測試結果。

微信也在用的Transformer加速推理工具,現在騰訊開源了
微信也在用的Transformer加速推理工具,現在騰訊開源了

最后,是在NVIDIA V100 GPU的性能測試結果。

微信也在用的Transformer加速推理工具,現在騰訊開源了
微信也在用的Transformer加速推理工具,現在騰訊開源了

Turbo技術原理

能夠取得如此好的推理性能,這背后的計算原理又是什么呢?

TurboTransformers的軟件架構如下圖,它讓微信內部眾多NLP線上應用能夠充分榨取底層硬件的計算能力,讓算法更好地服務的用戶。

具體來說TurboTransformers可以在算子優化、框架優化和接口部署方式簡化三個方面做了工作。

微信也在用的Transformer加速推理工具,現在騰訊開源了

算子層優化

Transformer都包含了什么計算呢?

如下圖所示,圖(a)展示了論文Transformer結構示意圖,這里稱灰色方框內的結構為一個Transformer Cell,BERT encoder堆疊了Nx個這樣的Transformer Cell。

圖(b)將一個Cell的細節加以展開,每一個矩形都是一個獨立的計算核心。

微信也在用的Transformer加速推理工具,現在騰訊開源了

Transformer Cell計算包含了8個GEMM(通用矩陣乘法,General Matrix Multiplication)運算。通過調優Intel MKL和cuBLAS的GEMM調用方式來獲得最佳GEMM性能。

并且在硬件允許條件下,在GPU上使用tensor core方式進行GEMM運算。

類似NVIDIA FasterTransformers方案,將所有GEMM運算之間的計算融合成一個調用核心。融合會帶來兩個好處,一是減少了內存訪問開銷,二是減少多線程啟動開銷。

對于這些核心,在CPU上采用openmp進行并行,在GPU上使用CUDA進行優化實現。

對于比較復雜的LayerNorm和Softmax算子,它們包含了不適合GPU上并行的規約操作,TurboTransformers為它們設計了創新并行算法,極大降低了這些算子的延遲。

理論上Transformers推理延遲應該近似于矩陣乘法延遲。

框架層優化

TurboTransformers采用了一個有效的內存管理方式。

由于NLP的采用變長輸入特性,每次運算中間結果的大小其實并不相同。為了避免每次都分配釋放內存,研究人員通過Caching方式管理顯存。

為了能夠無縫支持pytorch/tensorflow訓練好的序列化模型,提供了一些腳本可以將二者的預訓練模型轉化為npz格式,供TurboTransformers讀入。

特別的,考慮到pytorch huggingface/transformers是目前最流行的transformers訓練方法,支持直接讀入huggingface/transformers預訓練模型。

應用部署

Turbo提供了C++和Python調用接口,可以嵌入到C++多線程后臺服務流程中,也可以加入到pytorch服務流程中。

研究人員建議TurboTransformers通過docker部署,一方面保證了編譯的可移植性,另一方面也可以無縫應用于K8S等線上部署平臺。

傳送門

GitHub項目地址:https://github.com/Tencent/TurboTransformers/blob/master/README_cn.md

責任編輯:張燕妮 來源: 量子位
相關推薦

2012-12-21 15:09:10

微 信 不是

2024-03-12 12:17:06

AI數據

2025-02-18 13:30:00

2021-01-19 19:06:00

微信企業微信騰訊

2020-12-04 09:21:05

工具設計開發

2022-01-11 20:50:12

微信企業微信移動應用

2023-04-07 18:37:46

2019-05-25 14:58:06

車載微信微信語音交互

2020-11-26 18:01:35

微博

2024-11-11 08:50:24

2018-03-07 11:11:46

微信開源小程序

2020-11-04 10:18:59

微信

2024-08-30 08:12:17

開源微信小程序

2013-07-01 11:32:27

騰訊微信藍牙耳機

2020-09-07 14:00:23

騰訊微博微信互聯網

2020-08-13 15:20:49

騰訊WeChat微信

2017-01-06 13:45:47

騰訊云微信生態

2013-09-25 11:12:47

2021-08-31 20:07:48

微信騰訊移動應用

2023-12-09 09:44:07

MetaFacebook開源
點贊
收藏

51CTO技術棧公眾號

在线毛片网站| 自拍视频在线看| 日韩大片在线永久免费观看网站| 麻豆视频观看网址久久| 精品精品国产国产自在线| 亚洲国产精品高清久久久| 波多野结衣在线中文| 26uuu精品一区二区三区四区在线 26uuu精品一区二区在线观看 | 成人在线二区| 欧美伊人久久久久久午夜久久久久| 黄色网址免费在线观看| 在线看日本不卡| 黄动漫网站在线观看| 久久免费视频一区| 欧美黑人又粗又大又爽免费| 国产综合色在线| 天天综合中文字幕| 国产乱码精品一区二区三区av| 久久一区二区精品| 亚洲九九在线| x99av成人免费| 日韩一级二级| 欧美性大战久久| 日本精品久久久久久久久久| 欧美丰满日韩| 伊人久久青草| 制服丝袜亚洲精品中文字幕| 高清无码视频直接看| 大地资源中文在线观看免费版| 午夜精品久久| 日本精品久久久久影院| 亚洲一区二区三区日本久久九| 在线国产精品视频| 欧美成人第一页| 久久福利综合| 午夜免费一区二区| 中文字幕亚洲专区| 理论片日本一区| www在线视频| 欧美尤物巨大精品爽| 国产做a爰片久久毛片| 男女视频在线观看免费| 国产精品一香蕉国产线看观看| 日本最新不卡在线| 亚洲xxxx2d动漫1| 亚洲自拍另类综合| 免费a级在线播放| 中文字幕在线亚洲| 亚洲老妇激情| 9l视频白拍9色9l视频| 亚洲国产一区视频| 黄色大片在线看| 在线视频亚洲欧美| 日韩电影免费网站| 国产日韩一区欧美| 国产精品多人| 欧美成熟毛茸茸复古| 国产精品国产三级国产普通话三级| 欧美理伦片在线播放| 午夜av区久久| 欧美另类高清视频在线| 成人美女视频在线观看| 国产毛片在线| 4k岛国日韩精品**专区| 3d成人动漫在线| 亚洲天堂av在线免费| 麻豆精品视频在线观看免费| 污视频网站免费在线观看| 欧美午夜视频在线| 精品成人a区在线观看| 成人小视频免费观看| 97欧美成人| 久久精品视频va| 国产jizzjizz一区二区| 国产成人免费9x9x人网站视频| 奇米4444一区二区三区| 高清在线不卡av| 在线中文字幕-区二区三区四区| 欧美中文在线字幕| 91在线精品一区二区| 成人在线中文| 日本视频一区二区在线观看| 欧美丰满嫩嫩电影| 亚洲精品影视| 超免费在线视频| 久精品国产欧美| 日本一区二区综合亚洲| 色多多视频在线观看| 欧美成人黄色小视频| 中文字幕在线播放不卡一区| 激情久久一区| 97在线观看免费高清视频| 日韩欧美在线视频日韩欧美在线视频| 很黄很污的网站| 国产精品嫩草影院av蜜臀| 国产3p露脸普通话对白| 激情91久久| 邻居大乳一区二区三区| 丁香五月网久久综合| 欧美日韩久久一区二区| 国产经典欧美精品| 国产激情久久久久| 在线欧美福利| 97人人做人人爽香蕉精品| 97色伦图片97色伦在线电影| 亚洲最新免费视频| 欧美高清在线视频| 亚洲免费黄色| 伊人久久大香线蕉| 精品视频成人| 蜜桃视频在线观看免费视频| 国产一级网站视频在线| 99re在线视频免费观看| 77777少妇光屁股久久一区| 亚洲成人综合网站| 国产日韩欧美一区二区三区在线观看| 国产蜜臀一区二区打屁股调教| 高清在线观看免费| 亚洲最大的网站| 国模叶桐国产精品一区| 亚洲特黄一级片| 日韩精品一二区| 中文字幕不卡三区视频| 91九色在线观看视频| 久久视频国产精品免费视频在线| 男女视频一区二区| 国产在线激情| 午夜成人影视| 污视频免费在线看| 久久艹中文字幕| 午夜免费久久看| 黄色成人在线网站| 日本在线观看| 精品嫩模一区二区三区| 色偷偷av一区二区三区乱| 136国产福利精品导航网址| 九热视频在线观看| 国产日韩欧美综合| 久久99精品国产99久久6尤物| 欧美日韩国产在线观看| 午夜久久久久久| 色黄网站在线观看| 日韩免费一区二区三区| 国产情侣第一页| 国产精品wwwww| 999在线免费视频| 日本久久精品一区二区| 国产福利a级| 国产毛片在线| 成人天堂yy6080亚洲高清| 91国产一区| 韩国一区二区三区在线观看| 黄色另类av| 日韩主播视频在线| 麻豆成人精品| 国产欧美在线| aⅴ色国产欧美| 亚洲午夜91| 天堂久久一区二区三区| 精品一区二区精品| 国产精一品亚洲二区在线视频| 国产乱码精品一区二区三区av| 美女在线一区二区| 国产91丝袜在线播放0| 成人自拍视频在线| 久久精品人人| 99精品久久久| 欧美日中文字幕| 男女av在线| 亚洲自拍偷拍一区二区三区| 久久精品影视伊人网| 国产精品沙发午睡系列990531| 亚洲香蕉视频| 噜噜噜噜噜在线视频| 亚洲啊啊啊啊啊| 午夜精品久久久久久久男人的天堂| 欧美中文字幕不卡| 国产三级精品视频| 国产一区一一区高清不卡| 国产v亚洲v天堂无码久久久| 91精品久久久久久久久久另类| 丁香五月网久久综合| 中文字幕第5页| 麻豆影视在线观看_| 亚洲网友自拍| 中文日本在线观看| 成人手机在线| 免费成人在线视频网站| 亚洲色精品三区二区一区| 色哟哟免费网站| 在线视频尤物| 精品国产第一国产综合精品| 日本网站在线观看一区二区三区| 亚洲天天做日日做天天谢日日欢 | 日韩欧美一中文字暮专区| 中文字幕中文字幕在线中高清免费版 | 日本一道高清亚洲日美韩| 一区二区电影在线观看| 午夜不卡av免费| 国产自产女人91一区在线观看|