国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大模型推理效率無損提升3倍,滑鐵盧大學、北京大學等機構發布EAGLE

人工智能 新聞
近日,滑鐵盧大學、加拿大向量研究院、北京大學等機構聯合發布 EAGLE,旨在提升大語言模型的推理速度,同時保證模型輸出文本的分布一致。這種方法外推 LLM 的第二頂層特征向量,能夠顯著提升生成效率。

大語言模型(LLM)被越來越多應用于各種領域。然而,它們的文本生成過程既昂貴又緩慢。這種低效率歸因于自回歸解碼的運算規則:每個詞(token)的生成都需要進行一次前向傳播,需要訪問數十億至數千億參數的 LLM。這導致傳統自回歸解碼的速度較慢。

近日,滑鐵盧大學、加拿大向量研究院、北京大學等機構聯合發布 EAGLE,旨在提升大語言模型的推理速度,同時保證模型輸出文本的分布一致。這種方法外推 LLM 的第二頂層特征向量,能夠顯著提升生成效率。


  • 技術報告:https://sites.google.com/view/eagle-llm
  • 代碼(支持商用 Apache 2.0):https://github.com/SafeAILab/EAGLE

EAGLE 具有以下特點:

  • 比普通自回歸解碼(13B)快 3 倍;
  • 比 Lookahead 解碼(13B)快 2 倍;
  • 比 Medusa 解碼(13B)快 1.6 倍;
  • 可以證明在生成文本的分布上與普通解碼保持一致;
  • 可以在 RTX 3090 上進行訓練(1-2 天內)和測試;
  • 可以與 vLLM、DeepSpeed、Mamba、FlashAttention、量化和硬件優化等其他平行技術結合使用。

圖片

加速自回歸解碼的一種方法是投機采樣(speculative sampling)。這種技術使用一個更小的草稿模型,通過標準自回歸生成來猜測接下來的多個詞。隨后,原始 LLM 并行驗證這些猜測的詞(只需要進行一次前向傳播進行驗證)。如果草稿模型準確預測了 α 詞,原始 LLM 的一次前向傳播就可以生成 α+1 個詞。

在投機采樣中,草稿模型的任務是基于當前詞序列預測下一個詞。使用一個參數數量顯著更少的模型完成這個任務極具挑戰性,通常會產生次優結果。此外,標準投機采樣方法中的草稿模型獨立預測下一個詞而不利用原始 LLM 提取的豐富語義信息,導致潛在的效率低下。

這個局限啟發了 EAGLE 的開發。EAGLE 利用原始 LLM 提取的上下文特征(即模型第二頂層輸出的特征向量)。EAGLE 建立在以下第一性原理之上:

特征向量序列是可壓縮的,所以根據前面的特征向量預測后續特征向量比較容易。

EAGLE 訓練了一個輕量級插件,稱為自回歸頭(Auto-regression Head),與詞嵌入層一起,基于當前特征序列從原始模型的第二頂層預測下一個特征。然后使用原始 LLM 的凍結分類頭來預測下一個詞。特征比詞序列包含更多信息,使得回歸特征的任務比預測詞的任務簡單得多??傊?,EAGLE 在特征層面上進行外推,使用一個小型自回歸頭,然后利用凍結的分類頭生成預測的詞序列。與投機采樣、Medusa 和 Lookahead 等類似的工作一致,EAGLE 關注的是每次提示推理的延遲,而不是整體系統吞吐量。

EAGLE——一種增強大語言模型生成效率的方法

圖片

上圖顯示了 EAGLE 與標準投機采樣、Medusa 以及 Lookahead 關于輸入輸出的區別。下圖展示了 EAGLE 的工作流程。在原始 LLM 的前向過程中,EAGLE 從第二頂層收集特征。自回歸頭以這些特征以及此前生成的詞的詞嵌入作為輸入,開始猜下一個詞。隨后,使用凍結的分類頭(LM Head)確定下一個詞的分布,使 EAGLE 能夠從這個分布中進行采樣。通過多次重復采樣,EAGLE 進行了類似樹狀的生成過程,如下圖右側所示。在這個例子中,EAGLE 的三次前向傳播 “猜” 出了 10 個詞組成的樹。

圖片

EAGLE 使用輕量級的自回歸頭來預測原始 LLM 的特征。為了確保生成文本分布的一致性,EAGLE 隨后驗證預測的樹狀結構。這個驗證過程可以使用一次前向傳播完成。通過這個預測和驗證的循環,EAGLE 能夠快速生成文本詞。

訓練自回歸頭代價很小。EAGLE 使用 ShareGPT 數據集進行訓練,該數據集包含不到 70,000 輪對話。自回歸頭的可訓練參數數量也很少。如上圖中的藍色部分所示,大多數組件都是凍結的。唯一要額外訓練的是自回歸頭,這是一個單層 Transformer 結構,具有 0.24B-0.99B 參數。即使是 GPU 資源不足的情況下,也可以訓練自回歸頭。例如,Vicuna 33B 的自回歸頭可以在 8 卡 RTX 3090 服務器上在 24 小時內完成訓練。

為什么使用詞嵌入來預測特征?

Medusa 僅使用第二頂層的特征來預測下一個詞,下下個詞......與 Medusa 不同,EAGLE 還動態地將當前采樣得到的詞嵌入作為自回歸頭輸入的一部分來進行預測。這額外的信息幫助 EAGLE 處理抽樣過程中不可避免的隨機性??紤]下圖中的例子,假設提示詞是 “I”。LLM 給出了 “I” 后面跟著 “am” 或 “always” 的概率。Medusa 不考慮是抽樣了 “am” 還是 “always”,直接預測 “I” 下下個詞的概率。因此,Medusa 的目標是,在只給定 “I” 的基礎上,預測 “I am” 或 “I always” 的下一個詞。由于抽樣過程的隨機性,Medusa 的相同輸入 “I” 可能有不同的下下個詞輸出 “ready” 或 “begin”,導致輸入和輸出之間缺乏一致的映射。相比之下,EAGLE 的輸入包括了抽樣結果的詞嵌入,確保了輸入和輸出之間的一致映射。這種區別使 EAGLE 能夠考慮抽樣過程建立的上下文,進而更準確地預測后續詞。

圖片

樹狀生成結構

與投機采樣、Lookahead 和 Medusa 等其他猜測 - 驗證框架不同,EAGLE 在 “猜詞” 階段采用類似樹狀的生成結構,進而實現了更高的解碼效率。如圖所示,標準投機采樣和 Lookahead 的生成過程是線性或鏈式的。Medusa 的方法由于在猜測階段無法構建上下文,故通過笛卡爾積生成樹,導致相鄰層之間形成全連接圖。這種方法經常導致無意義的組合,例如 “I am begin”。對比之下,EAGLE 創建了一個更稀疏的樹結構。這種稀疏的樹結構防止形成無意義的序列,將計算資源集中在更合理的詞組合上。

圖片

多輪投機采樣

標準投機采樣方法在進行 “猜詞” 的過程中保持了分布的一致性。為了適應樹狀猜詞場景,EAGLE 將這種方法擴展成了多輪遞歸形式。下面呈現了多輪投機采樣的偽代碼。在樹狀生成過程中,EAGLE 記錄了每個抽樣詞對應的概率。通過多輪投機采樣,EAGLE 確保最終生成的每個詞的分布與原始 LLM 的分布保持一致。

圖片

更多實驗結果

下圖展示了 EAGLE 在 Vicuna 33B 上關于不同任務中的加速效果。涉及大量固定模板的 “編程”(coding)任務顯示出最佳的加速性能。

圖片

歡迎大家體驗 EAGLE,并通過 GitHub issue 反饋建議:https://github.com/SafeAILab/EAGLE/issues

責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-04-02 11:23:17

Hadoop優酷

2023-09-19 13:48:02

2012-02-03 11:13:49

北京大學浪潮高性能計算

2012-11-28 16:05:47

應用交付負載均衡AD

2015-11-23 17:37:54

51社保

2009-08-17 11:02:25

2012-08-04 08:16:39

戴爾

2024-12-23 09:10:00

2025-06-10 09:07:00

2016-04-14 16:21:38

2025-04-11 09:15:00

語言模型AI數據

2025-03-17 09:15:00

模型訓練AI

2025-11-19 08:51:13

2015-02-06 09:23:52

賽可達實驗室網絡安全

2025-07-18 09:55:11

2010-07-29 16:40:39

北京大學CIO結業

2011-05-20 13:50:02

2025-02-12 12:04:54

點贊
收藏

51CTO技術棧公眾號

精品精品99| 97欧美精品一区二区三区| 精品亚洲综合| 9999在线观看| 亚洲少妇视频| 一区二区黄色| 欧美精品久久久久久久久老牛影院| 久久99青青精品免费观看| 日本大片免费看| 992tv在线成人免费观看| 免费cad大片在线观看| 夜夜爽夜夜爽精品视频| 国产91在线播放精品91| hd国产人妖ts另类视频| 午夜激情一区二区| av无码精品一区二区三区| 最新国产露脸在线观看| 亚洲人成人一区二区在线观看 | 精品一区二区亚洲| 欧美女优在线观看| 亚洲视频在线免费| 精品视频一区二区不卡| 2020中文字幕在线| 99久久久久免费精品国产| 亚洲日本japanese丝袜| 99在线观看免费视频精品观看| 国产精品亚洲综合天堂夜夜| 激情小说一区| 精品国产一区二区在线| 成人精品视频一区二区| 77成人影视| 中文字幕在线看视频国产欧美在线看完整| 激情在线小视频| 欧美日韩国产系列| 亚洲国产精品毛片| 粉嫩91精品久久久久久久99蜜桃| 日韩欧美一级二级| 日本三级在线播放完整版| 91激情在线视频| 久久免费看视频| 欧美日韩另类字幕中文| 久久综合中文色婷婷| 日本午夜一区| 日韩欧美www| 蜜桃视频在线观看www社区 | 国产精品网址在线| 欧美交a欧美精品喷水| 欧美国产精品va在线观看| 试看120秒一区二区三区| 欧美激情在线播放| 一区二区美女| 在线成人av影院| 在线免费看av| 精品美女在线观看| 福利在线免费| 亚洲美女免费视频| 成人a视频在线| 久久精品国产秦先生| 亚洲资源视频| 国产成人小视频| 免费在线观看亚洲视频 | 国产精品网站免费| 99精品美女| 114国产精品久久免费观看| 欧美激情麻豆| 欧美日韩xxxxx| 日韩极品在线| 99精品欧美一区二区三区| 最新亚洲激情| 久久久人成影片一区二区三区观看| 一级毛片视频在线| 亚洲国产精品久久91精品| 精品176极品一区| 日本精品久久久| 亚洲色诱最新| 97在线精品国自产拍中文| 亚洲三级网址| 久久99国产精品| 91在线精品一区二区| 少妇激情av一区二区三区| 欧美日本一道本| 国产精品xnxxcom| 欧美第一区第二区| 精品久久在线| 国产精品最新在线观看| 日本女人一区二区三区| 丰满少妇在线观看| 欧美色图一区二区三区| 日韩在线免费| 国产精品91在线| 韩国三级在线一区| 伊人成综合网站| 精品无人区太爽高潮在线播放 | 毛片毛片毛片毛片毛片毛片| 中文字幕一区二区av| 国产精品扒开腿做爽爽爽的视频| 国产精品videossex| 亚洲欧美日韩一区二区三区在线观看| 欧美变态视频| 亚洲国产精品久久| 欧美另类69xxxxx| 亚洲亚洲精品三区日韩精品在线视频| 国产精品国产三级国产aⅴ中文| 国产大尺度在线观看| 国产精品麻豆久久久| 国产日产一区二区| 久久久久五月天| 国产亚洲一级| 天天噜天天色| 久久久精品2019中文字幕神马| 欧美日一区二区三区在线观看国产免| 波多野结衣家庭教师在线播放| 欧美三级日本三级少妇99| 中文久久电影小说| 欧美日韩国产综合草草| 一卡二卡欧美日韩| 午夜在线激情影院| 国产精欧美一区二区三区| 国产伦精品一区二区三区免费| 在线播放免费| 欧美精品在线第一页| 蜜臀av在线播放一区二区三区| 操操操综合网| 欧美大片第1页| 国产黄人亚洲片| 激情视频在线观看| 国产精品v片在线观看不卡| av综合在线播放| 深夜av在线| 欧美成人蜜桃| 成人自拍在线| 一道精品一区二区三区| 亚洲va国产va欧美va观看| 欧美一区在线观看视频| 一区二区冒白浆视频| 欧美亚洲动漫精品| 欧美xxxx视频| 91免费福利视频| 午夜激情一区| 毛片视频免费| 国内外成人免费激情在线视频| 国产aⅴ综合色| 久久久国产欧美| 亚洲精品一区二区在线观看| www.色在线| 国产精品视频500部| 亚洲自拍欧美精品| 影视先锋久久| 蜜桃视频中文字幕| 欧美最猛性xxxx| 亚洲精品国产成人久久av盗摄| 亚洲天堂av资源在线观看| 国产一区二区在线视频播放| 一区二区三区高清国产| 国产99久久久精品| 国精品产品一区| 黄色影院一级片| 欧美日韩国产激情| 神马影视一区二区| 国产黄视频在线观看| 国产精品福利观看| 精品久久久一区| 99精品电影| 日韩精品成人av| 色综合久久久久久久久五月| 欧美成人vps| 国产麻豆视频一区| 成人污版视频| 369你懂的电影天堂| 日韩免费在线看| 丰满岳妇乱一区二区三区| 亚洲午夜激情在线| 成人免费一区二区三区牛牛| 一本一道久久久a久久久精品91| 亚洲午夜性刺激影院| 夜夜躁狠狠躁日日躁2021日韩| 日韩av在线中文| 97超级碰碰碰久久久| 亚洲精品视频在线观看免费| 蜜桃成人av| 秋霞av在线| 欧美三级网色| 国产亚洲综合久久| 国产精品午夜电影| 希岛爱理一区二区三区| 久久99久久99精品| 久久久久久999| 亚洲伊人伊色伊影伊综合网| 国产精品97| 国产精品69xx| 日本www在线播放| 日本中文字幕久久看| 91国模大尺度私拍在线视频| 日韩和欧美一区二区三区| 老司机2019福利精品视频导航| 免费观看成人网| 亚洲一区中文字幕在线观看| 欧美精品一区二区三区蜜桃| 2021国产精品久久精品| 成人一区而且|