国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

策略學習助力LLM推理效率:MIT與谷歌團隊提出異步并行生成新范式

人工智能 新聞
研究團隊不依賴人工設計規則來識別異步生成機會,而通過策略學習讓模型自主發現并標注這些機會,系統地優化質量與速度的平衡。

金天,麻省理工學院(MIT)計算機科學與人工智能實驗室(CSAIL)博士五年級學生,師從 Michael Carbin 和 Jonathan Ragan-Kelley。他主要研究機器學習與編程系統的結合。此前曾在 IBM Research 主導實現深度神經網絡在 IBM 主機上的推理部署。本科畢業于 Haverford College,獲計算機科學與數學雙學位。

鄭鈺熹,麻省理工學院 CSAIL 博士三年級學生,師從 Michael Carbin。她的研究方向為編程語言與機器學習的交叉領域。

大語言模型(LLM)的生成范式正在從傳統的「單人書寫」向「分身協作」轉變。傳統自回歸解碼按順序生成內容,而新興的異步生成范式通過識別語義獨立的內容塊,實現并行生成。

圖片

如圖所示,傳統方法(下)按順序生成所有內容,而異步生成(上)同時處理多個互不依賴的內容塊。對比順序生成,異步生成在 AlpacaEval 長度控制評測中實現 1.21-1.93× 的幾何平均提速,對應生成質量變化(勝率)為 +2.2% 至 -7.1%。

MIT 與谷歌研究團隊在最新研究 PASTA(PArallel STructure Annotation)中首次從策略學習(policy learning)角度探索異步生成范式的可能。

圖片

  • 論文標題:Learning to Keep a Promise: Scaling Language Model Decoding Parallelism with Learned Asynchronous Decoding
  • 論文地址:https://arxiv.org/abs/2502.11517

研究團隊不依賴人工設計規則來識別異步生成機會,而通過策略學習讓模型自主發現并標注這些機會,系統地優化質量與速度的平衡。這種方法使 LLM 根據內容特點自適應地確定最佳異步生成策略,為生成效率優化開創學習驅動的全新路徑。

PASTA-LANG:劃分獨立內容的標記語言

研究人員首先開發了一種新的標記語言 PASTA-LANG,專為異步生成而設計。大模型使用它在生成過程中標記語義獨立塊,指示并行生成機會。這種語言包含三種核心標記:

  • <promise topic="..."/>:標記語義獨立的內容塊,通過 topic 屬性總結內容主題,大模型用它表明「這部分將會由一個獨立子線程異步生成」。
  • <async>...</async>:在 <promise> 后標識對應的異步生成的內容,表示這一部分由獨立子線程負責生成。
  • <sync/>:在主線程標記同步點,表明后續內容生成將會依賴于之前的異步生成,主線程需等待所有異步線程完成后才能繼續。

這些標記共同構成了一種「承諾-履行」的生成模式:大模型首先通過 <promise/> 標記「承諾」生成某些內容,推理系統再創建異步線程來「履行」這些承諾,最后在 <sync/> 處將異步內容組合。

圖片

如圖所示的線段長度計算案例展示了這一機制:面對計算任務(A),大模型首先識別出「坐標提取」和「長度公式」兩個可并行的獨立部分,生成相應的 <promise/> 標記(B),隨后用 <sync/> 標記(E)表明需要等待這些內容完成。圖中紅色和綠色區域(C、D)顯示了兩個異步線程并行生成的內容,最終在(F)處組合成完整解答。

這個新的標記語言簡單,可擴展性強,開啟了新的未來研究范式。

PASTA 訓練:從標注到優化的雙階段學習

圖片

如圖所示,PASTA 系統采用雙階段訓練流程,使大模型自主學習使用上述標記語言,完成異步生成。

第一階段:監督微調。研究團隊首先選取 SlimOrca 指令跟隨數據集,用 Gemini 1.5 Flash 為 100K 條樣本添加 PASTA-LANG 標記,在樣本回答中插入 <promise/><async> 和 <sync/> 標記,創建 PASTA 微調數據集。團隊隨后對 Gemma 7B 進行監督微調,得到能插入 PASTA-LANG 標記的 PASTA-SFT 模型。

第二階段:偏好優化。為優化標注策略,團隊設計了策略學習方案。團隊對每個樣本從 PASTA-SFT 模型采樣多種標注方案,然后基于兩項指標評估這些方案:理論加速比和內容質量(由 Gemini 1.5 Pro 評估)。根據評估結果,團隊構建「拒絕采樣數據集」,該數據集包含每個輸入的最佳和最差標注方案。最后,團隊用 BoNBoN 算法對 PASTA-SFT 模型進行偏好優化,得到最終的 PASTA 模型。

PASTA 推理系統:并行生成與緩存管理

推理系統設計難點。異步并行生成的主要挑戰在于如何協調多個線程高效協作。傳統方法通常需要為每個線程創建獨立的 KV 緩存池——創建新線程時必須復制主線程的前綴內容到子線程緩存池,完成后再復制結果回主線程。這兩次大規模矩陣復制操作嚴重限制了系統性能,使理論加速難以轉化為實際收益。

KV 緩存的存儲布局。PASTA 設計了交錯式 KV 緩存布局,所有線程共享單一連續內存池。系統初始以連續方式存儲用戶輸入,在推理過程中動態將不同線程在同一時間點生成的 token 交錯存儲在相鄰位置。

注意力控制與位置編碼。PASTA 通過兩個機制確保大模型正確理解多線程交錯存儲的 KV 緩存:

  • 注意力掩碼控制:限制子線程只能訪問與自己相關的內容,在<sync/>后通過移除掩碼使主線程能訪問所有子線程生成的內容。
  • 位置編碼調整:每個線程都使用獨立且連續的位置編碼,使線程處理自己的內容時,將交錯存儲的內容視為邏輯上連續的序列,確保模型能正確理解上下文。

這些設計共同確保 PASTA 能在提高速度的同時保持輸出質量。

實驗結果:Pareto 最優與可擴展性

PASTA 在性能與質量的平衡上取得了突破性成果,實驗結果表明它不僅實現了顯著加速,還在某些情況下提高了輸出質量。研究團隊在 AlpacaEval 基準上進行了全面評估,該基準包含 805 個具有代表性的指令跟隨任務。

圖片

圖片

質量-速度平衡的 Pareto 前沿。如圖所示,PASTA 通過調節質量權重參數生成了一系列的模型。在不同的生成質量的情況下,PASTA 均能提供非常可觀的加速。結果顯示,即使最注重質量的 PASTA 模型也能提供顯著加速,而最快的模型則以一定的質量犧牲換取接近 2 倍的速度提升。與基于手動設計的異步生成方案(Skeleton-of-Thought, APAR)相比,PASTA 模型展現出全面優勢。

可擴展性。研究結果展示了 PASTA 方法出色的可擴展性,如圖所示。隨著偏好優化不斷推進,PASTA 模型的性能持續提升。圖中清晰展示了從第一輪開始到第一輪結束,再到第二輪開始和第二輪后半程的整個優化過程,質量-速度的 Pareto 前沿大體持續向右上方推進。

這種穩定的改進趨勢表明,PASTA 方法具有良好的可擴展性——隨著投入更多計算資源,仍未飽和。與傳統依賴固定規則的異步解碼方法不同,PASTA 通過策略學習驅動的訓練算法提供了可持續的優化路徑,能夠有效地將額外計算資源轉化為更高的推理效率。

總結與展望

PASTA 首次證明,通過策略學習讓 LLM 自主優化生成策略,能夠突破傳統自回歸和基于規則的異步生成的效率極限。這一工作不僅為實時大模型應用提供了實用加速方案,更印證了未來 LLM 可能具備推理時自我優化能力的發展方向。


責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-05-29 03:00:00

混合推理模型LHRMAI

2025-12-05 08:47:00

2025-11-03 08:15:00

2024-12-12 09:00:00

2025-10-11 04:00:00

2025-09-17 09:27:37

2025-11-04 01:43:00

循環語言模型架構

2025-06-09 09:32:35

2025-02-10 13:00:00

模型訓練AI

2025-06-11 02:30:00

2025-11-20 12:51:07

2022-05-09 11:23:43

人工智能機器學習推理

2025-10-21 09:06:00

2023-03-09 14:04:00

谷歌研究

2025-04-08 09:16:00

推理模型AI

2023-09-04 12:59:03

AI數據

2025-06-05 11:51:14

NVIDIAProRLLLM

2025-11-17 08:00:00

LLMAWQGPTQ

2024-10-21 11:15:00

點贊
收藏

51CTO技術棧公眾號

91精品国产色综合久久不卡电影 | 成人精品鲁一区一区二区| 日av在线播放中文不卡| 黄色网址视频在线观看| 国产日产欧美一区二区视频| 国产精品h视频| 黄色成人在线免费观看| 日本成人黄色网址| 国产乱子伦一区二区三区国色天香 | 综合久久综合久久| 欧美一区二区激情| 丝瓜av网站精品一区二区| 国产日韩在线看| 久久这里只有精品一区二区| 国产亚洲精品美女| 97国产成人精品视频| 色无极亚洲影院| 97久久超碰福利国产精品…| 丁香花在线高清完整版视频| 亚洲成人精品一区| 992tv在线成人免费观看| 91超碰在线| 欧美丝袜丝交足nylons| 日本一二区视频| 日本一区二区视频在线观看| 久久久无码中文字幕久...| 肉丝袜脚交视频一区二区| 国产欧美欧洲| 日韩一级网站| 欧美激情论坛| 鲁大师影院一区二区三区| 国产精品久久精品| 国产精品一区二区av交换| 韩国三级电影久久久久久| 一区二区在线免费播放| 欧美激情视频网| 免费欧美网站| 久久久精品亚洲| 日韩欧美中文字幕在线视频| 欧美国产第一页| 日韩a级大片| 国产精品久久不能| 久久精品久久久| 92福利视频午夜1000合集在线观看| 成人羞羞网站| 成人免费网站在线观看| 一区二区国产在线| 欧美在线影院| 国产乱码一区| 中文字幕免费不卡在线| 亚洲精品大尺度| 亚洲承认在线| 国产精品视频1区| 久久不卡国产精品一区二区| 在线播放亚洲激情| 最大av网站| 国产精品a久久久久久| 欧美xoxoxo| 日韩一区二区精品在线观看| av男人的天堂在线| 亚洲免费av高清| 在线电影看在线一区二区三区| 日韩av大片| 精品嫩草影院久久| 伊人春色在线| 极品少妇xxxx偷拍精品少妇| 国产精品91在线| 日韩黄色网址| 国产一区二区三区四区在线观看 | 午夜av一区二区| 国内自拍在线观看| 国产精品国产自产拍高清av王其 | 欧美一区二区三区免费| 日本高清视频在线观看| 日韩视频一区二区三区| 写真福利精品福利在线观看| 亚洲天堂av综合网| 91久久精品一区二区| 成人免费视频app| 国产不卡视频在线| 黄色成人在线网址| 国产网站一区二区三区| 69国产精品视频| 欧美视频国产精品| 在线午夜影院| 久久成人人人人精品欧| 成人在线免费观看网站| 日韩电影免费观看高清完整| 国产美女一区二区三区| 亚洲黄色a v| 欧美日韩一级黄| 亚洲日韩中文字幕一区| 成人免费淫片视频软件| 精品亚洲aⅴ乱码一区二区三区| 一本色道无码道dvd在线观看| 福利微拍一区二区| 黑人巨大精品| 91精品久久久久久久久久入口| 日韩高清电影一区| 日本人视频jizz页码69| 欧美日韩国产一二三| 99精品美女视频在线观看热舞| 91在线在线观看| aa级大片欧美| 日本中文字幕视频在线| 97在线日本国产| 久久精品理论片| 宅男深夜视频| 深夜精品寂寞黄网站在线观看| 欧美国内亚洲| 免费看黄色一级大片| 日韩一区二区精品| 蜜臀91精品国产高清在线观看| 四虎影院一区二区| 日本精品视频一区二区| 久久视频社区| 中文字幕一区二区三区乱码| 欧美视频一二三| 国内露脸中年夫妇交换精品| 在线观看日本一区| 欧美欧美欧美欧美| 91麻豆国产自产在线观看亚洲| 黄色av免费在线播放| 亚洲精品乱码久久久久久按摩观| 羞羞小视频视频| 亚洲欧美激情四射在线日| 亚洲综合色站| 成人免费网址在线| 中文字幕亚洲欧美一区二区三区 | 影音先锋久久久| 免费男女羞羞的视频网站中文版 | 亚洲欧美电影一区二区| yw视频在线观看| 日韩美女免费线视频| 26uuu亚洲综合色| 欧美v亚洲v| 国产一区免费观看| 色悠悠久久综合| 日韩一区欧美| 狠狠干在线视频| 国产国语刺激对白av不卡| 久久精品视频在线看| 久久亚洲国产精品尤物| 99久久久精品视频| 精品视频在线观看日韩| 三级成人在线视频| a毛片在线看免费观看| 黑人中文字幕一区二区三区| 午夜欧美在线一二页| 欧美日韩国产免费观看视频| 美女av电影| 欧美又大又硬又粗bbbbb| 国产精品色噜噜| 国产精品久av福利在线观看| 91制片厂毛片| 日韩av电影院| 亚洲午夜电影在线观看| 日韩欧美一区二区三区在线视频| 性网站在线免费观看| 国产精品天天狠天天看| 午夜精品一区二区三区电影天堂| 国产精品麻豆久久| 国产区视频在线播放| 波多野结衣一区二区三区在线观看 | 亚洲精品国产成人影院| 欧美激情图区| 91精品视频网站| 欧美日韩国产中字| 欧美日韩一区自拍| 黄网站在线播放| 亚洲永久激情精品| 中文字幕欧美日韩| 国产欧美精品在线观看| 秋霞影视一区二区三区| 一本大道香蕉8中文在线视频| 国产成人精品福利一区二区三区 | 5566av亚洲| 欧美另类z0zxhd电影| 男女精品网站| 欧美gay囗交囗交| 簧片在线免费看| 91精品久久久久久久久久久久久| 欧美精品乱码久久久久久按摩| 麻豆91精品视频| 久久九九精品视频| 色播在线观看| 日韩.欧美.亚洲| 免费av一区二区| 精品久久久久久久久中文字幕| 香蕉国产精品偷在线观看不卡| 日韩电影网站| 一道本在线免费视频| 91久久精品美女高潮| 欧美电影免费观看完整版| www.欧美色图| 日韩欧美一区免费| 91福利在线尤物| 色片在线免费观看| 国产精品国产三级国产专区53| 国产亚洲精品激情久久|