国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

擴散語言模型推理太慢?北大團隊提出ODB-dLLM框架,破解計算訪存雙重瓶頸

人工智能 新聞
受預填充和解碼階段異構算術強度的啟發,本研究提出了 ODB-dLLM,這是一個協調計算 / 訪存雙邊界以加速 dLLM 推理的框架。

本研究由北京大學研究團隊完成。通訊作者為李萌,北京大學人工智能研究院和集成電路學院助理教授,博導,PKU SEC Lab 負責人,他的研究興趣集中于高效、安全人工智能加速算法和芯片,旨在通過算法到芯片的跨層次協同設計和優化,為人工智能構建高能效、高可靠、高安全的算力基礎。第一作者韋臨燁,北京大學集成電路學院博士一年級在讀,主要研究方向為多模態高效 AI 系統和加速器設計。

基于擴散的大語言模型 (dLLM) 憑借全局解碼和雙向注意力機制解鎖了原生的并行解碼和受控生成的潛力,最近吸引了廣泛的關注。例如 Fast-dLLM 的現有推理框架通過分塊半自回歸解碼進一步實現了 dLLM 對 KV cache 的支持,挑戰了傳統自回歸 LLMs 的統治地位。

然而,雙向注意力引入的 cache 刷新機制使這一推理過程成為預填充 / 解碼交錯的模式,將傳統自回歸模型解碼階段效率的訪存瓶頸限制轉化為計算 / 訪存瓶頸交替限制,占據了推理開銷中不可忽視的一部分。此外,認為整個序列 KV 狀態在分塊內不變的緩存近似方式還一定程度上劣化了模型性能。

針對這一缺陷,來自北大的研究團隊提出一種新的 dLLM 推理加速框架 ODB-dLLM(Orchestrating Dual-Boundaries: An Arithmetic Intensity Inspired Acceleration Framework for Diffusion Language Models)。它通過分析現有 dLLM 推理框架中交錯的計算和訪存瓶頸階段,引入了自適應長度預測策略和跳躍共享推測解碼,以優化 dLLM 在硬件平臺上的計算訪存特性,最大限度地提高推理效率。

  • 論文標題:Orchestrating Dual-Boundaries: An Arithmetic Intensity Inspired Acceleration Framework for Diffusion Language Models
  • 論文鏈接:https://arxiv.org/abs/2511.21759
  • Github 鏈接:https://github.com/PKU-SEC-Lab/ODB-dLLM

研究背景和動機

傳統 dLLM 模型中任意兩個 token 間的雙向注意力破壞了 KV cache 應用的前提,讓整個推理過程陷入每一步都執行預填充的計算瓶頸問題,沒有取得超越自回歸模型的實際推理速度。Fast-dLLM 及類似工作將預設定長度的輸出序列劃分為多個分塊,只在每個分塊解碼的第一步執行預填充并存儲全局的的 KV 狀態,隨后計算分塊內的 tokens 并基于置信度閾值接收。當一個分塊內的所有位置都被解掩碼,轉到下一個分塊并刷新 KV cache。然而,這樣的推理框架仍然存在以下挑戰:

  • 交錯的計算和訪存瓶頸模式都限制了效率。分塊半自回歸解碼的每個新塊都會觸發全局預填充以刷新 KV  cache,占總推理延遲的 30-40%。隨著更細粒度的并行解碼設計來減少解碼步數,計算密集型的預填充階段將進一步占據主導地位。亟需一個算術強度感知的推理框架聯合緩解計算和訪存瓶頸。
  • 以現有的 dLLM 無法感知實際任務需求,導致預設定輸出長度過長。dLLM 中的每個分塊都采用雙向注意力,以先前和后續令牌為條件。因此,需要固定的響應長度來控制剩余的輸出空間。為了確保足夠的容量,該長度通常設置為較大的默認值(例如 1024),這會在計算密集型的預填充階段引入大量開銷并導致冗余推理。
  • 硬閾值延遲了對潛在正確 token 的接受,導致更長的解碼軌跡和更多的步數。在訪存密集型的解碼階段,模型并行計算分塊內的所有掩碼 token,但僅接受置信度超過閾值的部分,而其他 token 則被重新掩碼。大量正確 token 由于在當前步的置信度分數低于閾值而被推遲接收,從而導致額外的解碼步驟并增加不必要延遲。與此同時,直接降低閾值又會損害模型性能。

ODB-dLLM 框架

ODB-dLLM 推理框架的目標在于協調交錯的計算和訪存瓶頸限制。為了減輕預設定響應長度帶來的大量預填充開銷,本文提出了一種自適應長度預測策略來減少冗余計算。此外,本文引入了為 dLLM 特別定制的跳躍共享推測解碼方法,可在有限的算術強度下減少訪存受限階段的解碼步驟。

自適應長度預測

該策略在每一輪預填充后考察整個響應序列,檢測是否存在 [EOS] token。一旦識別出存在這一終止標記,就會提取其置信度分數并將其與預定義的截斷閾值進行比較。如果置信度超過閾值,則響應將在該位置被截斷。如果未檢測到 [EOS] token,或者對應的置信度均低于閾值,則響應長度保持不變。這種漸進式策略最大限度地減少了預填充階段的算術強度和冗余計算,隨著模型的不確定性和多樣性逐漸收斂還帶來了性能增益。

跳躍共享推測解碼

推測解碼通過增加計算強度鼓勵多樣化預測,為訪存受限場景下進一步提高解碼的并行度提供了解決方案。然而,dLLM 推理的雙向注意力將 token 間的因果依賴轉化為全局依賴,在傳統推測解碼中構造的遵循嚴格順序的 token tree 被全連通 token graph 所取代。因此,一方面候選 token graph 中任何獨立驗證的節點對都會解鎖其連接邊緣,從而實現更靈活的推測解碼探索;另一方面任意一個 token 的改變都需要計算一個完整的新塊,計算強度隨候選預測的增加而迅速增大并演化為訪存瓶頸,限制了推測的多樣性?;诖耍疚奶岢隽藘牲c關鍵設計:

1. 跳躍接收推測策略。推測解碼的草稿塊也同時作為中間驗證塊,實現草稿 token 跨塊的跳躍驗證和接收,從而在單次解碼迭代中解掩碼更多 token,在有限的推測塊預算下顯著提高解碼效率。

2. 解碼共享推測策略??紤]各推測塊間的高度相似性,塊內已解碼 token 的 KV 狀態也可以只在當前塊內計算更新,并在多個推測塊之間共享。隨著解碼的進展,推測塊的計算成本逐漸降低,為更多推測快的拓展提供了機會。

實驗結果:更快、更準

研究團隊在兩種代表性的開源擴散語言模型 LLaDA-Instruct 和 LLaDA-1.5 上評估了 ODB-dLLM。在多個數據集上對比 Vanilla model 和 Fast-dLLM 推理框架結果如下:

  • 團隊測量了預填充長度和延遲的減少,確認了計算密集階段有意義的算術強度節省。此外,每次預填充迭代期間響應長度的逐步收縮隱式地將模型限制在更準確的答案空間,從而比生成到 [EOS] token 后簡單地截斷產生更高的精度。

  • 針對訪存密集階段的推測解碼,實驗發現跳躍接收策略增加了每步接受的 token 數量,并通過一次解碼中的多段接收減少了并行解掩碼 token 間的潛在沖突。解碼共享策略的引入進一步減少了解碼輪次,同時優先解掩碼之前未能接受但置信度較高的 token。跳躍共享推測解碼因而在速度和精度上都取得了顯著增益。

總結

受預填充和解碼階段異構算術強度的啟發,本研究提出了 ODB-dLLM,這是一個協調計算 / 訪存雙邊界以加速 dLLM 推理的框架。在預填充階段,團隊發現預定義的固定響應長度引入了繁重且冗余的計算開銷,ODB-dLLM 采用了自適應長度預測機制,可逐步減少預填充開銷和不必要的計算。在解碼階段,團隊分析了擴散語言模型的計算特性,并提出了一種特別定制的跳躍共享推測解碼方法,通過減少解碼迭代次數來提高效率。

論文與代碼均已公開,歡迎感興趣的同學閱讀、復現以及深入討論。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-04-25 09:15:00

模型數據AI

2025-05-30 15:52:05

訓練代碼推理

2025-03-17 12:55:18

2023-09-10 10:51:22

算法結構

2025-08-07 09:16:41

2025-08-20 12:38:26

2025-09-22 17:03:09

2025-11-24 08:59:00

AI數據訓練

2025-10-16 08:56:00

模型AI技術

2025-08-18 08:40:00

模型AI算法

2024-02-07 12:13:03

AI模型

2025-10-14 08:58:00

2025-05-27 15:21:06

LLM模型AI

2024-03-18 09:12:09

計算模型

2025-10-20 08:52:00

2025-02-19 15:17:24

2025-02-18 09:27:20

2025-06-04 08:35:00

點贊
收藏

51CTO技術棧公眾號

99在线免费视频观看| 无颜之月在线看| 最新欧美日韩亚洲| 欧美视频综合| 国产综合av在线| tube8在线hd| 欧美在线国产| 中文字幕综合| 久久99精品久久久久久国产越南 | 中文字幕在线看视频国产欧美在线看完整| 91免费看片网站| 超碰在线94| 国产91久久精品一区二区| 亚洲五月综合| 一本高清dvd不卡在线观看| 日本午夜人人精品| 69免费视频| 一本久久青青| 亚洲国产精品麻豆| 国产精品户外野外| 免费看成人a| 欧美日韩一区二区三区四区不卡| 国产婷婷色一区二区三区在线| 美日韩精品免费视频| 成人午夜精品久久久久久久蜜臀| 欧美男男gaygay1069| 91网上在线视频| 日韩在线视频网站| 91淫黄看大片| 久久美女视频| 日韩一区二区在线免费观看| 在线观看17c| 全国精品久久少妇| 在线观看国产精品日韩av| 日本五级黄色片| 精品福利网址导航| 亚洲第一福利一区| 91小视频网站| 2023国产精品久久久精品双| 日韩一区二区三区免费看 | 亚洲日本中文字幕| 少妇性饥渴无码a区免费| 国产精品三p一区二区| 亚洲国产综合91精品麻豆| 国产精品9999久久久久仙踪林| 五月天婷婷在线视频| 亚洲男女自偷自拍| 精品久久久av| 一级在线观看| 老汉av免费一区二区三区| 久久精品视频99| 成人交换视频| 欧美午夜影院在线视频| 免费国产一区二区| 国产成人福利夜色影视| 中文字幕九色91在线| 欧美韩国亚洲| 亚洲成人免费av| 性欧美18+| 青青青伊人色综合久久| 色狠狠久久av五月综合| 日本一区二区乱| 色婷婷av一区二区三区大白胸 | 蜜桃在线一区| 欧美日韩亚洲一区二区| 色哟哟免费网站| 国产精品一二三四| 国产精品久久9| 中文字幕一区二区av| 久久日韩精品| 少妇精品久久久| 91九色国产视频| 日韩激情在线观看| 国产精品黄色影片导航在线观看| 欧美色就是色| 一区二区在线免费视频| 999精品嫩草久久久久久99| 奇米4444一区二区三区| 亚洲精品中文字幕| 亚洲电影一区二区| 午夜影院在线免费观看| 成人亚洲精品久久久久软件| 成人精品福利视频| 最新日韩一区| 亚洲国产一区二区a毛片| 中国动漫在线观看完整版免费| 成人激情小说乱人伦| www.成人av| 极品束缚调教一区二区网站| 欧美一区二区三区四区在线| 亚洲天堂1区| 日韩免费在线看| 一区二区亚洲精品| 国产精品久久久久久网站| aaa在线播放视频| 不卡av电影在线观看| 黄色的网站在线观看| 国产精品国产精品国产专区不蜜| 一区二区三区欧美在线| 久久99影视| 国产精品swag| 成人黄色一级视频| 亚洲精品666| 亚洲精品动漫100p| 日本在线看片免费人成视1000| 精品一区二区三区电影| 日日夜夜精品一区| 色妞在线综合亚洲欧美| 成人羞羞视频播放网站| 一区二区三区不卡在线| 国产精品毛片久久久久久| 妞干网在线观看视频| 亚洲在线中文字幕| 成人在线激情网| 国产一区二区三区美女| 欧美激情www| 亚洲高清久久| 国产精品国模大尺度私拍| 久久精品国产亚洲夜色av网站| 亚洲精品乱码久久久久久蜜桃91 | 国产一区91| 国产美女精彩久久| 加勒比视频一区| 日韩欧美精品一区二区| 亚洲福利国产| 色婷婷狠狠18| 国产丝袜一区二区三区| 国产精品成人av| 国产女精品视频网站免费| 国产毛片精品一区| 成人资源www网在线最新版| 91国模大尺度私拍在线视频| 一区在线影院| 国产精品久久久久久久久久直播| 国产精品美女视频| 中文字幕制服丝袜成人av| 亚洲精品66| 欧美午夜精品一区二区三区| 日韩精品第一页| 成人午夜激情视频| 美州a亚洲一视本频v色道| 91色在线porny| 污视频在线免费观看网站| 亚洲国产综合91精品麻豆| 青草综合视频| 亚洲丰满在线| 91麻豆精品国产91久久久| 午夜影院免费在线| 国产精品一区二区三区毛片淫片| 久久久久久一二三区| 91黑丝在线| 亚洲一区二区三区视频在线播放| 精品欧美日韩精品| 一区二区三区黄色| 亚洲精品资源美女情侣酒店| 色欧美激情视频在线| 日本中文字幕久久看| 91在线观看高清| 国产一级做a爰片久久| 亚洲天堂av网| 丁香一区二区三区| 日韩电影网站| 欧美一级高清免费播放| 26uuu国产日韩综合| 3d欧美精品动漫xxxx无尽| 亚洲一区二区精品在线| 日韩一级二级三级精品视频| 99riav1国产精品视频| 8x8x华人在线| 九九热精品视频在线观看| 毛片网站大全| 国产精品久久视频| 亚洲成av人在线观看| 亚州国产精品久久久| 亚洲第一级黄色片| 免费在线视频欧美| 在线精品视频免费观看| 精东传媒在线观看| 欧美激情在线观看视频免费| 日本高清不卡三区| 国内精品伊人久久久久av影院| 成人免费网视频| 欧美日韩亚洲另类| 日本在线一区二区三区| 久久精品66| 青青草原综合久久大伊人精品优势| 久久综合狠狠综合久久激情| 天使萌一区二区三区免费观看| 色婷婷狠狠五月综合天色拍| 精品极品在线| 99亚洲国产精品| 特黄特色大片免费视频大全| 18video性欧美19sex高清| 成人影视在线播放| 1024在线视频| 日韩精品你懂的| 污视频网站在线| 最新精品视频在线| 欧美风狂大伦交xxxx| 久久大片网站|