NeurIPS 2025 Spotlight | 中國聯通以全局優化重塑擴散模型加速
作者和團隊介紹:本文一作是高煥霖和陳平,通訊作者為趙放和廉士國,其他作者還包括石芙源、譚超、劉兆祥、王愷,所有作者均來自聯通數據智能有限公司(聯通數據科學與人工智能研究院)元景大模型研發團隊。
當前,視頻生成模型性能正在快速提升,尤其是基于Transformer架構的DiT模型,在視頻生成領域的表現已經逐漸接近真實拍攝效果。然而,這些擴散模型也面臨一個共同的瓶頸:推理時間長、算力成本高、生成速度難以提升。隨著視頻生成長度持續增加、分辨率不斷提高,這個瓶頸正在成為影響視頻創作體驗的主要障礙之一。
來自中國聯通數據科學與人工智能研究院的研究團隊提出了一個全新的思路 :LeMiCa(Lexicographic Minimax Path Caching)——一種無需訓練、全局最優建模的緩存加速框架,能在保持畫質與一致性的同時,實現高效的推理加速。LeMiCa解決的是一個長期被“局部貪心決策”束縛的老問題:擴散模型是否存在一種真正“全局一致、誤差可控、速度極快”的緩存加速路徑?研究答案是:有。并且比想象中簡單得多。
這項研究已經成功入選 NeurIPS 2025 Spotlight。

論文標題:
LeMiCa: Lexicographic Minimax Path Caching for Efficient Diffusion-Based Video Generation
論文鏈接:https://arxiv.org/abs/2511.00090
項目主頁:https://unicomai.github.io/LeMiCa
代碼地址:https://github.com/UnicomAI/LeMiCa
核心亮點:
LeMiCa 如何做到“又快又穩”?
當前主流的緩存加速方法(如TeaCache)采用了“局部貪心”策略:如果相鄰時間步之間的變化很小,就選擇復用緩存。然而,這種“走一步看一步”的策略忽視了擴散模型的重要特性——早期步驟對生成結果有較高的敏感性,微小的誤差可能在后期被不斷放大,影響最終畫質。同時,許多現有方法需要引入在線判別機制,這會引入額外的計算負擔,使得生成過程依然緩慢。
LeMiCa的核心思想是:
“緩存加速并不是局部決策問題,而是一個全局路徑優化問題。”
研究團隊發現,擴散模型的生成過程其實可以抽象成一個帶權有向無環圖(DAG) 。每個節點代表一個時間步,每條邊代表在兩個時間步之間“跳過計算、復用緩存”的行為,邊的權重則對應緩存導致的全局誤差。這樣,緩存策略可以很自然的轉化為在DAG中搜索最優路徑的問題。

LeMiCa技術實現:從誤差建模到圖優化
為了準確評估緩存的影響,LeMiCa提出了一種全新的誤差度量方法,通過離線構建靜態DAG來量化緩存對最終生成視頻結果的影響。DAG的構成部分主要有:1)節點:每個時間步;2)邊:可能的緩存區間;3)邊權重:緩存-復用引發的全局重建誤差。具體來說,對于DAG中節點i到j的邊權被定義為:

在圖構建過程中,我們會對每個時間步進行節點抽象。DAG中的每一條邊代表在時間步i到j之間跳過若干步計算、直接復用緩存的行為。為避免圖過于龐大,LeMiCa依據“距離越長,緩存誤差越大”的先驗知識,設置了最大跳躍長度,從而只保留合理的緩存段以減少搜索復雜度。最終,為了保證魯棒性和泛化性,LeMiCa僅使用少量樣本(prompt和seed)離線生成多個DAG并進行融合,最終得到一個靜態的、跨任務可復用的全局誤差圖。
字典序極小化路徑優化(Lexicographic Minimax Path):在構建好靜態誤差圖之后,LeMiCa 將緩存調度問題形式化為:在固定預算 B 下,從起點到終點尋找一條最優路徑。由于傳統的“最短路徑”或“局部最優”算法不具備線性可加性,導致最短路徑算法不再適用,LeMiCa采用了字典序極小化準則來進行路徑搜索。這種優化方式不追求誤差總和最小,而是逐層比較路徑中各段緩存的誤差值,確保:
- 最大誤差被最小化(避免單段災難性退化)
- 誤差分布更均衡(提升全局一致性)
形式化定義如下:

通過字典序比較,LeMiCa避免了“看似整體誤差低但中間崩壞”的路徑:
若路徑A的最大誤差 < 路徑B的最大誤差 → A 更優
若最大誤差相同 → 比較第二大依次類推
實驗結果:加速與畫質兼得
聯通元景大模型研究團隊在多個主流視頻生成模型中驗證了LeMiCa的性能。從結果中可以看到該方法在保留加速前后的視覺一致性具有顯著優勢,這也正是全局路徑視角下的圖優化所帶來的增益。

從視覺效果上看,LeMiCa生成的視頻在結構風格保持、內容一致性方面都顯著提升。

即使在高倍加速推理下,也幾乎看不出明顯退化。

從結果中可以看出,LeMiCa對比其他主流方法,存在以下明顯優勢:
- 極佳的生成效果:結構、紋理和內容一致性全面提升;
- 優秀的加速性能:提供2.4×以上的高倍加速推理;
消融實驗:少樣本建圖,高魯棒性,場景擴展能力
極少樣本建立DAG:LeMiCa僅憑少量樣本即可構建高質量緩存路徑,單樣本已具強性能,20個樣本即達到性能飽和,體現了靜態緩存策略的高效與穩健。

加速路徑的魯棒性:即使改變采樣調度中的軌跡縮放參數得到不同的去噪軌跡,LeMiCa仍有較好的效果,體現了良好的路徑魯棒性。

文生圖模型兼容:由于LeMiCa本質上是一個用于擴散模型緩存加速的框架,因此其也適用于文生圖模型。我們拿最新的QWen-Image模型進行了實驗,得到了同樣出色的加速效果:

業界頂級團隊推薦
LeMiCa得到了頂級多模態模型研發團隊阿里通義千問和智譜AI的認可,分別在其官方主頁上對LeMiCa進行權威推薦!




總結與展望
LeMiCa以全局優化視角重新定義了擴散視頻生成的加速問題。它突破了傳統“局部貪心”式緩存策略的局限,將緩存調度建模為有向無環圖(DAG)上的全局路徑搜索問題。作為一種通用的免訓練加速框架,LeMiCa為視頻生成帶來了“又快又穩”的新范式,聯通元景大模型團隊希望以此為基石,為業界關于擴散模型的加速和復雜場景生成提供新的思考角度。


















