国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

圖靈獎得主加持,蒙特卡洛樹搜索×擴散模型殺回規劃賽道|ICML 2025 Spotlight

人工智能 新聞
這個方法將“上古時代”的蒙特卡洛樹搜索,和當下熱門的擴散模型結合在一起,突破了擴散模型在長程任務推理階段缺乏可擴展性的瓶頸,并成功入選ICML 2025的Spotlight。

一個不起眼的迷宮導航任務,卻能讓一眾模型“原形畢露”。

圖片

Diffuser和Diffusion Forcing雙雙翻車,通關率低得可憐。

唯獨有一個模型,通關率高達 100%。

而它就來自圖靈獎得主Yoshua Bengio與其團隊提出的全新方法:蒙特卡洛樹擴散(Monte Carlo Tree Diffusion, MCTD)

這個方法將“上古時代”的蒙特卡洛樹搜索,和當下熱門的擴散模型結合在一起,突破了擴散模型在長程任務推理階段缺乏可擴展性的瓶頸,并成功入選ICML 2025的Spotlight。

圖片

Make MCTS Great Again?

如何在探索(Explore)未知可能性以尋找更優解和利用(Exploit)當前已知最佳方案之間取得平衡,一直是復雜決策和長程規劃任務的核心挑戰之一。

一個過于強調探索的系統可能效率低下,在大量平庸選項中徘徊;而一個過于強調利用的系統則可能過早收斂到局部最優,錯過全局最佳解。

對于擴散模型來說,它雖然能夠通過去噪過程實現高質量、全局一致的序列生成(對數據分布的“利用”),但缺乏在不確定性下主動探索不同未來路徑的能力。

而MCTS恰恰具備通過樹形搜索結構進行高效探索和局部優化的能力,因而能夠系統地權衡探索與利用,并在多個決策點進行智能選擇。

由此,MCTD將擴散模型的全局一致性生成優勢與MCTS的局部探索決策能力相結合。通過將軌跡劃分為多個子規劃來作為MCTS節點,并對不同子規劃實施差異化的去噪調度,實現了在長程規劃中探索與利用的平衡,提高了規劃的效率和質量。

通過MCTS實現異步控制

在傳統的擴散模型中,尤其是在生成軌跡時,模型通常將整條軌跡視為一個整體進行去噪,并用N來表示n個時間步的狀態。

與之相反,MCTD并不把整個N個時間步的軌跡作為一個整體去噪,而是將它劃分為S個時間段。在論文中,MCTD則先將完整軌跡X劃分5個沒有重疊的子軌跡。

例如,如果 N=500,S=5,那么一個可能的劃分是:

圖片

這些子規劃在每個時間段(如1-100)是獨立的,它們之間沒有共享的時間步。

由此,每個子規劃的結束可以看作是完整軌跡的一個切片。當模型對一個特定的子規劃進行去噪時,這段子規劃內部的所有時間步都會同時參與到去噪過程中,遵循針對該子規劃設定的統一的去噪調度。

而在不同的子規劃之間,MCTS決定了不同子規劃的去噪進度和深度,并通過其四個階段表現出來。

圖片

  • Selection:從已有的MCTS中,使用UCB(Upper Confidence Bound,在樹中選擇最有前景的節點)策略選擇一個表示部分去噪軌跡片段(即子規劃)的節點。
  • Expansion:從選定的子規劃節點的末端狀態出發,根據不同的動作或決策,生成一個或多個新的子規劃節點。這些新節點代表了從當前狀態開始的下一段未探索的軌跡片段。同時,為了進行更智能的規劃,MCTS還通過元動作引導級別(Guidance Levels as Meta-Action)來確定子節點的引導級別。高引導級別意味著更精細地、明確地去噪(利用),而低引導級別則意味著去噪過程可以更加自由,允許嘗試新的路徑(探索)。
  • Simulation:從新擴展的子規劃節點開始,MCTD 會利用擴散模型進行“跳躍式去噪”(Jumpy Denoising),快速生成一個從該子規劃開始到軌跡末端的粗略但完整的未來軌跡序列。然后,通過一個獎勵函數評估這個粗略軌跡的價值。
  • Backpropagation:將“模擬”階段得到的整個軌跡的獎勵值,從模擬開始的子規劃節點,沿著樹向上,更新其所有祖先子規劃節點的訪問次數和累積獎勵。這些更新將指導未來的Selection階段,使得 MCTS 能夠更好地利用高回報路徑,探索未知的路徑。

由此,模型一方面將傳統的“狀態”和“動作”的粒度提升到了“子規劃”和“子規劃間連接”的粒度;另一方面,則通過MCTS過程,控制前后子規劃的降噪進度,實現異步控制,從而能夠更高效地處理長序列生成和規劃問題。

實驗結果

MCTD在包括迷宮導航、機械臂操作、視覺迷宮(部分可觀測環境)等任務上進行了測試。

在迷宮導航任務中,MCTD在所有地圖尺寸(medium/large/giant)上均接近100%成功率,顯著優于基線方法。

圖片

在機械臂立方體操作中,所有方法在單方塊任務上性能相當。而MCTD-Replanning在多方塊場景中表現出顯著的性能優勢,將雙方塊任務的成功率從22%提升至50%。

圖片

在視覺迷宮中,MCTD優于所有基線,表明其在高維感知空間中的魯棒性。

圖片

最后,隨著推理計算預算的增加(如增加最大去噪步數),MCTD成功率持續提升,而Diffuser/Diffuser-Random Search收益有限,驗證了MCTD的推理可擴展性。

圖片

總體而言,盡管MCTD通過將基于搜索的規劃與擴散模型結合,在推理階段的可擴展性上取得了提升,但由于其類似“系統二”的深度推理方式,計算成本仍然較高。

此外,由于MCTD在大規模搜索空間中效率較低——即使采用了低維的元動作(meta-actions),評估多個軌跡假設的計算開銷依然很高。

因此,如何提升整體效率成為了MCTD進一步改進的目標。

Fast-MCTD:加速100倍!

為了解決了MCTD計算開銷大,推理時間長的缺點,研究團隊又進一步推出了快速蒙特卡洛樹擴散框架(Fast Monte Carlo Tree Diffusion,Fast-MCTD,相比前作MCTD,在特定任務上的推理速度提升了100倍。

圖片

在原始的MCTD框架中,主要有兩個效率瓶頸:

首先,MCTS算法在設計上是順序的,每次迭代(一次完整的Selection、Expansion、Simulation、Backpropagation)完成后,才會更新搜索樹的統計信息(如節點訪問次數和價值估計)。這種串行更新機制限制了算法的并行執行能力

其次,擴散模型在生成軌跡時需要執行多次迭代去噪操作。當處理長軌跡時,每一次去噪都是一個計算密集型任務,導致整體計算開銷巨大。

因此,為了降低樹搜索和迭代去噪的計算開銷,同時保留 MCTD 強大的規劃能力,Fast-MCTD集成了兩種關鍵的優化技術:并行MCTD和稀疏MCTD。

并行MCTD:提升并行性

MCTD沿用了MCTS的順序性,即每次模擬完成后才更新樹。并行MCTD引入了并行處理,這是Fast-MCTD與前作最顯著的區別。

并行MCTD允許K個并發的rollouts。每個rollout在共享的、固定快照(fixed snapshot)的搜索樹上獨立進行。

樹的更新(價值估計和訪問計數)只有在整個批次的所有rollouts完成后才統一應用 。不過,當批處理量增大時,樹的統計信息會變得過時,降低選擇的準確性,從而影響規劃性能 。

為了解決上述問題,并行MCTD引入冗余感知選擇 (Redundancy-Aware Selection - RAS):它在每個并行搜索階段臨時引入一個輔助訪問計數變量,順序跟蹤當前批次中的選擇,并在延遲樹更新后重置。

這修改了標準UCT的選擇準則,通過一個超參數懲罰當前批次中已被選中的節點,鼓勵其他rollouts探索樹的不同部分 。

圖片

由于擴散模型去噪操作昂貴,并行MCTD提出了統一的批處理策略,在擴展和模擬階段同時處理多個由 RAS 選擇的子規劃。它通過調度噪聲級別和同步DDIM(Denoising Diffusion Implicit Models)更新來批處理去噪步驟。為了處理子規劃和不同引導級別,子規劃被填充并打包成統一形狀的張量,以實現GPU上的高吞吐量并行執行。

稀疏MCTD:減少Rollout長度

MCTD雖然將軌跡分段為子規劃,但每個子規劃內部仍然是相對密集的軌跡。Fast-MCTD引入了軌跡粗化,從根本上縮短了有效規劃時域。通過軌跡粗化 (trajectory coarsening) 在更高的抽象層次上進行rollouts,從而減少rollout的長度和總計算成本。

具體來說,在訓練擴散模型之前,通過每隔H步進行下采樣,構建粗粒度軌跡數據集.使用在這些壓縮表示上訓練的專用稀疏擴散規劃器來建模粗粒度軌跡。由此,涉及規劃的子軌跡數量大大減少,降低總體搜索復雜度及去噪成本。

在迷宮導航測試中,Fast-MCTD相對于標準MCTD實現了約80-110倍的顯著加速,而性能損失極小。

圖片

而在機械臂操作中,Fast-MCTD在保持MCTD性能的同時,顯著提升了效率。

圖片

在視覺迷宮中,Fast-MCTD表現出顯著的效率提升,比 MCTD 快 25-60 倍,而在更大的迷宮中甚至超越了MCTD。

圖片

可以說,Fast-MCTD 在保持或提升規劃性能的同時,實現了數量級的速度提升(最高100倍),成為了更實用和可擴展的解決方案 。

ONE MORE THING

這兩篇論文的一作均來自韓國科學技術院(KAIST)的博士生尹在植(Jaesik Yoon)。

圖片

本文的另一位作者則是尹在植的指導老師安成鎮(Sungjin Ahn),安成鎮教授是韓國科學技術院和紐約大學的聯聘教授。

他的研究方向包括:可擴展貝葉斯推理、深度學習以及人工智能與認知科學的交叉領域,并多次擔任NeurIPS、ICM、ICLR等頂會AC。

他于加州大學歐文分校獲得博士學位,在Max Welling教授指導下專注于近似貝葉斯推理研究。隨后在蒙特利爾大學的MILA實驗室進行博士后研究,師從深度學習先驅、圖靈獎得主Yoshua Bengio教授。

圖片


論文鏈接:

[1]https://arxiv.org/pdf/2502.07202

[2]https://arxiv.org/pdf/2506.09498

學術主頁:

[1]https://jaesikyoon.com/

[2]https://mlml.kaist.ac.kr/sungjinahn

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-02-24 10:15:00

2025-02-13 09:34:13

2025-04-26 09:25:00

模型推理AI

2024-05-09 08:33:33

2025-01-10 11:42:40

2024-08-19 08:45:00

開源模型

2025-05-26 08:52:00

2021-08-20 10:12:35

Python蒙特卡洛股票

2023-10-27 13:05:23

模型訓練

2021-07-21 16:56:33

人工智能機器學習技術

2024-07-10 09:37:57

2025-06-30 08:36:00

AI模型強化學習

2024-06-17 12:39:37

2021-09-23 09:35:00

編程技能開發

2022-10-17 15:04:40

量子計算

2024-10-14 13:45:00

AI模型

2021-09-02 16:10:21

人工智能機器學習技術

2023-04-25 13:46:42

AI開源

2020-12-24 13:08:33

計算機互聯網 技術

2025-07-02 09:21:30

點贊
收藏

51CTO技術棧公眾號

曰本一区二区三区视频| 日韩在线视频精品| 亚洲色图第一区| 日韩.欧美.亚洲| 欧洲一区在线| 一本色道久久综合精品竹菊| 成人综合视频在线| 亚洲欧美成人| 国产91精品青草社区| sis001亚洲原创区| 欧美午夜精品久久久久久久| 播放灌醉水嫩大学生国内精品| 亚洲毛片网站| 国产精品毛片a∨一区二区三区|国| 超碰国产一区| 日韩欧美一二三区| 国产在线一二三区| 亚洲在线视频免费观看| 日韩av黄色网址| 国产一区二区三区久久久| 成人做爰66片免费看网站| 激情亚洲另类图片区小说区| 亚洲人成欧美中文字幕| 欧美激情视频在线播放| 欧美日韩性生活视频| 丝袜制服影音先锋| 久久综合九色综合欧美亚洲| 青青草综合在线| 日本视频中文字幕一区二区三区| 亚洲最大福利视频网站| 欧美色图国产精品| 久久全国免费视频| 国产91精品入| 欧美黑人极品猛少妇色xxxxx| 国产免费不卡| 欧美不卡视频一区| av在线免费观看网站| 大桥未久av一区二区三区| 欧美aaa一级| 亚洲欧美激情小说另类| 超碰超碰在线观看| 中文在线免费一区三区高中清不卡| av在线播放亚洲| 国产成人在线视频网址| 超碰超碰超碰超碰超碰| 麻豆国产精品官网| 日本精品一区二区| 日韩av一二三| 亚洲自拍三区| 精品在线你懂的| 欧美性受xxxx黑人猛交88| 日韩精品国产精品| 亚洲精品成人三区| 日韩精品国产欧美| 中文字幕在线中文字幕日亚韩一区| 日韩精品成人一区二区在线| 午夜欧美一区二区三区免费观看| 日精品一区二区| 在线视频一区观看| 国产精品一区在线观看你懂的| 天天干天天操天天干天天操| 国产精品中文欧美| 久久国产乱子伦免费精品| 亚洲国产高清在线观看视频| 88av在线| 欧美一级黄色大片| 日本精品在线中文字幕| 欧美激情欧美激情| 欧美日韩精品一区二区视频| 成人av片网址| 欧美aaaaaa午夜精品| 水蜜桃色314在线观看| 国产精品青草综合久久久久99| 色琪琪丁香婷婷综合久久| 在线看国产一区| www.8ⅹ8ⅹ羞羞漫画在线看| 啊v视频在线一区二区三区| 日韩精品丝袜美腿| 国产91一区二区三区| 免费在线观看一区二区三区| 久久久久久免费看| 一区二区三区加勒比av| 成人影院在线看| 蜜臀久久99精品久久久无需会员 | 三上悠亚在线资源| 亚洲成a人v欧美综合天堂下载| 日本三级在线视频| yw.139尤物在线精品视频| 久久99青青| 日韩片电影在线免费观看| 久久久久久久久久久黄色| 日本福利在线观看| 精品在线观看国产| 久久国产亚洲| www.国产在线播放| 午夜久久久久久久久| 三级中文字幕在线观看| 国产精品91久久久久久| 精品在线观看免费| 成人免费视频77777| 精品免费一区二区三区| 在线日韩成人| 青青草原亚洲| 亚洲免费av网站| 蜜桃视频动漫在线播放| 国产日韩欧美在线观看| 不卡一二三区首页| 国产98在线| 欧美激情一区二区久久久| 亚洲一区国产| 特黄aaaaaaaaa毛片免费视频| 亚洲人精品午夜在线观看| 亚洲一区二区| 大香煮伊手机一区| 精品美女在线播放| 婷婷丁香综合| 三级视频中文字幕| 亚洲免费视频在线观看| 欧美精品二区| 国产宾馆自拍| 伊人一区二区三区久久精品| 制服诱惑一区二区| 在线观看h网址| 欧美精品情趣视频| 国产一区视频导航| 成人午夜在线观看视频| 国产99久久精品一区二区 夜夜躁日日躁 | 久久中文精品| 少妇性bbb搡bbb爽爽爽欧美| 国内外成人免费激情在线视频| 国内精品自线一区二区三区视频| 国产区av在线| 国产suv精品一区二区| 91天堂素人约啪| 女海盗2成人h版中文字幕| 国产视频在线观看一区| 亚洲午夜免费视频| 欧美性生活一级片| 黑鬼大战白妞高潮喷白浆| 亚洲欧美制服第一页| 视频一区二区三区中文字幕| 色大18成网站www在线观看| 国产精品日韩久久久久| 国产精品久久久久9999吃药| 视频一区日韩精品| 成年女人18级毛片毛片免费| 亚洲精品网站在线播放gif| 日韩av电影天堂| 黄网页在线观看| 亚洲最大成人在线| 欧美香蕉大胸在线视频观看| 国产伦精品一区二区三区视频| 91色国产在线| 色综合老司机第九色激情| 99久久伊人网影院| 99九九久久| www.成年人视频| 中文字幕欧美日韩va免费视频| 精品无人码麻豆乱码1区2区| 在线观看福利电影| 日韩一级性生活片| 久久久999精品免费| 91免费观看视频| 日韩三级网址| www.成人精品免费网站青椒| 国产97在线观看| 欧美午夜无遮挡| 亚洲精品综合| xxx.xxx欧美| 日韩精品久久一区二区| 视频一区视频二区国产精品| 国产亚洲欧美日韩在线一区| 精品国产一区二区三区不卡蜜臂| 日本免费看黄色| 亚洲a区在线视频| 91精品国产综合久久香蕉的特点 | 亚洲xxxxx| 欧美性受xxxx黑人xyx性爽| 国产午夜精品一区二区三区欧美 | 在线欧美视频| 日本乱理伦在线| 免费观看亚洲视频| 播播国产欧美激情| 亚洲欧美中日韩| 91精品国产91久久综合| 精精国产xxxx视频在线| 在线丝袜欧美日韩制服| 久久伊人免费视频| 亚洲最大成人综合| 亚洲精品影院在线观看| 精品人人视频| 亚洲欧美激情网| 91美女片黄在线观| 精品女同一区二区| 99久久久精品| 精品国精品国产自在久国产应用| 亚洲搞黄视频| 久久婷婷五月综合色国产香蕉| 国产日韩欧美另类| 精品成人一区二区|