国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Bengio參與,擴散模型+蒙特卡洛樹搜索實現System 2規劃

人工智能 新聞
把擴散模型的生成能力與 MCTS 的自適應搜索能力相結合,會是什么結果?

擴散模型(Diffusion Model)通過利用大規模離線數據對軌跡分布進行建模,能夠生成復雜的軌跡。與傳統的自回歸規劃方法不同,基于擴散的規劃器通過一系列去噪步驟可以整體生成完整軌跡,無需依賴前向動力學模型,有效解決了前向模型的關鍵局限性,特別適用于具有長周期或稀疏獎勵的規劃任務。

盡管擴散模型具有這些優勢,但如何通過利用額外的測試時間計算(TTC)來有效提高規劃精度仍然是一個懸而未決的問題。一種潛在的方法是增加去噪步驟的數量,或者增加采樣次數。然而,已知增加去噪步驟帶來的性能提升會迅速趨于平緩,而通過多個樣本進行獨立隨機搜索的效率非常低,因為它們無法利用其他樣本的信息。

另一方面,蒙特卡洛樹搜索(MCTS)則具有強大的 TTC 可擴展性。通過利用迭代模擬,MCTS 可以根據探索性反饋改進決策并進行調整,使其可以隨著計算量的增加而有效地提升規劃準確度。

這種能力使 MCTS 成為了許多 System 2 推理任務的基石,例如求解數學問題和生成程序。

然而,與基于擴散的規劃器不同,傳統的 MCTS 依賴于前向模型來執行樹 rollout。這也就繼承了其局限性,包括失去全局一致性。

除了局限于離散動作空間之外,生成的搜索樹在深度和寬度上都可能變得過大。這會導致計算需求變得非常大,特別是當任務場景涉及到長遠規劃和大動作空間時。

那么,關鍵的問題來了:為了克服擴散模型和 MCTS 各自的缺陷,同時提升基于擴散的規劃的 TTC 可擴展性,可以將擴散模型與 MCTS 組合起來嗎?又該怎么去組合它們?

近日,Yoshua Bengio 和 Sungjin Ahn 領導的一個團隊為上述問題提供了一個答案,提出了蒙特卡洛樹擴散(MCTD)。這是一種將擴散模型的生成力量與 MCTS 的自適應搜索功能相結合的全新框架。該團隊表示:「我們的方法將去噪(denoising)重新概念化為一個樹結構過程,允許對部分去噪的規劃進行迭代評估、修剪和微調。」


  • 論文標題:Monte Carlo Tree Diffusion for System 2 Planning
  • 論文地址:https://arxiv.org/pdf/2502.07202v1

蒙特卡洛樹擴散(MCTD)

簡單來說,MCTD = 擴散模型 + MCTS。該框架整合了基于擴散的軌跡生成以及 MCTS 的迭代搜索能力,可實現更加高效和可擴展的規劃。

具體方法上,MCTD 有三項創新。

  • 第一,MCTD 將去噪(denoising)過程重構成了一種基于樹的 rollout 過程,于是便能在維持軌跡連貫性的同時實現半自回歸的因果規劃。
  • 第二,其引入了引導層級作為元動作(meta-action),從而可實現「探索」與「利用」的動態平衡,進而確保在擴散框架內實現自適應和可擴展的軌跡優化。
  • 第三,其采用的模擬機制是快速跳躍去噪(fast jumpy denoising)。從名字也能看出來,該機制的效率肯定很高 —— 不使用成本高昂的前向模型 rollout 即可有效估計軌跡質量。

基于這些創新,便可以在擴散過程中實現 MCTS 的四大步驟,即選擇、擴展、模擬和反向傳播,從而有效地將結構化搜索與生成式建模組合到了一起。

蒙特卡羅樹擴散(MCTD)的兩種視角。

上圖的(a)為 MCTS 視角:展示了 MCTD 一輪的四個步驟 —— 選擇、擴展、模擬和反向傳播 —— 在一個部分去噪樹上的過程。每個節點對應一個部分去噪的子軌跡,邊標記為二元引導級別(0 = 無引導,1 = 有引導)。在新節點擴展后,執行「跳躍」去噪以快速估計其值,然后沿著樹中的路徑反向傳播。

上圖的(b)為擴散視角:同一過程被視為在去噪深度(縱軸)和規劃范圍(橫軸)上的部分去噪。每個彩色塊表示在特定噪聲水平下的部分去噪規劃,顏色越深表示噪聲越高。不同的擴展(0 或 1)在規劃方向上創建分支,代表替代的軌跡優化。值得注意的是,整行同時去噪,但去噪水平不同。

MCTD 框架將這兩種視角統一了起來。整體的算法過程如下所示:

MCTD 的效果得到了實驗的驗證

該團隊也通過實驗驗證了蒙特卡洛樹擴散的效果。他們采用的評估任務套件是 Offline Goal-conditioned RL Benchmark(OGBench),其中涉及包括迷宮導航在內的多種任務以及多種機器人形態和機器臂操作。

下表 1 展示了質點和機器蟻在中、大、巨型迷宮中的成功率,可以看到 MCTD 的表現遠超其它方法。

下圖展示了三個規劃器的規劃結果以及實際的  rollout。

三種規劃器 ——Diffuser、Diffusion Forcing 和 MCTD 生成的規劃與實際展開的對比。雖然 Diffuser 和 Diffusion Forcing 未能生成成功的軌跡規劃,但 MCTD 通過自適應優化其規劃取得了成功。

在點陣迷宮中等任務中,使用二元引導集 {無引導,引導} 的 MCTD 樹搜索過程可視化展示。每個節點對應一個部分去噪的軌跡,其中左圖顯示帶噪聲的部分規劃,右圖顯示快速去噪后的規劃。搜索通過選擇無引導或引導來擴展子節點,評估每個新生成的規劃,并最終收斂到高亮的葉節點作為解決方案。

下面兩個表格則展示了不同方法在機器臂方塊操作任務以及視覺點迷宮任務上的結果。

總體而言,MCTD 在長期任務上的表現優于現有方法,可實現卓越的可擴展性,并得到高質量的解決方案。

 該團隊表示:「未來還將探索自適應計算分配、基于學習的元動作選擇和獎勵塑造,以進一步提高性能,為更具可擴展性和靈活性的 System 2 規劃鋪平道路。」

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-08-04 08:34:00

2025-02-13 09:34:13

2025-04-26 09:25:00

模型推理AI

2025-05-26 08:52:00

2024-05-09 08:33:33

2025-01-10 11:42:40

2024-08-19 08:45:00

開源模型

2023-10-27 13:05:23

模型訓練

2021-08-20 10:12:35

Python蒙特卡洛股票

2024-07-10 09:37:57

2024-06-17 12:39:37

2024-12-11 08:12:24

2023-04-12 15:58:58

2024-12-09 12:10:07

2024-12-13 16:11:01

2021-11-05 09:01:15

Python算法Python基礎

2021-11-08 08:51:36

Python算法Python基礎

2025-04-10 09:19:52

2022-12-15 16:53:55

2018-08-23 13:04:48

Python月薪支出
點贊
收藏

51CTO技術棧公眾號

国产精品女主播av| 国产精品v亚洲精品v日韩精品 | 欧美性感美女一区二区| 欧美一区二区三区成人| 亚洲国产成人va在线观看麻豆| 偷偷www综合久久久久久久| 日韩有码在线观看| 福利在线导航136| 色综合.com| 成人aaaa免费全部观看| 久久久久久久久久电影| 91精品国产综合久久国产大片| 91精品综合久久久久久| 91国偷自产一区二区开放时间 | 亚洲国产又黄又爽女人高潮的| 国产伦精品一区二区三区四区视频_| 亚洲免费观看| 国产精品久久久久久久久| 精品国产伦一区二区三区观看说明| 欧美精品少妇一区二区三区| 国产色视频网站| 久久欧美一区二区| 欧美视频免费看欧美视频| 九九视频精品免费| 日韩久久久久久久| 国产精品老牛| 国产欧美日韩亚洲| 一区二区三区在线| 国产中文字幕亚洲| 欧美三级三级| 国产精品444| 国产亚洲电影| 国产精品wwww| 日韩精品一区二区久久| 精品国产一区二区三区香蕉沈先生| 夜夜嗨av一区二区三区四区| 欧洲一区二区三区| 欧美一二三四区在线| 成人影院在线观看| 91精品麻豆日日躁夜夜躁| 日本中文字幕电影在线免费观看| 欧美视频一区二区三区…| 亚洲成人基地| 日韩欧美国产免费播放| 精品乱码一区二区三四区视频| 一本久久综合亚洲鲁鲁五月天| 亚洲有码转帖| 欧美老人xxxx18| 综合久久2019| 亚洲女成人图区| 日韩精品第二页| 欧美激情视频在线| 九九视频精品全部免费播放| 日本国产高清不卡| 天天插综合网| 欧美成ee人免费视频| 奇米一区二区三区| 国产av天堂无码一区二区三区| 久久久久久久性| 免费成年网站| 欧美乱妇23p| 日韩不卡在线| 欧洲精品在线视频| 国产一区二区三区四区老人| 美脚丝袜一区二区三区在线观看| 日韩黄色小视频| 成人一对一视频| 亚洲制服丝袜一区| 麻豆网站在线观看| 综合136福利视频在线| 欧美爱爱网站| 久草一区二区| 91免费观看视频| 最近2018年手机中文在线| 麻豆精品视频在线观看| 亚洲福利精品视频| 亚洲国产电影在线观看| 亚洲亚洲精品三区日韩精品在线视频| 国产欧美日韩一区二区三区四区 | 国产精品亚洲四区在线观看| 欧美三级三级三级爽爽爽| 欧美精品momsxxx| 午夜精品三级视频福利| 精品国产aⅴ| 秋霞久久久久久一区二区| 高清国产一区二区三区| 182午夜在线观看| 日本精品一区二区三区四区的功能| 久草中文在线| 欧美成年人视频网站| 久久性感美女视频| 一区二区三区四区不卡| 国产精品九色蝌蚪自拍| 婷婷成人激情| 欧美寡妇偷汉性猛交| 欧美伊人影院| 免费无遮挡无码永久视频| 午夜精品福利视频网站| av毛片午夜不卡高**水| 性色av一区二区三区红粉影视| 一区三区视频| 中文字幕第21页| 欧美麻豆精品久久久久久| 91精品国产一区二区在线观看| 成人夜晚看av| 99精品久久99久久久久| 国产黄色片在线观看| 久久久国产精品x99av | 中国一级大黄大黄大色毛片| 欧美激情在线一区二区| 极品白浆推特女神在线观看| 亚洲人成电影在线播放| 欧美在线电影| 91免费国产精品| 色婷婷综合久久久中文一区二区| 亚洲电影有码| 国产综合 伊人色| 亚洲免费成人av| 国产精品高清乱码在线观看| 国产欧美日韩视频| 99久久综合99久久综合网站| 第一视频专区在线| 午夜精品在线视频| 国产精品一区二区三区99| 一本一道dvd在线观看免费视频| 亚洲偷欧美偷国内偷| 精品电影在线| 国内精品久久久久久| 久久久久国产一区二区| 成人片在线免费看| 欧美1区3d| 日韩国产一级片| 亚洲欧美国产精品专区久久| 欧美在线视频不卡| 最新日本在线观看| 高清在线观看av| 亚洲欧美在线磁力| 亚洲成色精品| 国产在线精品一区| av电影在线观看不卡| www.在线视频.com| 久久久亚洲影院你懂的| 久久精品99国产精品日本| 欧美日韩在线中文字幕| 琪琪第一精品导航| 久久九九影视网| av2020不卡| 激情小说综合区| 色域天天综合网| 国精一区二区| 69日本xxxxxxxxx49| 欧美激情精品久久久久久| 国产精品一区在线观看你懂的| 老司机99精品99| 国产精品露出视频| 一本久久综合亚洲鲁鲁五月天 | 手机在线观看av| 日日夜夜精品网站| 在线综合+亚洲+欧美中文字幕| 欧美激情亚洲| 欧美著名女优| 国产欧美精品日韩精品| 成人免费在线视频| 中文字幕伦av一区二区邻居| 国产经典av| 欧美一级淫片播放口| 国产精品每日更新在线播放网址| 亚洲性视频在线| 91骚色在线| 国产在线视频欧美| 91福利国产成人精品照片| 国内自拍一区| gogo久久| 人人妻人人澡人人爽欧美一区 | 精品亚洲综合| 久久久久高清| 日韩成人在线观看| 高清不卡在线观看| 日韩久久99| 一区二区三区入口| 国产精品高精视频免费| 91久久免费观看| 天堂蜜桃91精品| av在线不卡精品| 亚洲欧美自拍另类日韩| 国产精品亚洲激情| 欧美蜜桃一区二区三区| 狠狠色狠狠色综合系列| 日本免费成人| 羞羞网www| 欧美日韩高清免费| 国产亚洲欧美视频| 国产精品久久久久久久久图文区 | 欧美绝顶高潮抽搐喷水合集| 国产三级av在线| 精品国产一区二区三区免费| 欧美va亚洲va| 国产精品嫩草影院com| 韩国精品一区二区三区| 伊人网在线播放|