国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

補齊Transformer規劃短板,田淵棟團隊的Searchformer火了

人工智能 新聞
為了提升 Transformer 的推理和規劃性能,近些年研究社區也提出了一些方法。一種最常見且有效的方法是模擬人類的思考過程:先生成中間「思維」,然后再輸出響應。

最近幾年,基于 Transformer 的架構在多種任務上都表現卓越,吸引了世界的矚目。使用這類架構搭配大量數據,得到的大型語言模型(LLM)等模型可以很好地泛化用于真實世界用例。

盡管有如此成功,但基于 Transformer 的架構和 LLM 依然難以處理規劃和推理任務。之前已有研究證明 LLM 難以應對多步規劃任務或高階推理任務。

為了提升 Transformer 的推理和規劃性能,近些年研究社區也提出了一些方法。一種最常見且有效的方法是模擬人類的思考過程:先生成中間「思維」,然后再輸出響應。比如思維鏈(CoT)提示法就是鼓勵模型預測中間步驟,進行按步驟的「思考」。思維樹(ToT)則使用了分支策略和評判方法,讓模型生成多個不同的思維路徑,然后從中選出最佳路徑。盡管這些技術通常是有效的,但也有研究表明,在很多案例中,這些方法會讓模型的性能下降,原因包括自我強制(self-enforcing)。

另一方面,在一個數據集上有效的技術可能無法很好地處理其它數據集,原因可能包括所涉及的推理類型發生了變化,比如從空間推理變成了數學推理或常識推理。

相較之下,傳統的符號式規劃和搜索技術卻能表現出很好的推理能力。此外,這些傳統方法計算得到的解決方案通常有形式上的保證,因為符號規劃算法通常遵循明確定義的基于規則的搜索過程。

為了讓 Transformer 具備復雜推理能力,Meta FAIR 田淵棟團隊近日提出了 Searchformer。


  • 論文標題:Beyond A?: Better Planning with Transformers via Search Dynamics Bootstrapping
  • 論文地址:https://arxiv.org/pdf/2402.14083.pdf

Searchformer 是一種 Transformer 模型,但針對迷宮導航和推箱子等多步規劃任務,它卻能計算出最優規劃并且所用搜索步驟數也能遠少于 A? 搜索等符號規劃算法。

為了做到這一點,該團隊提出了一種新方法:搜索動態引導(search dynamics bootstrapping)。該方法首先是訓練一個 Transformer 模型來模仿 A? 的搜索過程(如圖 1 所示,然后對其進行微調,使其能用更少的搜索步數找到最優規劃。

更詳細地說,第一步,訓練一個模仿 A? 搜索的 Transformer 模型。這里,該團隊的做法是針對隨機生成的規劃任務實例運行 A* 搜索。在執行 A? 時,該團隊會記錄執行的計算和最優規劃并將其整理成詞序列,即 token。這樣一來,所得到的訓練數據集就包含了 A? 的執行軌跡并編碼了有關 A? 本身的搜索動態的信息。然后,訓練一個 Transformer 模型,讓其能針對任意規劃任務沿最優規劃生成這些 token 序列。

第二步,使用專家迭代(expert iteration)方法進一步提升使用上述經過搜索增強的序列(包含 A? 的執行軌跡)訓練的 Searchformer。專家迭代方法可讓 Transformer 憑借更少的搜索步驟生成最優解。這個過程會得到一種神經規劃算法,其隱式地編碼在該 Transformer 的網絡權重之中,并且它有很高的概率以少于 A? 搜索的搜索步數找到最優規劃。比如說,在執行推箱子任務時,新模型能解答 93.7% 的測試任務,同時搜索步數比 A? 搜索平均少 26.8%。

該團隊表示:這為 Transformer 超越傳統符號規劃算法鋪平了道路。

實驗

為了更好地理解訓練數據和模型參數量對所得模型性能的影響,他們進行了一些消融研究。

他們使用了兩類數據集訓練模型:一種的 token 序列中只包含解(solution-only,其中只有任務描述和最終規劃);另一種則是搜索增強型序列(search-augmented,其中包含任務描述、搜索樹動態和最終規劃)。

實驗中,該團隊使用了 A? 搜索的一種確定性和非確定性變體來生成每個序列數據集。

迷宮導航

在第一個實驗中,該團隊訓練了一組編碼器 - 解碼器 Transformer 模型來預測 30×30 迷宮中的最優路徑。

圖 4 表明,通過預測中間計算步驟,可在數據量少時獲得更穩健的性能表現。

圖片

圖 5 給出了僅使用解訓練的模型的性能。

圖 6 展示了任務難度對每個模型的性能的影響。

整體而言,盡管當使用的訓練數據集足夠大和足夠多樣化時,僅使用解訓練的模型也能預測得到最優規劃,但當數據量少時,經過搜索增強的模型的表現明顯好得多,并且也能更好地擴展用于更困難的任務。

推箱子

圖片

為了測試能否在不同且更復雜的任務(具有不同的 token 化模式)上得到類似的結果,該團隊還生成了一個推箱子的規劃數據集進行測試。

圖 7 展示了每種模型針對每個測試任務生成正確規劃的概率。

可以看到,和上一個實驗一樣,通過使用執行軌跡進行訓練,搜索增強型模型的表現優于僅使用解訓練的模型。

Searchformer:通過引導方法提升搜索動態

最后一個實驗,該團隊研究了搜索增強型模型可以如何迭代提升,從而憑借更少的搜索步數計算出最優規劃。這里的目標是在縮短搜索軌跡長度的同時依然得到最優解。

圖 8 表明,新提出的搜索動態引導方法能夠迭代式地縮短 Searchformer 模型生成的序列的長度。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-16 13:50:00

模型AI

2025-10-08 10:19:29

2024-12-12 09:00:00

2024-12-19 09:48:07

2023-06-12 09:57:22

AIChatGPT

2023-03-17 08:28:17

GPT-4AI

2024-10-28 08:50:00

2025-02-17 09:30:00

AI訓練模型

2022-05-06 07:31:01

useEventReactHook

2023-12-07 06:51:18

AI模型

2024-10-17 14:10:00

模型訓練

2023-06-30 09:49:23

模型Meta

2023-08-04 13:42:41

2023-06-28 18:10:27

羊駝家族大模型集體進化

2021-10-28 15:41:07

計算機AI 技術

2025-10-23 12:28:40

2025-06-20 08:47:00

量子計算AI模型

2020-09-22 09:54:19

谷歌Android開發者

2019-04-25 10:20:24

Transformer神經網絡模型

2022-12-25 13:46:37

生成器
點贊
收藏

51CTO技術棧公眾號

四虎影院一区二区| 欧美亚洲国产视频| 国产激情99| 国产日韩欧美在线播放不卡| 亚洲精品国偷自产在线99热| 最新在线观看av| 国产成人综合在线播放| 亚洲综合精品一区二区| 麻豆视频久久| 日韩成人av在线播放| 国产一级在线观看| 国产精品久久久久久久蜜臀| 一区二区三区偷拍| 国产精品v日韩精品v欧美精品网站 | 91在线精品视频| 亚洲一区二区免费在线观看| 亚洲国产高潮在线观看| www视频在线观看免费| 一个色在线综合| 男女午夜激情视频| 国产精品一卡二| 欧洲成人一区二区| 在线看片一区| 成人两性免费视频| 美女精品一区最新中文字幕一区二区三区 | 台湾佬成人网| 精品国产凹凸成av人网站| 日本国产在线| 亚洲国产精品久久不卡毛片| 成人狠狠色综合| 99re热这里只有精品免费视频| 中文字幕日韩精品久久| 99精品热6080yy久久| 亚洲一区二区三区香蕉| 欧美日韩伦理| 国产精品美女无圣光视频| 亚洲妇女av| 国产成人极品视频| 国产一区二区三区四区| 国产精品久久久久久久久久免费 | 国产66精品| 欧美xxxx14xxxxx性爽| 日韩成人av电影| 国产亚洲视频在线| 日本欧美日韩| 色噜噜狠狠色综合网图区| 国产成人精品123区免费视频| 亚洲免费视频网站| 日本欧美一区| 久久综合伊人77777| 欧美h版在线观看| 97免费视频在线| 久久精品亚洲成在人线av网址| 欧美精品aaa| 欧美一区二区三区久久| 国产精品扒开腿做爽爽爽视频| 成人短片线上看| 91久久精品www人人做人人爽| 国产综合自拍| 亚洲不卡1区| 成人一区二区三区| 九九热免费精品视频| 亚洲女子a中天字幕| 亚洲美女欧洲| 日韩免费成人网| 成人国产一区| 欧美一区二区三区……| 亚洲成人精品| 色一情一区二区三区四区| 国产福利视频一区二区三区| 爱情岛论坛亚洲首页入口章节| 一区二区国产视频| 日本美女高清在线观看免费| 日韩精品在线免费| 欧美日韩中出| 成人av电影天堂| 秋霞午夜av一区二区三区| 成年人网站国产| 亚洲乱码国产乱码精品精98午夜| 中文字幕国产在线| 91精品国产一区二区三区| 裤袜国产欧美精品一区| 欧美激情a在线| 欧美私人啪啪vps| 激情五月婷婷六月| 亚洲精品国产精华液| av在线导航| 操91在线视频| 欧美日韩亚洲一区三区 | 欧美视频裸体精品| 国产免费拔擦拔擦8x高清在线人| 久久久久国产一区二区三区| 一个色综合网| 午夜久久久久久久久久久| 中文字幕一区二区日韩精品绯色| 在线观看一区视频| 狠狠色噜噜狠狠色综合久| 成人亚洲精品久久久久软件| 国产福利图片| 亚洲国产成人爱av在线播放| 欧美偷窥清纯综合图区| 日韩欧美精品一区二区三区经典| 国产精品视频在线看| 99视频免费在线观看| 韩剧1988免费观看全集| 免费观看日韩电影| 在线观看视频污| 久久精品91久久香蕉加勒比| 亚洲美女色禁图| 俄罗斯xxxx性全过程| 亚洲女同精品视频| 亚洲成人tv| www.亚洲高清| 日韩一区二区高清| 色喇叭免费久久综合| 91免费黄视频| 欧美一区二区三区男人的天堂| 国产一区二区三区电影在线观看| 婷婷无套内射影院| 精品久久久久久久久久久院品网| 国产成人精品三级高清久久91| 无码人妻精品一区二区三区99v| 天天av天天翘天天综合网 | 国产不卡在线观看| 成人妖精视频yjsp地址| 国产视频在线播放| 国产日韩欧美91| 国产色91在线| 偷拍中文亚洲欧美动漫| 欧美日韩国产精品一区二区| 五月天精品一区二区三区| 大奶一区二区三区| 日本一级黄视频| 日韩欧美中文字幕制服| 亚洲网色网站| 三级网站在线| 欧美资源在线观看| 中文字幕欧美激情一区| 欧美网站免费| 日本久久久网站| 亚洲精品一区二区三区四区高清| 国产精品s色| 国产一级在线观看| 亚洲xxx大片| 亚洲一二三专区| 一区二区三区日本久久久| 污污动漫在线观看| 欧美精品在线免费观看| 91在线免费视频观看| 成年美女黄网站色大片不卡| 亚洲一区影院| 日韩二区三区在线| 精品伊人久久久久7777人| 国产精品国精产品一二| 色综合久久久久久久久五月| 91麻豆精品国产| 水野朝阳av一区二区三区| 色操视频在线| 中文字幕日韩一区二区三区不卡 | 亚洲国产中文字幕在线观看 | 欧洲成人免费视频| 国产精品久久久久影视| 欧美18免费视频| 亚洲美女主播视频免费观看| 国产精品香蕉av| 一本色道久久综合亚洲精品按摩| 久久精品av| 福利视频在线导航| 欧美亚洲精品日韩| 亚洲精品自在久久| 国产成人亚洲综合色影视| 欧美成人黄色| 久久婷五月综合| 国产欧美精品一区二区三区-老狼| 欧美日韩免费区域视频在线观看| 伊人久久大香线| av文字幕在线观看| 国产黄色激情视频| 欧美成人午夜视频| 亚洲五码中文字幕| 亚洲精品1区| а√在线天堂官网| 免费毛片小视频| 国产97色在线|日韩| 在线亚洲一区二区| 久久国产婷婷国产香蕉| 日韩午夜视频在线| 嫩草影院网站在线| 国产精品久久久久久久久久久久冷| 日韩三级视频在线看| a美女胸又www黄视频久久| 欧美午夜寂寞| 天堂аⅴ在线地址8| 9色视频在线观看| 国内免费久久久久久久久久久| 欧美性猛交xxxxx免费看| 久久精品久久99精品久久| 亚洲专区**| 2021av在线| 免费无码av片在线观看|