国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

RL縮放王炸!DeepSWE開源AI Agent登頂榜首,訓練方法、權重大公開

人工智能 新聞
DeepSWE是基于阿里最新開源的Qwen3-32B模型之上,完全使用強化學習訓練而成。

今天凌晨,著名大模型訓練平臺Together.ai聯合Agentica開源了創(chuàng)新AI Agent框架DeepSWE。

DeepSWE是基于阿里最新開源的Qwen3-32B模型之上,完全使用強化學習訓練而成。

除了權重之外,訓練方法、日志、數據集等所有內容也全部開源,以幫助開發(fā)人員深度學習和改進Agent。

圖片

開源地址:https://huggingface.co/agentica-org/DeepSWE-Preview

根據SWE-Bench-Verified測試數據顯示,DeepSWE在64k最大上下文長度和100最大環(huán)境步驟下進行評估,最終在16次運行平均的Pass@1準確率上達到了42.2%,使用混合測試時擴展(TTS)后性能進一步提升至59%,超過了所有開源Agent框架位列榜首。

DeepSWE證明了僅使用強化學習進行訓練的有效性和巨大潛力。與其他開源模型相比,DeepSWE-Preview在不依賴于更強專有教師模型的蒸餾或SFT的情況下,依然能夠取得了最好的性能。

圖片

DeepSWE的訓練基于rLLM框架,這是一個用于語言智能體后期訓練的系統。該模型在64個H100 GPU上對來自R2E-Gym訓練環(huán)境的4500個真實世界SWE任務進行了6天的訓練。

這些任務涵蓋了從解決GitHub問題到實現新代碼功能和調試等復雜場景,體現了現實世界軟件工程的多樣性和復雜性。

在訓練過程中,DeepSWE-Preview通過與環(huán)境的交互,學習如何瀏覽廣泛的代碼庫、應用有針對性的代碼編輯、運行shell命令進行構建和測試,并在解決實際拉取請求時迭代優(yōu)化和驗證解決方案。

在訓練方法方面,數據集管理采用了R2E-Gym子集的4500個問題,通過過濾與SWE-Bench-Verified來自相同存儲庫的問題,確保訓練數據的純凈性。

所有問題都被映射到單個Docker鏡像中,以便于管理和執(zhí)行。訓練環(huán)境圍繞R2E-Gym構建,該環(huán)境能夠可擴展地管理高質量的可執(zhí)行SWE環(huán)境。狀態(tài)與動作的定義涵蓋了執(zhí)行Bash命令、搜索文件、文件編輯以及完成任務提交等操作。

圖片

獎勵機制采用稀疏結果獎勵模型,即只有當LLM生成的補丁通過所有測試時才給予正獎勵,否則獎勵為零。為了應對訓練過程中出現的擴展挑戰(zhàn),研究人員將Kubernetes支持集成到R2E-Gym中,實現了容器的彈性調度和自動縮放,從而能夠可靠地收集數百萬個軌跡,同時保持計算成本與負載成比例。

在強化學習算法方面,DeepSWE-Preview的訓練采用了GRPO++算法,這是對原始GRPO算法的改進版本。GRPO++整合了來自DAPO、Dr.GRPO、LOOP/RLOO等工作的見解和創(chuàng)新,通過高剪輯、無KL損失、無獎勵標準差、長度歸一化、留一法、緊湊過濾和無熵損失等策略,實現了更穩(wěn)定和性能更高的訓練過程。

圖片  

其中,緊湊過濾策略特別針對多輪代理場景,通過屏蔽達到最大上下文、最大步驟或超時的軌跡,防止訓練期間的獎勵崩潰,并鼓勵代理進行跨步驟的長形式推理。

TTS則是DeepSWE-Preview實現性能提升的關鍵策略之一。在測試階段,通過生成多個軌跡并選擇其中正確解決問題的軌跡,DeepSWE-Preview能夠顯著提高其Pass@1性能。

研究人員嘗試了多種TTS策略,包括基于執(zhí)行的驗證器和無執(zhí)行的驗證器,并最終采用了混合擴展策略,結合了兩種范式的優(yōu)勢,從而實現了59.0%的性能,比當前最先進的開源權重模型高出12%。

圖片

此外,研究人員還發(fā)現,對于SWE相關任務,擴展輸出token的數量似乎并不有效,而滾動數量擴展則能夠帶來更顯著的性能提升。

責任編輯:張燕妮 來源: AIGC開放社區(qū)
相關推薦

2025-12-04 08:57:47

2023-05-06 08:23:36

ChatGPT自然語言技術

2009-05-06 10:45:36

谷歌服務器數據中心

2024-02-27 09:43:37

Pythonlambda函數

2025-08-11 17:58:44

開源技術模型

2025-09-22 10:44:20

2021-12-16 11:57:40

安全服務

2016-07-20 12:42:34

云計算

2016-07-19 09:52:20

云計算

2009-12-04 09:42:44

Google免費公共D

2025-05-13 08:21:18

2024-07-15 12:23:49

2025-09-25 10:25:29

2025-07-28 18:06:04

AI開發(fā)開源

2009-12-15 10:58:15

2025-09-16 07:37:12

2024-07-08 13:11:39

2025-07-28 04:00:00

2009-08-17 10:41:47

英特爾5500CPU性能對比測試
點贊
收藏

51CTO技術棧公眾號

欧美一区二区网站| 精品日产乱码久久久久久仙踪林| 极品少妇xxxx精品少妇| 国产亚洲欧美日韩一区二区| 精品无码国产一区二区三区av| 国产精品xnxxcom| 亚洲欧美在线观看| 国产精品www| 黄网站在线观看| 久久精品一区二区三区中文字幕| 精品av久久707| 青春草国产视频| 国产日韩三级| 日韩欧美成人免费视频| 欧美一级片免费观看| 欧美18av| 国产精品国产自产拍高清av | 激情小说 在线视频| 久久亚洲风情| 色悠悠国产精品| aaaaa毛片| 精品999成人| 亚洲欧美日韩成人| www.99av| 激情文学一区| 亚洲男人天堂九九视频| 午夜激情av在线| 欧美在线亚洲| 亚洲精品黄网在线观看| 麻豆传传媒久久久爱| 99精品美女| 亚洲成人aaa| 精品www久久久久奶水| 久久视频国产| 精品国产乱码久久| 亚洲欧美日韩区| 亚洲一区二区三区xxx视频| 五月天婷婷在线视频| 久久精品久久99精品久久| 日韩一区二区精品视频| 97涩在线观看视频| 欧美日韩专区| 亚洲精品一二区| 成人影院在线观看视频| 欧美三级在线| 亚洲欧美国产精品久久久久久久| 激情综合色综合啪啪开心| 激情一区二区| 一本色道久久88精品综合| av天天av| 亚洲欧美视频| 久久久av网站| 视频三区在线观看| 国产精品一色哟哟哟| 国产97在线亚洲| caopon在线免费视频| 国产日韩欧美制服另类| 国产一区不卡在线观看| 不卡一区视频| 欧美视频在线不卡| 欧洲黄色一级视频| 欧美久久一级| 精品国产一区久久久| 欧美在线一卡| 成人国产电影网| 91精品视频免费观看| 黑人巨大精品| 亚洲国产欧美日韩另类综合| 亚洲欧美日韩综合一区| 久久狠狠久久| 欧美第一区第二区| 自拍偷拍精选| 日韩不卡一二三区| 国产91精品高潮白浆喷水| 国产在线观看a视频| 欧美激情在线一区二区| 看高清中日韩色视频| 亚洲一区二区三区在线免费| 欧美日韩成人在线| 欧美伦理视频在线观看| 99热免费精品在线观看| 久久99久久久久久久噜噜 | 久久久亚洲一区| 久久久久久这里只有精品| 欧洲日本在线| 中文字幕av一区二区三区| 欧美日韩亚洲一区二区三区四区| 久久porn| 日韩电影免费观看中文字幕| 好紧好硬好湿我太爽了| 精品一区二区免费视频| 国产欧美一区二区三区久久人妖| 九九九伊在线综合永久| 色综合一区二区三区| 内射国产内射夫妻免费频道| 韩日精品视频| 欧美激情影音先锋| 天堂av在线电影| 一区二区三区欧美激情| 日韩精品一区二区在线视频| 欧美国产91| 久久久久久伊人| 国产网站在线| 日韩欧美在线播放| 国产真实乱子伦| 日韩二区三区四区| 国产精品综合不卡av| 久久er热在这里只有精品66| 欧美日韩精品一区二区| wwwav91| 国产精品中文字幕欧美| julia一区二区中文久久94| 2020最新国产精品| 亚洲成人999| 欧美91精品久久久久国产性生爱| 国产亚洲一区二区三区| 亚洲色图自拍| 欧美激情视频一区二区三区在线播放| 欧美激情二区三区| 波多野一区二区| 色av成人天堂桃色av| 亚洲欧洲日本精品| 国产精品系列在线观看| 国产午夜精品在线| 亚洲天堂日韩在线| 中文字幕日韩在线视频| 菠萝菠萝蜜在线观看| 香蕉成人伊视频在线观看| 91看片就是不一样| 黄色精品一二区| 国产久一道中文一区| 三级小说欧洲区亚洲区| 中文字幕日韩精品在线观看| а天堂中文在线官网| 天天综合网天天综合色| www.99av.com| 国产成人综合自拍| 欧美日韩一区在线视频| 午夜精品毛片| 91高清免费在线观看| 黄色精品视频网站| 亚洲成人久久久| av电影在线观看网址| 亚洲香肠在线观看| 超碰影院在线观看| 国产精品18久久久久久久网站| 久久青青草综合| 91精品天堂福利在线观看| 91精品国产777在线观看| 69堂精品视频在线播放| 精品国产91亚洲一区二区三区婷婷| 污污软件在线观看| 亚洲欧美在线视频观看| 欧美韩国日本在线| 国产精品一区二区你懂的| 欧美性天天影院| 婷婷综合社区| 2021久久精品国产99国产精品| 日韩福利在线观看| 日韩精品在线观看一区| 成人黄色网址| 欧美性感一区二区三区| 中文字幕在线免费观看| 亚洲视频图片小说| mm1313亚洲国产精品无码试看| 东方欧美亚洲色图在线| 夜夜春亚洲嫩草影视日日摸夜夜添夜| 国产精品久久久久毛片大屁完整版| 成人欧美一区二区三区黑人| 性欧美xxxx免费岛国不卡电影| 欧美成人一区二区三区电影| 欧美黑人粗大| 亚洲第一区中文99精品| 麻豆传媒视频在线观看免费| 日韩欧美在线观看视频| 91网页版在线登录入口| 日韩美女啊v在线免费观看| 亚洲性生活网站| 99国产精品视频免费观看| 欧美极品少妇无套实战| 久久精品免费观看| 亚洲 日韩 国产第一区| 久久久久免费| 久久综合毛片| 99精品视频免费观看视频| 成人自拍视频网站| 欧美91大片| 114国产精品久久免费观看| 日韩国产一区二区三区| 国产aⅴ夜夜欢一区二区三区| 伦理一区二区| 97碰在线观看| 欧美调教网站| …久久精品99久久香蕉国产| www.神马久久| 色综合色综合网色综合| 色悠久久久久综合先锋影音下载| 久久视频中文字幕| 91麻豆精品国产综合久久久 | xxxx成人|