国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Paper2Code:好像復(fù)現(xiàn)論文成了可能

發(fā)布于 2025-5-8 00:35
瀏覽
0收藏

引言

可重復(fù)性是科學(xué)進(jìn)步的基石,然而在機(jī)器學(xué)習(xí)領(lǐng)域,許多已發(fā)表論文并未附帶相應(yīng)的代碼實(shí)現(xiàn),阻礙了結(jié)果驗(yàn)證并延緩了科研進(jìn)程。為了解決這一難題,KAIST 與 DeepAuto.ai 的研究團(tuán)隊(duì)提出了 PaperCoder——一種自動(dòng)化框架,能夠從機(jī)器學(xué)習(xí)研究論文中直接生成可執(zhí)行的代碼庫(kù)。

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

PaperCoder 框架概述圖 1:PaperCoder 的三階段流程,展示了如何通過(guò)規(guī)劃、分析和編碼,將論文轉(zhuǎn)換為完整的代碼庫(kù)。

相比于依賴(lài)現(xiàn)有代碼片段或 API 的傳統(tǒng)方案,PaperCoder 通過(guò)多代理系統(tǒng),利用大型語(yǔ)言模型(LLM)模擬人類(lèi)的軟件開(kāi)發(fā)流程,自動(dòng)生成端到端、可執(zhí)行的代碼庫(kù)。該系統(tǒng)由規(guī)劃、分析和生成三個(gè)階段組成,每個(gè)階段由專(zhuān)門(mén)的 LLM 代理協(xié)同完成。

機(jī)器學(xué)習(xí)中的可重復(fù)性危機(jī)

機(jī)器學(xué)習(xí)社區(qū)正面臨嚴(yán)峻的可重復(fù)性挑戰(zhàn)。對(duì)近期頂級(jí)會(huì)議論文的統(tǒng)計(jì)顯示,公開(kāi)代碼的比例極低:

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

機(jī)器學(xué)習(xí)會(huì)議中的代碼可用性圖 2:ICLR、NeurIPS 和 ICML 2024 上公開(kāi)代碼的論文比例。

如圖所示,ICLR 2024 公開(kāi)代碼的論文僅占 21.2%,NeurIPS 2024 為 10.9%,ICML 2024 僅有 31.6%。缺乏實(shí)現(xiàn)細(xì)節(jié)使研究人員難以復(fù)現(xiàn)和擴(kuò)展已有工作,進(jìn)而拖慢整個(gè)領(lǐng)域的發(fā)展。

PaperCoder 框架

PaperCoder 將“從論文到代碼”的任務(wù)形式化為軟件開(kāi)發(fā)問(wèn)題:

?R:包含方法與算法描述的研究論文

?C:生成的代碼庫(kù)

?M:基于 LLM 的轉(zhuǎn)換模型

該框架仿照人類(lèi)開(kāi)發(fā)流程,分為三個(gè)階段:

1.規(guī)劃階段

? 制定整體架構(gòu)路線圖(UML 類(lèi)圖、時(shí)序圖)

? 確定文件依賴(lài)關(guān)系

? 生成配置文件

2.分析階段

? 對(duì)每個(gè)文件和函數(shù)進(jìn)行細(xì)粒度解析

? 分析輸入/輸出、模塊交互和算法細(xì)節(jié)

? 標(biāo)注關(guān)鍵組件(例如位置編碼、優(yōu)化器實(shí)現(xiàn))

3.生成階段

? 按照規(guī)劃階段確定的順序,合成完整代碼庫(kù)

每一階段由相應(yīng)的 LLM 代理執(zhí)行,各代理協(xié)同工作,確保論文中的重要細(xì)節(jié)被準(zhǔn)確提取并融入生成的代碼中。

技術(shù)實(shí)現(xiàn)

PaperCoder 通過(guò)對(duì)比樸素方法,凸顯其結(jié)構(gòu)化流程的優(yōu)勢(shì):

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

PaperCoder 詳細(xì)實(shí)現(xiàn)圖 3:PaperCoder 與直接輸入 LLM 的樸素方法對(duì)比。

?樸素方法:將整篇論文直接喂入 LLM,往往忽略位置編碼或優(yōu)化器等細(xì)節(jié),導(dǎo)致生成的代碼錯(cuò)誤頻發(fā)。

?PaperCoder

a.規(guī)劃:整體設(shè)計(jì)、UML 繪制、依賴(lài)規(guī)劃、配置生成

b.分析:細(xì)粒度解析每個(gè)模塊,識(shí)別關(guān)鍵算法組件

c.編碼:基于分析結(jié)果,逐步合成、實(shí)現(xiàn)所有必要功能

通過(guò)這種分層設(shè)計(jì),PaperCoder 能精確捕捉諸如位置編碼實(shí)現(xiàn)、帶特定超參數(shù)的 Adam 優(yōu)化器等細(xì)節(jié),生成高質(zhì)量、易執(zhí)行的代碼。

評(píng)估方法

PaperCoder 的性能評(píng)估包括定量指標(biāo)與人工評(píng)估:

1.參考評(píng)估:將生成代碼與公開(kāi)參考實(shí)現(xiàn)進(jìn)行對(duì)比

2.無(wú)參考評(píng)估:在缺乏參考實(shí)現(xiàn)的場(chǎng)景下,評(píng)估代碼質(zhì)量

3.人工評(píng)估:由原論文作者或領(lǐng)域?qū)<掖蚍?/p>

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

評(píng)估方法之間的相關(guān)性圖 4:基于參考評(píng)估與無(wú)參考評(píng)估得分的相關(guān)性 (r = 0.79)。

相關(guān)性高達(dá) 0.79,表明即使在無(wú)參考實(shí)現(xiàn)的情況下,也能可靠評(píng)估生成代碼的正確性。

結(jié)果與性能

實(shí)驗(yàn)結(jié)果表明,PaperCoder 相較基線方法具有顯著優(yōu)勢(shì):

1.超越現(xiàn)有基線:優(yōu)于 ChatDev、MetaGPT 等通用方案

2.組件貢獻(xiàn)明顯:規(guī)劃、分析、生成三階段均對(duì)性能提升有所貢獻(xiàn)(通過(guò)消融實(shí)驗(yàn)驗(yàn)證)

3.高執(zhí)行率:生成代碼幾乎無(wú)誤,僅需對(duì) 0.48% 的行數(shù)做小幅修改即可運(yùn)行

4.出色的復(fù)現(xiàn)能力:在 Paper2Code 與 PaperBench 基準(zhǔn)上均表現(xiàn)優(yōu)異,成功復(fù)現(xiàn)論文關(guān)鍵組件

人工評(píng)估

由原論文作者及多位領(lǐng)域?qū)<疫M(jìn)行的人工評(píng)估顯示:

?77%的評(píng)審者認(rèn)為生成的代碼庫(kù)最佳

?85%的評(píng)審者反饋生成結(jié)果對(duì)其研究有顯著幫助

Paper2Code:好像復(fù)現(xiàn)論文成了可能-AI.x社區(qū)

人工評(píng)估表格圖 5:人工評(píng)估示例表格

評(píng)估涵蓋數(shù)據(jù)處理、方法實(shí)現(xiàn)及實(shí)驗(yàn)流程,充分驗(yàn)證了 PaperCoder 在真實(shí)科研場(chǎng)景中的應(yīng)用價(jià)值。

局限性和未來(lái)工作

盡管 PaperCoder 已展現(xiàn)強(qiáng)大能力,但仍存在以下局限:

1.領(lǐng)域局限:目前僅針對(duì)機(jī)器學(xué)習(xí)論文,尚未擴(kuò)展到其他科學(xué)領(lǐng)域

2.評(píng)估依賴(lài):主要依賴(lài)模型指標(biāo),缺乏更多自動(dòng)化執(zhí)行評(píng)估方式

3.復(fù)雜算法:對(duì)高度復(fù)雜或全新算法的支持仍有挑戰(zhàn)

4.依賴(lài)管理:跨環(huán)境兼容性及外部依賴(lài)管理需進(jìn)一步完善

未來(lái)工作可聚焦于:

? 將框架擴(kuò)展至更多學(xué)科

? 引入自動(dòng)化調(diào)試與故障定位評(píng)估

? 集成更豐富的執(zhí)行評(píng)估指標(biāo)

? 強(qiáng)化依賴(lài)性管理與環(huán)境適配

結(jié)論

Paper2Code 引領(lǐng)了從科研論文到可執(zhí)行代碼的自動(dòng)化新范式,通過(guò)多代理 LLM 系統(tǒng)重塑人類(lèi)軟件開(kāi)發(fā)流程,實(shí)現(xiàn)端到端的代碼生成與復(fù)現(xiàn)。三階段方法確保關(guān)鍵細(xì)節(jié)無(wú)遺漏,定量與人工評(píng)估均證明了其有效性。PaperCoder 有望加速機(jī)器學(xué)習(xí)及其他領(lǐng)域的研究進(jìn)展,為構(gòu)建更加開(kāi)放、高效的科研生態(tài)注入新動(dòng)能。

本文轉(zhuǎn)載自??芝士AI吃魚(yú)??,作者:芝士AI吃魚(yú)

已于2025-5-8 11:30:18修改
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
激情综合网五月| www.国产精品.com| 另类色图亚洲色图| 国内外成人在线| 免费在线看污片| 裸模一区二区三区免费| 色狠狠综合天天综合综合| 精品72久久久久中文字幕| 国产精品区在线| 成人看片app| 天天综合天天| 一本久道久久综合中文字幕| 三级久久三级久久| 九九热线视频只有这里最精品| 色影视在线观看| 91精品国产自产在线丝袜啪| 99精品中文字幕在线不卡| 国产精品麻豆成人av电影艾秋| 精品国产99久久久久久| 黄色一级片av| 老太脱裤让老头玩ⅹxxxx| 欧美性久久久久| 亚洲人一区二区| 日本三级黄色网址| 美女羞羞视频在线观看| 欧美三级理论片| 毛片毛片毛片毛片毛片毛片毛片毛片毛片 | 超碰97免费在线| 超碰在线观看97| 成人av在线看| 91三级在线| xxxx18hd亚洲hd捆绑| 成年人视频大全| 亚洲精品日韩成人| 97精品国产97久久久久久免费| 草草视频在线一区二区| 白嫩少妇丰满一区二区| 欧美精品18videos性欧美| 亚洲视频一区在线| 日韩av片子| 日韩三级影院| 欧美 另类 交| 九九视频这里只有精品 | 成人国产精品久久久久久亚洲| 精品国产31久久久久久| 精品成人一区| 麻豆视频在线观看免费网站黄| 一区二区传媒有限公司| 日韩暖暖在线视频| 777奇米成人网| 成人免费视频caoporn| 成人春色在线观看免费网站| 亚洲综合在线一区| 婷婷久久五月天| 欧美成人精品不卡视频在线观看| 亚洲午夜精品久久久久久久久| 成人美女av在线直播| 114国产精品久久免费观看| 中文字幕在线亚洲| 精品粉嫩超白一线天av| 亚洲综合免费观看高清完整版在线| 久久综合五月婷婷| 国产在线精彩视频| 天天摸天天碰天天添| 狠狠干夜夜操| 日本天堂影院在线视频| 欧美精品电影| 波多野结衣在线高清| 嫩呦国产一区二区三区av| 亚洲不卡系列| 亚洲一区二区三区久久| 精品奇米国产一区二区三区| 久久在线观看免费| 日韩一区二区中文| 成人亚洲欧美| 亚洲欧洲成人av每日更新| 午夜伦理福利在线| www.欧美日本| 国产精品亚洲综合| 最近的2019中文字幕免费一页| 亚洲成人动漫在线观看| 久久91精品久久久久久秒播| 网曝91综合精品门事件在线| 成人video亚洲精品| 毛葺葺老太做受视频| 国产视频精品网| 欧美国产日产韩国视频| 欧美日韩成人高清| 久久久国际精品| 亚洲免费中文| 丝袜美腿综合| 超碰在线99| 亚洲男人网站| 国产xxxxx在线观看| 精品国产乱码久久久久软件| 欧美国产极速在线| 亚洲成成品网站| 精品国产福利视频| 337p粉嫩大胆噜噜噜噜噜91av| 亚洲麻豆视频| 天堂网av成人| 岛国精品在线| 搞黄网站在线观看| 成人福利视频导航| 婷婷无套内射影院| 明星裸体视频一区二区| 国产精国产精品| 久久久97精品| 精品av久久707| 色婷婷av久久久久久久| 久久久久综合网| 日韩 欧美一区二区三区| 清纯唯美日韩| 污污的网站18| 欧美日韩在线精品一区二区三区激情综合 | 欧美专区福利在线| 国产欧美一区二区视频| http;//www.99re视频| 青娱乐一区二区| 免费观看羞羞视频网站| 在线观看视频免费| 女同视频在线观看| 香蕉一区二区| 好看的亚洲午夜视频在线| 欧美精品国产| 天使萌一区二区三区免费观看| 国产成a人亚洲精| 国产欧美精品国产国产专区| 国产精品剧情在线亚洲| 国产精品大全| 黄色一级片在线观看| 亚洲国产专区校园欧美| 色激情天天射综合网| 国产一区二区三区免费不卡| 日本福利片在线| 国产精品十八以下禁看| 免费99精品国产自在在线| 日韩高清中文字幕| 欧美一级精品大片| 欧美性生活久久| 91久久精品一区二区三| 亚洲国产乱码最新视频 | 日韩黄色视屏| 亚洲一区在线不卡| 老太脱裤让老头玩ⅹxxxx| 成人免费看片视频在线观看| 亚洲国产综合自拍| 精品欧美日韩在线| 国外成人免费视频| 91黑丝在线观看| 欧美成人ⅴideosxxxxx| 欧美久久久久| 色影视在线观看| 免费一级毛片在线观看| 最新av免费在线| 日本韩国福利视频| 国产一级粉嫩xxxx| 免费看的国产视频网站| av一卡二卡| 麻豆电影传媒二区| 超碰96在线| 伊人75在线| 九九在线视频| 亚洲性无码av在线| 国产精品入口麻豆九色| 国产亚洲综合在线| 国产欧美日韩激情| 国产精品―色哟哟| 亚洲欧美日韩在线播放| 夜夜精品视频一区二区| 亚洲国产乱码最新视频 | 青青久久aⅴ北条麻妃| 午夜精品久久久久久久久久久久| 91国产精品91| 国产精品久久久久久久久久久久 | 青青草av网站| 邪恶网站在线观看| 免费黄色网页| 日本在线视频1区| 三级外国片在线观看视频| v天堂福利视频在线观看| 韩国成人免费视频| 户外露出一区二区三区| 国产视频网站一区二区三区| 丝袜美腿综合| 中文字幕一区二区三区久久网站| 国产视频久久| 日本不卡的三区四区五区| 粉嫩av一区二区三区| 国产精品你懂的在线| 亚洲成人免费av| 欧美在线视频不卡| 欧美一区永久视频免费观看| 国产亚洲欧美另类中文| 高清一区二区三区日本久| 国产欧美精品在线播放| 欧美裸体网站| 亚欧无线一线二线三线区别| 九色视频网站入口| 浪潮av一区|