国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Transformer作者初創公司最新成果:開源新框架突破進化計算瓶頸,樣本效率暴漲數十倍

人工智能 新聞
最新推出的開源框架——ShinkaEvolve,可以讓LLM在自己寫代碼優化自己的同時,還能同時兼顧效率,be like為進化計算裝上一個“加速引擎”。

開源框架實現樣本效率提升數十倍!

同樣的任務,以前要上千次的評估,現在150個樣本就能完成。

Transformer作者Llion Jones帶著自己的初創公司Sakana AI,又來搞事情了。(doge)

最新推出的開源框架——ShinkaEvolve,可以讓LLM在自己寫代碼優化自己的同時,還能同時兼顧效率,be like為進化計算裝上一個“加速引擎”。

主要通過三項架構創新,在數學優化、智能體設計、競爭性編程等多個任務上證明了其性能優勢。

可以說,性能比肩谷歌的AlphaEvolve,但樣本更高效,而且還開源!

下面是更多具體細節。

三大創新技術的引入

想象一下,如果要讓LLM通過進化計算找到問題的最優解,需要走多少步?

以AlphaEvolve為例,首先生成一個猜想,然后跑實驗驗證、吸取教訓,再提出更好的猜想……循環往復,不斷逼近真理。

這樣下來即使是最簡單的一個實驗也要花費巨大資源,計算成本昂貴且耗時嚴重。

而ShinkaEvolve框架則針對上述問題,實現了性能與效率的雙重程序進化,其核心在于三大關鍵技術:

  • 平衡探索與利用的親本抽樣技術

該技術通過分層策略與多方法融合保障進化方向的有效性。

框架在已評估程序的基礎上,利用 “島群模型” 將種群分為獨立子群并行進化,子群之間也會定期遷移知識,并保留最優解以保障獨特性。

具體來說,就是在抽樣時先均勻抽取島群ID,再結合top-K優質解與隨機樣本選取親本及啟發程序,并通過冪律抽樣(按適應度分配概率)與加權抽樣(融合性能與新穎性)的多策略模式,平衡已知的良好解決方案和探索新想法。

  • 代碼新穎性拒絕抽樣

為減少LLM生成重復或低新穎性變異體的無效計算,框架采用嵌入相似度篩選+LLM判優的二級過濾機制。

即首先通過嵌入模型對程序可變異部分進行編碼,計算與現有程序的余弦相似度,如果超過閾值(如0.95)則調用額外LLM評估其語義獨特性,最終僅保留真正具有新穎性的候選解,以確保探索效率。

  • 基于多臂老虎機的LLM集成選擇策略

針對不同LLM在任務與進化階段的性能差異,框架基于UCB1算法動態調度模型。

也就是為每個LLM設置兩個評價指標:記錄使用次數的訪問計數器,和評價預期表現的得分估計。

然后當模型產生新的改進時,通過對比改進幅度,即時更新評分,再借助指數函數對顯著改變強化貢獻權重,并歸一化得分,實現動態選擇當下最合適的LLM。

最終整個框架的運行圍繞著抽樣、變異、反饋形成閉環,為LLM進化計算提供了全新的降本增效范式。

實現樣本效率的數量級提升

另外研究人員還在四個領域(數學優化、Agent設計、競賽編程、LLM訓練)中分別設置對比實驗,以驗證ShinkaEvolve框架的性能。

首先是在數學優化問題上,實驗要求將26個圓放置在一個單位正方形內,使得它們的半徑之和最大化,同時確保沒有圓重疊,并且所有圓都完全包含在正方形邊界內。

結果表明,ShinkaEvolve僅需要150次評估,而AlphaEvolve則需要數千次評估,顯著提升了樣本效率。

同時,整個進化過程呈現出三個不同的階段,包括快速發現基本的半徑優化策略的快速改進階段、持續獲得增量收益的探索階段,以及最終的收斂階段,最終突破了空間利用率與半徑總和的平衡瓶頸。

Agent設計上,實驗針對2024年AIME競賽的30道數學推理問題,提出以gpt-4.1-nano為基礎模型,最多調用10次LLM查詢。

實驗發現ShinkaEvolve的框架設計顯著優于模型基線,包括簡單的單查詢代理和復雜的多數投票方法。

其中7次LLM查詢即產生最大性能,另外在低污染的2023年和未見過的2025年AIME競賽題上也同樣表現穩定,且適配gpt-4.1-mini、o4-mini等多種模型。

另外在ALE-Bench競爭性編程基準測試上評估ShinkaEvolve,觀察其在動態規劃、圖論和組合優化等問題上的解決能力。

結果顯示,10道AtCoder競賽題的平均得分提升2.3%,其中ahc039任務從第5名升至第2名,且具備競賽獲獎潛力。相關代碼的優化也多聚焦細節改進,未依賴大規模重構。

研究人員還在混合專家 (MoE) 負載均衡損失函數的任務上評估ShinkaEvolve,要求以556M參數MoE進化負載平衡損失(LBL),2.7B參數MoE驗證泛化性,最終平衡交叉熵損失與專家均衡性。

結果發現ShinkaEvolve產生的新LBL,在7個下游任務上均表現出更高的準確率、更低的困惑度,而且隨著正則化系數λ增大,優勢則更顯著

最終實驗充分證明,該新框架可有效實現樣本效率的數量級提升,以及跨不同領域任務的廣泛適用性,其開源特性也將進一步降低技術使用門檻。

論文鏈接:https://arxiv.org/abs/2509.19349

代碼鏈接:https://github.com/SakanaAI/ShinkaEvolve

責任編輯:張燕妮 來源: 量子位
相關推薦

2024-03-25 13:06:00

數據訓練

2017-12-06 08:06:47

IBMGPU機器學習

2009-05-19 16:21:04

云計算網格計算計算資源

2009-06-05 09:11:19

中國電信VDSL2ADSL

2024-06-27 11:22:34

2023-02-06 07:17:22

2024-02-19 14:09:00

模型Eagle 7BRNN

2025-06-20 08:55:00

模型AI計算

2025-05-26 04:00:00

2025-01-16 08:30:00

LLMAI訓練

2023-06-21 13:44:57

模型AI

2023-01-16 13:47:59

谷歌模型

2009-05-07 09:52:21

英特爾無線吉比特聯盟無線網絡

2025-03-13 11:59:00

2020-12-17 06:22:57

交互模式代碼

2025-08-21 08:29:09

2025-05-26 00:02:00

TypeScriptGo 語言前端

2019-03-27 13:45:44

MySQL優化技巧數據庫

2025-06-05 04:22:00

SQL性能索引

2023-09-07 11:29:36

API開發
點贊
收藏

51CTO技術棧公眾號

男女在线视频| 第九色区aⅴ天堂久久香| 免费99视频| 成人xxxxx| 成人高清免费| 日韩午夜小视频| 99在线影院| 欧美电影网站| 亚洲日本在线a| 国产中文一区二区| av中文字幕在线播放| 九九久久精品| 欧美一区二区三区在线观看| 艳母动漫在线免费观看| 亚洲国产天堂| 欧美精品乱码久久久久久 | 亚洲欧美日韩在线| 精品1区2区| 91精品福利观看| 亚洲色大成网站www久久九九| 99影视tv| 一区二区在线免费播放| 欧美精品乱码久久久久久| 国产精品永久入口久久久| av丝袜在线| 在线免费不卡视频| 欧美 国产 综合| 999亚洲国产精| 亚洲区成人777777精品| av在线影院| 天天色综合色| 精品久久免费看| 伊人75在线| 久久婷婷一区二区三区| 久久青青草综合| 国产成人1区| 亚洲国产精品va在线| 天堂√在线中文官网在线| 欧美国产激情二区三区| 日韩精品 欧美| 国产福利一区二区三区视频在线| 久久人人九九| 久久激情一区| 国内一区二区在线视频观看 | 精品在线免费观看| 亚洲一区二区自拍| 在线欧美视频| 欧美激情第六页| 快she精品国产999| 日韩欧美一区二区在线观看 | 嗯用力啊快一点好舒服小柔久久| 亚洲国内高清视频| 色多多在线观看| 亚洲精品久久久久久久久| 自拍偷拍亚洲视频| 亚洲男人天堂古典| 激情图片qvod| 国内精品在线播放| 欧美一级中文字幕| 国产精品高潮久久久久无| 黄色片av在线| 亚洲成人在线观看视频| 成人高清免费观看mv| 日韩精品一区二区三区中文不卡| 国产探花视频在线观看| 在线精品国产欧美| 国产精品最新| 国产精品久久久久久久久久久久午夜片 | 男人午夜天堂| 黑人精品xxx一区| 98在线视频| 久久人人爽人人爽爽久久| 日韩专区精品| 免费精品视频一区二区三区| 99久久精品国产一区二区三区 | 欧美日韩精品欧美日韩精品一| 婷婷开心久久网| 国产欧美精品一区二区三区-老狼 国产欧美精品一区二区三区介绍 国产欧美精品一区二区 | 麻豆传媒在线完整视频| 精品久久久久久久人人人人传媒| 精品一区二区三区四区五区| 国产精品盗摄久久久| 国精产品一区一区三区mba桃花| 国产精品视频分类| 91麻豆精品国产91久久久久久| 日韩国产一二三区| 蜜桃传媒视频第一区入口在线看| 日本成人在线不卡视频| 国产理论片免费观看| 日韩精品中文字幕在线观看| 欧美3p视频| 国产二区三区四区| 国产亚洲精品一区二区| 日韩欧美小视频| 国产精品日韩av| 亚洲免费观看高清完整版在线观看| 伊人久久av| 日韩欧美精品一区二区| 日韩午夜在线观看| 超碰97久久国产精品牛牛| 羞羞色国产精品| 一本久久知道综合久久| 欧美视频免费播放| 欧美日韩一区二区欧美激情| 曰本一区二区三区视频| 欧美黑人在线观看| 91精品国产成人www| 色yeye免费人成网站在线观看| 久久99精品国产99久久6尤物| 人禽交欧美网站| 在线成人动漫| 91精品国产91久久久久久久久| 国产另类在线| 国产999在线观看| 欧美日韩国产探花| 水蜜桃亚洲一二三四在线| 夜夜嗨av一区二区三区网页 | 色综合男人天堂| 中文一区二区| 手机福利小视频在线播放| 亚洲尤物视频网| 一区二区三区中文字幕精品精品| 欧美日韩精品福利| av在线不卡免费| 亚洲国产精品123| 亚洲女人初尝黑人巨大| 国产精品青草久久| 综合国产在线| 久久porn| 顶级网黄在线播放| 尤物国产在线观看| 特级黄色录像片| 蜜桃成人在线| 国产97在线|日韩| 久久久99久久精品女同性| 日韩欧美自拍偷拍| 色综合久久综合网欧美综合网| 久久综合丝袜日本网| 蜜臀av性久久久久蜜臀aⅴ流畅| 久久av中文| 久久gogo国模啪啪裸体| 亚洲欧美韩国| 综合视频免费看| 最新高清无码专区| 久久国产人妖系列| 精品盗摄女厕tp美女嘘嘘| 国产丝袜在线观看视频| 国产精品自拍首页| 欧美一区二区二区| 亚洲一区二区三区视频在线播放 | 久久久久久久久99精品| 国产剧情av麻豆香蕉精品| 免费视频最近日韩| 免费精品视频| 捆绑调教美女网站视频一区| 精品一区二区三区视频| 久久精品av| 免费亚洲电影| 伊人网在线免费观看| 亚洲激情图片| 国产精品中文久久久久久久| 一区二区三区四区精品| 91久久人澡人人添人人爽欧美| 奇米一区二区三区av| 欧美亚洲国产精品久久| 欧美日韩成人影院| 在线观看av网站永久| 日韩日韩日韩日韩日韩| 色欲色香天天天综合网www| 99re资源| 欧美在线免费看| 欧美在线免费播放| 久久影视一区| 亚洲黄色免费看| yw在线观看| 好男人免费精品视频| 免费福利片在线观看| 免费黄色福利视频| 国产免费福利| 每日在线更新av| 国产av不卡一区二区| 轻点好疼好大好爽视频| 18岁视频在线观看| 日本黄色三级大片| 亚洲免费影视| 成人看片在线| 伊人伊成久久人综合网小说| 精品国产乱码久久久久久免费| 午夜欧美视频在线观看| 国产精品久久久久永久免费观看| 在线电影一区二区三区| 国产成人综合亚洲| 免费男同深夜夜行网站| 日韩福利在线观看| 大陆精大陆国产国语精品| **国产精品| 中文av一区| 国产欧美日韩激情| 91精品国产91热久久久做人人| 97超级碰在线看视频免费在线看|