国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

微軟 Agentic 組織:下一代 AI 系統

人工智能
你面對一道復雜數學題,不是一個人死磕,而是能瞬間召喚3-4個"分身"同時從不同角度進攻,還能動態調配任務、合并成果。這不是科幻,而是LLM通過強化學習學會的真本事。

大家好!今天要聊的這篇論文特別有意思——它讓LLM從單打獨斗的推理者,進化成了會帶團隊的項目經理。微軟研究院提出了一種全新的推理范式:AsyncThink(異步思維)。

圖片

想象一下:你面對一道復雜數學題,不是一個人死磕,而是能瞬間召喚3-4個"分身"同時從不同角度進攻,還能動態調配任務、合并成果。這不是科幻,而是LLM通過強化學習學會的真本事。

?? 為什么需要"異步思維"?

傳統LLM推理就像一條單行道:Chain-of-Thought(CoT) 必須一個字一個字按順序生成。雖然有效,但效率低下。近年來流行的并行思考(Parallel Thinking) 雖然能生成多條獨立推理路徑再投票表決,但存在致命短板:

三種思維范式對比三種思維范式對比

圖1:三種思維范式的本質區別。AsyncThink的精髓在于"動態組織"——不是簡單地并行,而是學會何時分叉、何時聚合

  1. 延遲陷阱:必須等最慢的那條路徑完成
  2. 僵硬結構:手工設計的固定流程,無法根據問題難度自適應調整
  3. 學習困境:難以通過強化學習優化組織結構

核心方法:Organizer-Worker協議

論文的天才之處在于:把復雜的并發控制轉化為純文本協議,無需修改模型架構!

角色分工

概念

定義

計算機系統類比

Agent

順序執行動作的模型實例

CPU核心

Agent Pool

可同時運行的agent集合

多核CPU

Organization Policy

組織agent協作并發的策略

多進程程序

表1:Agentic Organization概念與計算機系統的優雅類比表1:Agentic Organization概念與計算機系統的優雅類比

四大動作標簽

整個系統通過四個簡單的文本標簽實現復雜協同:

  • <FORK-i>子任務描述</FORK-i>  :組織者向空閑工人i分配子查詢
  • <JOIN-i>  :組織者等待工人i返回結果并合并
  • <ANSWER>最終答案</ANSWER>  :終止推理
  • Think  :組織者自己繼續思考

協議示例協議示例

圖2:AsyncThink的完整 thinking protocol。注意看 organizers 如何像項目經理一樣動態調配任務

??? 兩階段訓練:從模仿到創新

Stage 1:冷啟動格式學習

問題來了:現有語料庫壓根沒有這種Fork-Join對話數據,怎么辦?

解決方案:用GPT-4o合成數據!具體步驟:

  1. 分析每個查詢,識別"條件獨立"的思維片段
  2. 生成符合協議格式的organizer-worker對話軌跡
  3. 過濾格式錯誤的數據

關鍵技巧:為避免模型只學到單一模式(如總是先Fork再Join),研究者隨機采樣動作序列作為提示,強制模型探索多樣化結構。

Stage 2:強化學習優化

RL框架RL框架

圖3:專為AsyncThink設計的RL框架。注意episode包含多條trace,但共享同一個優勢函數

獎勵設計三板斧:

  1. 準確率獎勵:答案正確給1分,錯誤給0分
  2. 格式獎勵:出現重復Fork、線程池溢出等錯誤直接給大懲罰
  3. 并發獎勵:這是精髓!

(平均活躍工人數)(并發度獎勵)

目標:鼓勵模型讓workers并行跑起來,而不是 sequential 地一個個用!

圖片圖片

實驗結果:全方位碾壓

1. 多解Countdown任務

在這個需要找出4種不同解法的算術游戲中,AsyncThink展現出驚人優勢:

Countdown實驗結果Countdown實驗結果

圖5:"≥a Correct"表示成功找到a個不同解。AsyncThink在"全部正確"指標上達到89.0%,遠超基線的68.6%和70.5%

2. 數學競賽推理

圖片圖片

表2:關鍵數據——AsyncThink用更短延遲達到同等甚至更高準確率,延遲降低28%!

3. 跨領域泛化能力(最驚喜的部分!)

當只在Countdown任務上訓練的AsyncThink被直接扔到Sudoku、圖論、遺傳學等完全陌生的領域時,它依然能熟練使用Fork-Join策略!

圖片圖片

表4:零樣本泛化到Sudoku任務。注意模型從未見過Sudoku數據,卻自發學會了如何分解這個新問題

案例研究:它到底怎么想的?

案例1:Countdown的多階段分治

Countdown思考軌跡Countdown思考軌跡

圖8:真實推理軌跡。Organizer先派worker探索乘法路徑,自己同時找其他組合,發現差距后又動態發起新子任務

案例2:幾何題的并行探索

數學推理軌跡數學推理軌跡

圖9:面對四面體幾何題,organizer同時fork三個worker用不同方法(向量法、重心法、假設法),最后交叉驗證得到一致答案

案例3:跨領域泛化

MMLU-Pro圖論問題MMLU-Pro圖論問題

遺傳學問題遺傳學問題

圖10-11:未經訓練的圖論和遺傳學問題,AsyncThink依然能正確分解任務。這證明它學的是"如何組織"的元能力

訓練動態揭秘

通過監控RL訓練過程,可以看到模型如何進化:

訓練曲線訓練曲線

圖6:訓練過程中的關鍵指標變化。注意并發比率先降后升,說明模型經歷了從"瞎試"到"有策略地并行"的轉變

The Era of Agentic Organization: Learning to Organize with Language Models
https://arxiv.org/abs/2510.26658
https://aka.ms/GeneralAI


責任編輯:武曉燕 來源: PaperAgent
相關推薦

2013-07-27 21:28:44

2022-07-06 11:38:40

人工智能AI

2021-05-22 23:01:21

人工智能網絡安全

2025-09-28 08:39:56

2014-05-09 13:18:54

iOS移動互聯網

2010-11-03 13:57:18

Windows Ser

2013-06-27 11:21:17

2024-02-07 09:00:00

2014-07-01 13:54:11

ThresholdWindows 9

2021-05-27 09:19:55

Windows10操作系統微軟

2020-09-27 17:27:58

邊緣計算云計算技術

2010-04-08 09:16:23

Itanium架構

2016-07-12 11:41:09

云計算

2010-08-20 09:31:47

微軟云計算編程模式Orle

2025-03-25 10:54:08

2012-11-29 09:59:54

Windows Blu操作系統

2025-01-03 09:24:10

模型架構論文

2020-09-16 10:28:54

邊緣計算云計算數據中心

2012-07-17 10:04:37

微軟Office 15Windows 8
點贊
收藏

51CTO技術棧公眾號

理论片一区二区在线| 色网址在线观看| 日韩大片在线永久免费观看网站| 亚洲欧美一区二区三区四区 | 国产精品免费一区二区三区观看 | 黄色欧美视频| 色在线视频网| av在线不卡观看免费观看| 香蕉久久aⅴ一区二区三区| 国产欧美一区二区精品忘忧草| 色天使久久综合网天天| 久久九九全国免费| 久久久999| 国产精品久久占久久| 综合久久2019| 欧美亚洲国产一区二区三区va| 中文在线√天堂| 17c丨国产丨精品视频| 资源视频在线播放免费| 亚洲成人a级片| 久久久久国产精品麻豆| 精品免费国产一区二区| 亚洲一区二区免费视频软件合集| 国产综合色香蕉精品| 欧美日韩在线精品一区二区三区激情 | 亚洲一区二区在线看| 国产在线高潮| 国产网站观看9久| 亚洲天堂2018av| 奇米4444一区二区三区| 欧美夫妻性视频| 在线观看成人网| 成人中文在线| 欧美亚州韩日在线看免费版国语版| 国产二区三区四区| 亚洲一区二区三区四区的| 激情开心成人网| 精品综合久久88少妇激情| 狠狠躁18三区二区一区| 亚洲午夜日本在线观看| 国产二区一区| 国产91视频一区| 亚洲午夜精品国产| 午夜亚洲一区| 国产精品影视网| 97国产精品久久| 91欧美在线视频| 精品在线免费视频| 欧美日韩国产成人| 美国一级片在线免费观看视频 | 日韩在线视频精品| 五月天激情综合| 亚洲成人蜜桃| 国产成人一二片| 欧美日韩视频一区二区| 国产欧美日本在线| 成人国产精品| 欧美性xxxxx极品娇小| 高清无码视频直接看| 91在线一区二区| 久久久久久久久久久一区| 日韩精品视频中文字幕| 91精品国产欧美一区二区成人| 高清在线观看免费| 激情欧美国产欧美| 久热精品在线视频| 怡红院av在线| 日韩中文字幕欧美| 色呦呦网站在线观看| 色yeye香蕉凹凸一区二区av| av女优在线| 亚洲天堂av综合网| 中文字幕精品影院| 色婷婷av一区二区三区久久| 老司机aⅴ在线精品导航| 91精品视频网站| 韩国精品福利一区二区三区| 国产精品视频在线播放| 久久免费影院| 国产精品亚洲аv天堂网| 久久成人精品无人区| 精品久久久久久久无码| 久久97超碰国产精品超碰| 99热99在线| 91在线视频观看| 成人精品一区| 向日葵污视频在线观看| 91亚洲精品乱码久久久久久蜜桃| 92福利视频午夜1000合集在线观看| 国产精品亚洲欧美一级在线 | 免费亚洲精品视频| 99国产精品一区二区| 国产成人生活片| 婷婷中文字幕综合| 99国内精品久久久久| 亚洲毛片在线观看.| 黄色免费网站在线观看| 欧美黄色免费网站| 男人的天堂久久精品| 国产精品午夜av在线| 久久亚区不卡日本| 欧美变态另类刺激| 欧美性xxxx极品hd满灌| 亚洲成人黄色| 中文字幕日韩精品久久| 日韩av午夜在线观看| 国产亚洲情侣一区二区无| 国产亲近乱来精品视频| www.综合网.com| 精品99999| 中文在线免费| 国产精品91免费在线| 国产精品亚洲人成在99www| 国内精品400部情侣激情| 日本伊人久久| 欧美 日韩 国产 在线观看| 经典三级在线一区| 在线观看视频黄色| 欧美性感一类影片在线播放| 国产亚洲一卡2卡3卡4卡新区 | 国产精品jizz在线观看美国| 97夜夜澡人人双人人人喊| 欧美1区2区3区| 久久久久久久久久码影片| 亚洲国产一区二区三区| 黄色网免费看| www.xxxx欧美| 国产精品白丝jk黑袜喷水| 黄色大片在线免费看| hitomi一区二区三区精品| 1024在线播放| 精品国产电影| 美美哒免费高清在线观看视频一区二区| 无遮挡在线观看| 日韩欧美成人激情| 天堂√中文最新版在线| 久久福利电影| 欧美三级三级三级爽爽爽| 99热国内精品| 天堂成人在线| 欧美va在线播放| 黄色成人在线观看网站| 好色先生视频污| 成人久久18免费网站漫画| 亚洲色图欧洲色图| 瑟瑟在线观看| 精品国产一区二区亚洲人成毛片| 中文一区一区三区免费在线观看| 久久久7777| 欧美高清激情brazzers| 秋霞国产精品| 国产噜噜噜噜久久久久久久久| 中文字幕一区二区三区在线不卡| 日韩国产福利| 99热最新在线| 粉嫩av一区二区三区粉嫩| 高潮白浆视频| 日本精品久久久久影院| 久久中文在线| 北条麻妃av高潮尖叫在线观看| www.日本久久久久com.| 91年精品国产| 鲁大师精品99久久久| 最近2018中文字幕免费在线视频| 欧美一区二区国产| 日韩电影免费在线| 亚洲国产成人va在线观看麻豆| 久久久最新网址| 亚洲综合在线免费观看| 国产在线精彩视频| 538国产精品一区二区在线 | 色94色欧美sute亚洲线路二 | 无码精品国产一区二区三区免费| 亚洲国产视频一区二区| 欧美va天堂| av在线播放资源| 亚洲视频在线观看一区二区三区| 欧美视频一区在线观看| 另类图片国产| 欧洲成人一区| 国产美女视频黄a视频免费| 丁香婷婷久久久综合精品国产| 欧美mv和日韩mv的网站| 久久一夜天堂av一区二区三区| 亚洲自拍电影| dy888亚洲精品一区二区三区| 欧美在线激情网| 欧洲中文字幕精品| 老汉色老汉首页av亚洲| 亚洲私人影吧| 久久久久久久97| 国产在线精品一区二区夜色| 欧美少妇另类| 一级全黄肉体裸体全过程| 性日韩欧美在线视频| 在线播放国产精品二区一二区四区| 国内精品免费| 久热国产在线| 美女xx视频| 精品国产欧美成人夜夜嗨|