国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

微軟 Agentic 組織:下一代 AI 系統

人工智能
你面對一道復雜數學題,不是一個人死磕,而是能瞬間召喚3-4個"分身"同時從不同角度進攻,還能動態調配任務、合并成果。這不是科幻,而是LLM通過強化學習學會的真本事。

大家好!今天要聊的這篇論文特別有意思——它讓LLM從單打獨斗的推理者,進化成了會帶團隊的項目經理。微軟研究院提出了一種全新的推理范式:AsyncThink(異步思維)。

圖片

想象一下:你面對一道復雜數學題,不是一個人死磕,而是能瞬間召喚3-4個"分身"同時從不同角度進攻,還能動態調配任務、合并成果。這不是科幻,而是LLM通過強化學習學會的真本事。

?? 為什么需要"異步思維"?

傳統LLM推理就像一條單行道:Chain-of-Thought(CoT) 必須一個字一個字按順序生成。雖然有效,但效率低下。近年來流行的并行思考(Parallel Thinking) 雖然能生成多條獨立推理路徑再投票表決,但存在致命短板:

三種思維范式對比三種思維范式對比

圖1:三種思維范式的本質區別。AsyncThink的精髓在于"動態組織"——不是簡單地并行,而是學會何時分叉、何時聚合

  1. 延遲陷阱:必須等最慢的那條路徑完成
  2. 僵硬結構:手工設計的固定流程,無法根據問題難度自適應調整
  3. 學習困境:難以通過強化學習優化組織結構

核心方法:Organizer-Worker協議

論文的天才之處在于:把復雜的并發控制轉化為純文本協議,無需修改模型架構!

角色分工

概念

定義

計算機系統類比

Agent

順序執行動作的模型實例

CPU核心

Agent Pool

可同時運行的agent集合

多核CPU

Organization Policy

組織agent協作并發的策略

多進程程序

表1:Agentic Organization概念與計算機系統的優雅類比表1:Agentic Organization概念與計算機系統的優雅類比

四大動作標簽

整個系統通過四個簡單的文本標簽實現復雜協同:

  • <FORK-i>子任務描述</FORK-i>  :組織者向空閑工人i分配子查詢
  • <JOIN-i>  :組織者等待工人i返回結果并合并
  • <ANSWER>最終答案</ANSWER>  :終止推理
  • Think  :組織者自己繼續思考

協議示例協議示例

圖2:AsyncThink的完整 thinking protocol。注意看 organizers 如何像項目經理一樣動態調配任務

??? 兩階段訓練:從模仿到創新

Stage 1:冷啟動格式學習

問題來了:現有語料庫壓根沒有這種Fork-Join對話數據,怎么辦?

解決方案:用GPT-4o合成數據!具體步驟:

  1. 分析每個查詢,識別"條件獨立"的思維片段
  2. 生成符合協議格式的organizer-worker對話軌跡
  3. 過濾格式錯誤的數據

關鍵技巧:為避免模型只學到單一模式(如總是先Fork再Join),研究者隨機采樣動作序列作為提示,強制模型探索多樣化結構。

Stage 2:強化學習優化

RL框架RL框架

圖3:專為AsyncThink設計的RL框架。注意episode包含多條trace,但共享同一個優勢函數

獎勵設計三板斧:

  1. 準確率獎勵:答案正確給1分,錯誤給0分
  2. 格式獎勵:出現重復Fork、線程池溢出等錯誤直接給大懲罰
  3. 并發獎勵:這是精髓!

(平均活躍工人數)(并發度獎勵)

目標:鼓勵模型讓workers并行跑起來,而不是 sequential 地一個個用!

圖片圖片

實驗結果:全方位碾壓

1. 多解Countdown任務

在這個需要找出4種不同解法的算術游戲中,AsyncThink展現出驚人優勢:

Countdown實驗結果Countdown實驗結果

圖5:"≥a Correct"表示成功找到a個不同解。AsyncThink在"全部正確"指標上達到89.0%,遠超基線的68.6%和70.5%

2. 數學競賽推理

圖片圖片

表2:關鍵數據——AsyncThink用更短延遲達到同等甚至更高準確率,延遲降低28%!

3. 跨領域泛化能力(最驚喜的部分!)

當只在Countdown任務上訓練的AsyncThink被直接扔到Sudoku、圖論、遺傳學等完全陌生的領域時,它依然能熟練使用Fork-Join策略!

圖片圖片

表4:零樣本泛化到Sudoku任務。注意模型從未見過Sudoku數據,卻自發學會了如何分解這個新問題

案例研究:它到底怎么想的?

案例1:Countdown的多階段分治

Countdown思考軌跡Countdown思考軌跡

圖8:真實推理軌跡。Organizer先派worker探索乘法路徑,自己同時找其他組合,發現差距后又動態發起新子任務

案例2:幾何題的并行探索

數學推理軌跡數學推理軌跡

圖9:面對四面體幾何題,organizer同時fork三個worker用不同方法(向量法、重心法、假設法),最后交叉驗證得到一致答案

案例3:跨領域泛化

MMLU-Pro圖論問題MMLU-Pro圖論問題

遺傳學問題遺傳學問題

圖10-11:未經訓練的圖論和遺傳學問題,AsyncThink依然能正確分解任務。這證明它學的是"如何組織"的元能力

訓練動態揭秘

通過監控RL訓練過程,可以看到模型如何進化:

訓練曲線訓練曲線

圖6:訓練過程中的關鍵指標變化。注意并發比率先降后升,說明模型經歷了從"瞎試"到"有策略地并行"的轉變

The Era of Agentic Organization: Learning to Organize with Language Models
https://arxiv.org/abs/2510.26658
https://aka.ms/GeneralAI


責任編輯:武曉燕 來源: PaperAgent
相關推薦

2013-07-27 21:28:44

2022-07-06 11:38:40

人工智能AI

2021-05-22 23:01:21

人工智能網絡安全

2025-09-28 08:39:56

2014-05-09 13:18:54

iOS移動互聯網

2010-11-03 13:57:18

Windows Ser

2013-06-27 11:21:17

2024-02-07 09:00:00

2014-07-01 13:54:11

ThresholdWindows 9

2021-05-27 09:19:55

Windows10操作系統微軟

2020-09-27 17:27:58

邊緣計算云計算技術

2010-04-08 09:16:23

Itanium架構

2016-07-12 11:41:09

云計算

2010-08-20 09:31:47

微軟云計算編程模式Orle

2025-03-25 10:54:08

2012-11-29 09:59:54

Windows Blu操作系統

2025-01-03 09:24:10

模型架構論文

2020-09-16 10:28:54

邊緣計算云計算數據中心

2012-07-17 10:04:37

微軟Office 15Windows 8
點贊
收藏

51CTO技術棧公眾號

国产精品成人免费精品自在线观看 | 亚洲激情在线观看视频| 成人三级视频| 久久久久一本一区二区青青蜜月| 欧美成人精品一区二区男人小说| 欧美色视频日本高清在线观看| 九色丨porny丨| 中文字幕乱码久久午夜不卡 | 国产老熟妇精品观看| 国产一级特黄a大片免费| 日韩av一二三| 国产精品亚洲不卡a| 亚洲人成网亚洲欧洲无码| 九九热精品在线| 中文成人在线| 日韩在线观看成人| 亚洲资源在线| 操人视频在线观看欧美| 国产在线视频欧美一区| 免费99精品国产自在在线| 精品国产亚洲一区二区三区大结局| 中文字幕9999| 欧美中文高清| 欧美孕妇毛茸茸xxxx| av亚洲免费| 69174成人网| 亚洲一区免费| 亚洲日本精品| 久久精品国产免费| www.午夜色| 播五月开心婷婷综合| www黄色av| 亚洲欧美电影院| 亚洲校园欧美国产另类| 麻豆免费看一区二区三区| 538国产精品一区二区在线| 欧美偷拍一区二区| 免费在线看黄色| 欧美美女网站色| 欧美一区综合| 欧美日韩视频在线第一区| 国产美女性感在线观看懂色av| 日本韩国精品在线| 98在线视频| 亚洲国产天堂久久综合| 日日夜夜天天综合入口| 亚洲精品99久久久久| 91国拍精品国产粉嫩亚洲一区| 精品国产一区二区三区四区在线观看 | 性生活免费观看视频| 国产成人激情av| 午夜肉伦伦影院| 亚洲福利视频一区二区| 一级毛片视频在线观看| 日韩av在线影院| 精品视频在线一区| 国产精品免费久久久久久| 韩日精品视频| 日韩视频在线视频| 亚洲综合视频在线观看| 国产写真视频在线观看| 日韩视频―中文字幕| 欧美电影《睫毛膏》| 视频一区视频二区视频三区高| 91小视频免费看| 日本福利在线观看| 亚洲欧美一区二区三区在线| 免费观看久久av| 欧美精品尤物在线| 欧美国产日韩精品免费观看| 黄色av网站在线看| 自拍偷拍亚洲在线| 忘忧草精品久久久久久久高清| 亚洲国产一区二区三区在线| 欧美国产综合一区二区| 日本在线www| 亚洲18私人小影院| 日韩和欧美的一区| 国产日本韩国在线播放| 亚洲国产成人在线视频| 九九视频精品全部免费播放| 亚洲国产精品日韩| 亚洲午夜成aⅴ人片| sis001欧美| 91精品在线看| 久久婷婷一区二区三区| av色综合久久天堂av色综合在| 韩国国内大量揄拍精品视频| 久久国产三级精品| 中文在线天堂库| 欧美大片va欧美在线播放| 91久久亚洲| 福利在线白白| 日日噜噜噜夜夜爽亚洲精品| 国产精品美女久久久| 国产91福利| 久热精品视频在线| 老汉av免费一区二区三区| 深夜福利视频在线免费观看| 久久成人人人人精品欧| 三级不卡在线观看| 污污软件在线观看| 97国产精品久久| 成人a区在线观看| 欧美xxxx性xxxxx高清| 69堂成人精品视频免费| 亚洲国产高清不卡| 97色婷婷成人综合在线观看| 亚洲欧美日韩精品综合在线观看 | 亚洲资源网站| 日本在线视频www| 亚洲国产另类久久精品| 国产一区亚洲| 亚洲男男gay视频| 欧美日韩福利视频| www.亚洲人| 人在线成免费视频| 日韩欧美一区二区三区四区五区 | 免费看污污视频| 欧美一区二区三区的| 日韩电影在线视频| 成年网站免费| 国内伊人久久久久久网站视频 | 欧美一区少妇| 欧美猛男男办公室激情| 午夜欧美理论片| 91天堂在线| 国产精品日本精品| 亚洲男人的天堂网| 五月天亚洲一区| xxxxx国产| 国产精品高潮粉嫩av| 亚洲色欲色欲www| 性人久久久久| 国产1区2区3区| 国产精品视频播放| 亚洲精品视频在线| 久久porn| 69日本xxxxxxxxx49| 97精品久久久| 亚洲一区日韩精品中文字幕| 成人影视亚洲图片在线| 日本一区二区三区在线观看视频| 97人人模人人爽人人少妇| 欧美在线观看你懂的| 日韩精品一级中文字幕精品视频免费观看 | 久久久久久久国产精品| 国产三级精品视频| 巨人精品**| julia中文字幕久久亚洲蜜臀| 成人中文字幕在线观看| 欧美日韩亚洲高清一区二区| 日本不卡一区二区三区 | 欧美日韩一级大片网址| 亚洲欧洲日本mm| 成人黄色动漫| 黑丝一区二区三区| 青青草手机在线| 国产欧美日韩伦理| 91精品蜜臀在线一区尤物| 视频一区二区三区中文字幕| 久热在线观看视频| 日韩久久一级片| 国产精品白丝jk喷水视频一区| 欧美视频中文在线看| 另类激情亚洲| www.国产精品| www.男人的天堂| 99九九视频| 精品国产乱码久久| 久久中文字幕电影| 成人三级视频| 在线黄色网页| 激情婷婷综合网| 91免费欧美精品| 亚洲精品成人久久| 国产日产欧产精品推荐色| 欧美激情电影| 欧美巨大丰满猛性社交| 五月婷婷狠狠操| 91日韩久久| 亚洲香蕉成视频在线观看| 国产片一区二区| 欧美日韩a区| 99re久久| 中文在线二区| 日本一级淫片演员| 欧美中文字幕第一页| 欧美日韩不卡一区二区| 国产jizzjizz一区二区| 欧美人妖在线| 欧美videosex性极品hd| 久久久免费视频网站| 亚洲综合在线做性| 国产午夜精品全部视频在线播放| 亚洲三级在线免费观看| 久久只有精品| 杨幂一区二区三区免费看视频| 欧美卡一卡二| 特级全黄一级毛片|