国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

1000多個智能體組成,AI社會模擬器MATRIX-Gen助力大模型自我進化

人工智能 新聞
本研究提出了一種基于 AI 智能體社會模擬的后訓練數據合成框架。

本文作者來自于上海交通大學人工智能學院的Multi-Agent Governance & Intelligence Crew (MAGIC團隊)和牛津大學。共同第一作者有唐鑠、龐祥鶴、劉澤希和唐博瀚。指導老師包括上海交大的王延峰教授、陳思衡副教授,以及牛津大學的董曉文副教授。

隨著大語言模型(LLMs)在處理復雜任務中的廣泛應用,高質量數據的獲取變得尤為關鍵。為了確保模型能夠準確理解并執行用戶指令,模型必須依賴大量真實且多樣化的數據進行后訓練。然而,獲取此類數據往往伴隨著高昂的成本和數據稀缺性。因此,如何有效生成能夠反映現實需求的高質量合成數據,成為了當前亟需解決的核心挑戰。

那么,真實數據的需求是如何產生的?設想一位程序員在進行機器學習模型的開發與調優時,他會提出問題:「如何調整超參數以提高模型預測準確率?」 這種指令并非憑空而來,而是源于他所處的具體工作情境 —— 數據分析和模型優化。同樣,用戶在日常生活中的指令無論是編程任務、醫療診斷還是商業決策,往往與他們所面臨的具體場景密切相關。要生成能夠真實反映用戶需求的合成數據,必須從這些實際情境中出發,模擬出與用戶需求相匹配的場景。

基于這一理念,上海交通大學與牛津大學的研究團隊提出了一項創新方案 —— 基于多智能體模擬的數據合成。團隊提出了 MATRIX——AI 社會模擬器,構建了一個由 1000 多個 AI 智能體組成的模擬社會。在這個模擬社會中,每一個 AI 智能體代表了一個擁有獨立身份和人格的數字人,這些 AI 智能體可以模擬出復雜的交流和互動模式,涵蓋了從軟件開發到商業活動的廣泛場景?;谶@些場景,團隊進一步開發了 MATRIX-Gen 數據合成器,能夠根據不同需求合成高度多樣化且高質量的訓練指令數據。

圖片

  • 論文鏈接:https://arxiv.org/pdf/2410.14251
  • 代碼主頁:https://github.com/ShuoTang123/MATRIX-Gen

為驗證 MATRIX-Gen 合成數據的高質量,研究團隊使用 Llama-3-8B-Instruct 驅動社會模擬,僅合成了 2 萬條數據用于訓練 Llama-3-8B-Base 模型。盡管數據量極少,訓練后的模型在 AlpacaEval 2 和 Arena-Hard 基準測試中竟然大幅超越了 Llama-3-8B-Instruct 自身。這一結果不僅證明了 MATRIX-Gen 合成數據的高效性,也標志著模型在合成數據驅動下實現了自我進化。此外,在代碼生成、多輪對話和安全性任務上,MATRIX-Gen 生成的專用數據同樣表現優異,甚至超越了為這些特定任務設計的專用數據集。這項研究為通過合成數據提升大語言模型性能提供了全新的解決方案,展示了 AI 模擬社會在數據合成中的巨大潛力,為未來大語言模型的后訓練數據合成開辟了創新的路徑。

基于合成數據的后訓練系統

本研究提出的后訓練系統旨在利用基于多智能體模擬技術構建的 AI 模擬社會,合成高質量的訓練數據,以提升預訓練大語言模型的指令跟隨能力。該系統的核心理念源于人類在現實場景中提問的方式 —— 人們基于自身需求提出多樣且深入的問題。因此,本研究通過 AI 模擬社會合成人類社會中的場景,并利用這些場景引導 LLM 提出信息豐富、貼近現實的問題,從而產生高質量的訓練數據。

如下圖所示,該系統包含三個步驟:

圖片

1. 合成社會場景:利用多智能體模擬技術構建 AI 模擬社會,該社會中的每個場景由一組 AI 智能體及其對應的文本行動構成。為了確保社會場景的真實性和多樣性,本研究設計了大規模人類社會模擬器 MATRIX,創建了一個包含各種 AI 智能體的互動環境。此模擬器充分發揮了 LLM 的角色扮演能力,使得 AI 智能體能夠逼真地模擬人類行為,進行規劃、觀察和行動,進而生成豐富且高度真實的社會場景。

2. 合成訓練數據:根據合成的社會場景,生成符合任務需求的后訓練數據。本研究設計了場景驅動的指令生成器 MATRIX-Gen,模擬人類在日常生活中提出問題的過程,結合場景生成指令,確保更高的真實性;通過選擇特定場景,能夠合成符合任務需求的數據,具備可控性。這一步驟合成包括 SFT、DPO 以及各種專用數據集。

3. 模型微調:利用合成的 SFT 數據集,對預訓練模型進行監督微調,以獲得具備指令跟隨能力的模型。隨后,基于合成的偏好數據集,采用 DPO 進一步訓練模型。

AI 社會模擬器 MATRIX

為了合成多樣且豐富的場景,以助力數據的合成,本研究提出了人類社會模擬器 MATRIX。該模擬器的輸入為若干 AI 智能體檔案,輸出為文本形式的場景。通過模擬人類的 AI 智能體和結構化的通信機制,MATRIX 實現了大規模的人類社會模擬,從而生成多樣且真實的場景。

圖片

  • 模擬人類的智能體:每個 AI 智能體根據匿名化的真實人類檔案進行初始化,并由 LLM 生成其個性和人生目標。這些目標進一步分解為可執行的步驟,形成 AI 智能體的行動計劃。例如,一個醫學教授的生活目標可能包括傳播科學知識,而其計劃則包括進行研究、發表論文、進行講座和組織教育項目。這些步驟指導 AI 智能體未來的行動,確保它們朝著目標努力并展現出有目的的行為。當出現新觀察時,AI 智能體會根據其記憶和個性做出反應;在沒有新觀察的情況下,它們則遵循既定計劃追求目標。


  • 結構化的通信機制:受人類社會中同質性現象的啟發,我們根據相似特征對 AI 智能體進行分組,以減少不必要的連接,從而提高模擬的可擴展性。在每組中,本研究引入一個集中調節器來管理組內和組間的溝通。這一設計促進了相似 AI 智能體之間的更多互動,同時仍允許長距離交流,豐富信息流并增強真實性。此外,這種結構化通信機制能夠防止 AI 智能體接收到過多無關信息,確保模擬的有效性。

數據合成器 MATRIX-Gen

在合成了真實多樣化的社會場景后,本研究設計了場景驅動的指令生成器 MATRIX-Gen,以滿足特定任務需求并合成后訓練數據。通過選擇與用戶需求相關的場景,MATRIX-Gen 能夠生成符合人類意圖的指令,從而確保合成指令的真實性和可控性。

如下圖所示,在合成后訓練數據的過程中,MATRIX-Gen 模擬了人類提問的過程。針對不同數據場景的需求(如通用任務或代碼任務),MATRIX-Gen 結合每個 AI 智能體的個性和行動,將這些信息整合到指令生成提示中,模擬人類在日常生活中提出問題的方式。隨后,基于上述指令生成提示,MATRIX-Gen 直接調用對齊的 LLM 生成合成指令及其對應的回答。

圖片

下圖展示了一位 IT 經理在汽車數據分析場景下,提出「如何調整超參數以提高模型預測準確率」的例子:

圖片

通過這一方法,本研究能夠合成三種類型的數據集,包括監督微調數據集 MATRIX-Gen-SFT、偏好調優數據集 MATRIX-Gen-DPO,以及特定領域的 SFT 數據。每種數據集的指令生成在復雜性和專業性上各具特點,確保滿足不同場景下的需求。

性能表現

在實驗中,本研究選擇 Llama-3-8B-Instruct 作為數據合成模型,選擇 Llama-3-8B 作為訓練的模型,通過模型的訓練效果評估 MATRIX-Gen 在通用任務、多輪對話、代碼生成上的數據合成能力。

圖片

AlpacaEval 2 和 Arena-Hard 上的評估結果表明,通過多智能體模擬合成的 MATRIX-Gen-SFT 數據優于多個真實數據集以及合成數據集。

圖片

在 MATRIX-SFT 模型上 DPO 的訓練結果表明,通過 MATRIX-Gen-DPO 訓練的模型超越多種合成偏好數據訓練的模型,以及 Llama-3-8B-Instruct。值得注意的是,MATRIX-Gen-DPO 訓練后的模型總共僅使用了 2 萬條合成數據,便實現了對 Llama-3-8B-Instruct 自身的超越,充分展示了其高質量和自我進化的能力。

圖片

在代碼生成與安全輸出的任務中,MATRIX-Gen 合成的數據集均超越了對應領域的專用數據集,顯示出 MATRIX-Gen 在合成數據上的高可控性。

圖片

上圖展示了 MATRIX-Gen-SFT 合成指令的可視化,顯示出合成數據的多樣性。

總結與展望

本研究提出了一種基于 AI 智能體社會模擬的后訓練數據合成框架。依托 MATRIX 合成的 AI 模擬社會,MATRIX-Gen 能夠可控地合成高質量的多樣數據。在通用和專用任務中,僅使用 0.2% 的數據,即可獲得優于大模型研發領軍團隊 Meta AI 所用數據集的模型訓練效果,突顯了 MATRIX-Gen 在數據合成中的優勢。

本研究希望該數據合成框架能夠幫助定量研究何種類型的數據更適合用于監督微調和偏好優化,深入探討不同數據特性對模型性能的影響。此外,我們展望通過引入更強大的 AI 智能體,如具備工具調用能力的 AI 智能體,以及接入更豐富的環境,進一步合成更復雜的數據,從而提升大語言模型在復雜任務中的表現。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-07-31 02:00:00

智能體Agent人工超級智能

2024-06-13 09:20:26

2023-11-15 13:18:50

2025-10-13 09:46:12

2025-10-22 09:00:00

2024-02-27 11:45:59

2025-02-19 14:00:00

模型AI訓練

2024-10-28 14:05:00

2024-04-01 13:11:00

AI智能體SIMA

2022-06-21 14:08:25

AIGitHub模仿人類

2025-03-10 09:15:00

2024-12-05 13:30:00

2025-02-24 09:58:09

2021-02-07 10:01:31

AI 數據人工智能

2025-11-06 01:44:00

2024-02-19 08:35:00

2025-08-18 09:08:00

2025-07-04 16:46:57

智能體模型AI
點贊
收藏

51CTO技術棧公眾號

亚洲深夜激情| 欧洲永久精品大片ww免费漫画| 亚洲一区二区精品久久av| 57pao精品| 日本网站在线免费观看视频| 成人动漫av在线| 国产亚洲自拍偷拍| 日本成人手机在线| 欧美成人女星排行榜| 午夜影院免费| 久久久久久麻豆| 亚洲欧洲日夜超级视频| 婷婷综合社区| 欧美亚洲国产另类| 亚洲精品毛片| 日韩精品中文字| 青青草免费在线| 国产精品女同互慰在线看| 美国av在线播放| 亚洲一区自拍| av成人在线电影| 精品日韩在线| 欧美大片欧美激情性色a∨久久| xxx.xxx欧美| 在线观看亚洲专区| 粉嫩喷白浆久久| 久久久国产午夜精品| 亚洲午夜精品国产| 欧美三级小说| 91美女片黄在线观| 精品高清在线| 91av视频在线观看| 动漫一区二区三区| 亚洲欧美国产日韩中文字幕| 亚洲婷婷噜噜| 91精品国产黑色紧身裤美女| 黑人与亚洲人色ⅹvideos| 亚洲欧美色图小说| www.日本一区| 国产丝袜美腿一区二区三区| 久久综合亚洲精品| 国产一区福利在线| 日韩视频在线观看视频| 美腿丝袜亚洲三区| 亚洲aⅴ天堂av在线电影软件| 久久精品人人| 日韩国产欧美精品| 日本视频一区二区三区| 日韩精品在在线一区二区中文| 久久久久欧美精品| 在线看无码的免费网站| 狠狠色综合色综合网络| 一级一片免费播放| 国产盗摄精品一区二区三区在线| 国产高清精品软男同| 国产又黄又大久久| 中国女人做爰视频| 99久久精品国产精品久久 | 激情综合闲人网| 色综合久久久久久久久| 色开心亚洲综合| 91精品久久久久久蜜臀| www.youjizz.com在线| 亚洲精品一区二区在线| 精品久久福利| 欧美中文字幕视频| 欧美日韩一区二区国产| 亚洲一区三区电影在线观看| www.激情成人| 电影天堂久久| 欧美午夜免费电影| 91精品产国品一二三产区| 欧美另类精品xxxx孕妇| 秋霞综合在线视频| 国产精品一区二区三区不卡| 蜜桃精品在线观看| 亚洲人精品午夜射精日韩| 国产精品第五页| 国产精品二线| 伊人精品在线观看| 亚洲动漫在线观看| 亚洲最大的成人网| 人妻夜夜添夜夜无码av| 成人av网站在线观看| 国产超级av在线| 亚洲色图制服诱惑| 国产中文字幕在线观看| 欧美高清dvd| 日韩欧美看国产| 欧美亚洲视频在线观看| 激情视频一区| 国产 欧美 日韩 一区| 国产精品毛片无遮挡高清| 久久久不卡网国产精品一区| 美女一级全黄| 91精品国产入口在线| 欧美韩国日本| 91网站在线看| 国产精品69久久久久水密桃| 97高清视频| 欧美videos中文字幕| 亚洲精品影片| 99国精产品一二二线| 国产麻豆午夜三级精品| 91精品国产一区二区三密臀| 亚洲国产欧美精品| 伊人久久大香线蕉| 亚洲精品自在在线观看| 中文字幕日韩av资源站| 国产精品扒开做爽爽爽的视频| 国产一区久久| 日本三级福利片| 国产亚洲一本大道中文在线| 亚洲天堂一区二区| 国产成人福利视频| 久久青草久久| 国产熟女高潮视频| 国产精品乱码妇女bbbb| 国产福利小视频在线观看| 亚洲精品一区二区在线观看| 日本网站在线免费观看视频| 国产精品区一区二区三含羞草| 精品一区二区三区久久| 22288色视频在线观看| xxx成人少妇69| 免费看的黄色欧美网站| 猛男欧美办公室激情在线| 久久精品国产一区二区三区 | 欧美日韩国产成人在线| 亚洲美女少妇无套啪啪呻吟| 网上成人av| 色偷偷噜噜噜亚洲男人| 亚洲一区二区动漫| 污网站在线播放| 日本久久久久久| 国产欧美日本一区二区三区| 天天综合av| 亚洲精品无人区| 欧美一区二区三区四区五区| 伊人久久大香线蕉av超碰演员| 中文字幕av网| 欧美在线视频在线播放完整版免费观看 | 日韩免费视频| www99热| 欧美高清视频一区二区| 国产精品99久久久| 成av人片在线观看www| 欧美日韩在线一区二区三区| 欧美影视一区二区三区| 一区二区国产在线| 在线成人一区| 国产精品高潮呻吟久久av黑人| 久久先锋影音av鲁色资源| 345成人影院| www国产无套内射com| 亚洲理论在线a中文字幕| 青青草97国产精品免费观看无弹窗版| 美女av在线播放| 国模精品娜娜一二三区| 精品视频一区三区九区| 亚洲激情欧美| 色呦呦网站在线观看| 亚洲欧美日产图| 日韩精品免费在线播放| 国产精品88av| 免费精品一区| 91国内视频| 成人精品视频久久久久| 日本精品免费观看高清观看| 午夜精品999| 麻豆tv在线| 日产精品久久久久久久蜜臀| 欧美成人精品在线| 最新欧美精品一区二区三区| 奇米色欧美一区二区三区| 免费福利在线观看| 日韩性感在线| xvideos成人免费中文版| 国产精品国产三级国产aⅴ无密码| 狠狠做六月爱婷婷综合aⅴ| 黄色毛片在线看| 一本色道婷婷久久欧美| 最新国产精品拍自在线播放| 国产农村妇女精品| 日韩系列欧美系列| 1024在线播放| 精品国产av无码一区二区三区| 午夜精品福利电影| 一本色道久久综合亚洲精品按摩| 国产精品夜夜夜| 国产精品第一| 成视人a免费观看视频| 好吊妞www.84com只有这里才有精品| 欧美美女网站色| 成人久久视频在线观看| 欧美激情在线精品一区二区三区| 一级毛片视频在线| 91成人在线观看喷潮教学| 国产免费亚洲高清| 精品国产乱码久久久久久浪潮|