国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大語言模型變身軟體機器人設計「自然選擇器」,GPT、Gemini、Grok爭做最佳

人工智能 新聞
這項研究為 AI 輔助軟體機器人設計開辟了嶄新道路,有望實現更自動化、更智能的設計流程。

大型語言模型 (LLM) 在軟體機器人設計領域展現出了令人振奮的應用潛力。密歇根大學安娜堡分校的研究團隊開發了一個名為「RoboCrafter-QA」的基準測試,用于評估 LLM 在軟體機器人設計中的表現,探索了這些模型能否擔任機器人設計的「自然選擇器」角色。

這項研究為 AI 輔助軟體機器人設計開辟了嶄新道路,有望實現更自動化、更智能的設計流程。

圖片

  • 作者: Changhe Chen, Xiaohao Xu, Xiangdong Wang, Xiaonan Huang 
  • 機構: 密歇根大學安娜堡分校
  • 原論文: Large Language Models as Natural Selector for Embodied Soft Robot Design
  • Github:https://github.com/AisenGinn/evogym_data_generation 
  • 視頻:https://youtu.be/bM_Ez7Da4ME

研究背景

軟體機器人相比傳統剛性機器人具有顯著優勢,特別是在復雜、非結構化和動態環境中,其固有的柔順性能夠實現更安全、更適應性強的交互。然而,軟體機器人設計面臨巨大挑戰:

  1. 與剛性機器人明確定義的運動鏈不同,軟體機器人擁有幾乎無限的自由度
  2. 非線性材料特性復雜
  3. 需要精密協調形態、驅動和控制系統

這些因素使軟體機器人設計成為一項高度挑戰性的多學科問題,傳統上依賴專家直覺、迭代原型設計和計算成本高昂的模擬。

研究創新:從生物進化到 AI 驅動設計

研究團隊提出了生物和機器人設計范式的概念性轉變:

圖片


  1. 生物進化:通過自然選擇壓力驅動,但進程緩慢且受限。
  2. 人類工程設計:由人類直覺和專業知識引導,但仍受人類認知能力限制。
  3. AI 驅動設計:LLM 作為「自然選擇器」,利用其龐大的知識庫評估和指導軟體機器人的設計。

RoboCrafter-QA 基準測試

研究團隊開發的 RoboCrafter-QA 基準測試專門用于評估多模態 LLM 對軟體機器人設計理解的能力。該測試采用問答形式,為 LLM 提供環境描述和任務目標,然后要求模型從兩個候選機器人設計中選擇性能更佳的一個。

圖片

數據生成流程

  1. 設計空間定義:在 5×5 的基于體素的設計空間中進行機器人形態演化,每個體素代表一種材料類型(空、剛性、軟性、水平驅動器或垂直驅動器)。
  2. 進化過程:從 30 個隨機生成的獨特機器人設計開始,使用經過 PPO(近端策略優化)訓練的控制器評估每個機器人。
  3. 選擇與變異:保留每代中表現最佳的 50% 機器人,其余通過變異產生后代,確保設計多樣性。

測試任務多樣性

基準測試包含 12 種不同的任務環境,涵蓋:

  • 運動任務(如平地行走、橋梁行走)
  • 物體操作(如推動、攜帶)
  • 攀爬與平衡任務

圖片

不同結構的機器人的性能差異示意:

圖片

問題示例:

圖片

評估指標

  1. 準確率:模型生成與預期答案匹配的比例
  2. 一致性:衡量 LLM 響應的可重復性
  3. 難度加權準確率 (DWA):根據機器人任務性能的細微差異量化模型的判別能力

實驗結果

研究團隊對四種最先進的大型語言模型進行了測試評估:GPT-o3-mini、Gemini-2.0-flash、Gemini-1.5-Pro 和 Grok-2。

圖片

主要發現:

  1. 模型性能層次:Gemini-1.5-Pro 在簡單任務(68.75%)和困難任務(62.48%)中均表現最佳,其次是 Gemini-2.0-flash 和 Grok-2(準確率約 66%),而 GPT-o3-mini 表現最弱。
  2. 任務難度敏感性:所有模型在更復雜的任務中準確率均有下降,特別是當需要區分細微性能差異的設計時。例如,Gemini-1.5-Pro 在 Walker-v0 任務中,簡單級別準確率為 75.40%,困難級別則降至 65.20%。
  3. 模型在特定環境中的弱點:在跳躍和雙向行走等任務中,所有模型均表現出明顯弱點,這可能與這些任務需要精確時序控制或處理雙向決策相關。

性能分析:獎勵差異水平分析

為評估 LLM 在不同難度水平下選擇更優設計的能力,研究團隊采用了難度加權準確率 (DWA) 指標。該指標特別關注模型在區分細微性能差異設計時的能力,對難度更高的問題(獎勵差異更小)賦予更高權重。

不同 LLM 的全局 DWA 指標:

圖片

研究結果顯示,Gemini-1.5-Pro 在全球平均 DWA 方面表現最佳,達到 63.72%,這表明它在 RoboCrafter-QA 基準測試中具有略微優越的體現設計推理能力。

研究團隊還可視化了不同獎勵差異水平下的錯誤分布情況,發現 LLM 的大部分錯誤出現在 0.8-1.0 的高難度區間,這進一步突顯了當前模型在進行細粒度設計區分方面的局限性。

圖片

提示設計消融研究

為確定影響 LLM 做出正確選擇的關鍵因素,研究團隊針對提示設計進行了消融研究,重點關注任務描述和驅動器描述對模型性能的影響。研究還進行了一項實驗,修改提示指令,要求 LLM 選擇表現較差的設計而非較好的設計,以進一步分析 LLM 決策過程的穩健性。

提示設計消融研究結果:

圖片

消融研究結果揭示了任務描述和驅動器描述在促使語言模型選擇最優設計中的關鍵作用:

  1. 任務描述的重要性:模糊任務描述 (NoEnv) 顯著降低了所有模型的性能,例如 GPT-o3-mini 的準確率從 55.34% 降至 52.08%,Gemini-1.5-pro 從 69.75% 降至 62.50%,這強調了任務描述在引導 LLM 決策過程中的重要性。
  2. 驅動器描述的影響有限:忽略驅動器描述 (NoAct) 對性能影響較小,性能保持穩定或略有變化。這可能表明在缺乏驅動器信息的情況下,LLM 會假設驅動器能夠最大化設計的獎勵。
  3. 選擇較差設計的挑戰:當指示模型選擇較差的設計時,模型表現出比完整信息提示更低的準確率(例如,Gemini-2.0-flash 從 66.62% 降至 58.45%),這表明它們在識別劣質設計方面不太擅長,可能是由于訓練偏向于選擇更好的設計所致。

這些發現強調了在設計選擇任務中,為最大化 LLM 性能提供全面任務描述的必要性。與此同時,研究也表明當前模型在理解設計權衡和進行反直覺選擇(如選擇較差設計)方面仍存在局限性,這可能需要通過更具針對性的訓練或提示策略來解決。

總結與啟示

通過對獎勵差異水平的性能分析和提示設計消融研究,我們可以看出:

  1. 當前最先進的 LLM 在區分明顯不同的設計時表現良好,但在處理細微性能差異時仍面臨挑戰。
  2. 提供清晰、全面的任務描述對于 LLM 做出正確設計選擇至關重要。
  3. 模型表現出偏向選擇更優設計的趨勢,這與其預訓練方式可能有關。

這些發現為利用 LLM 進行軟體機器人設計提供了重要指導,同時也揭示了未來改進方向:可能需要開發針對體現設計的特定訓練策略,或構建更復雜的提示框架,以提高模型在處理細微設計權衡時的性能。

實用價值:LLM 輔助機器人設計初始化

除了評估模型選擇能力外,研究還探索了 LLM 在設計初始化中的應用。通過提供參考環境中的高獎勵和低獎勵設計實例,研究測試了 LLM 是否能為新環境生成可行的初始設計。

圖片

實驗結果表明:

  • 具有參考知識的 LLM 生成的設計全部有效,平均獎勵值達 0.115,方差僅為 0.035。
  • 無參考知識的設計中僅 38% 有效,平均獎勵為 - 0.607。
  • 隨機基線雖然產生了 100% 有效設計,但平均獎勵較低(0.044),方差高(0.405)

這表明 LLM 能夠有效地遷移知識,在零樣本設計生成中表現出色。

研究結論與展望

RoboCrafter-QA 基準測試為評估多模態 LLM 在軟體機器人設計中的表現提供了寶貴工具。研究發現,雖然當前模型在簡單設計選擇上表現良好,但在處理細微權衡和復雜環境時仍面臨挑戰。

未來研究方向:

  1. 探索 LLM 驅動的控制策略優化
  2. 擴展設計空間復雜性
  3. 研究仿真到現實的遷移,包括材料特性和控制器可遷移性
  4. 整合多模態提示(視覺、觸覺)增強 LLM 的設計理解
責任編輯:張燕妮 來源: 機器之心
相關推薦

2013-01-18 09:05:35

設計需求

2022-01-05 22:00:52

機器人軟體機器人

2023-08-25 15:40:24

2025-01-22 08:30:00

2021-03-13 08:00:59

機器人AI人工智能

2010-09-06 08:52:00

CSS選擇器

2023-03-14 13:57:22

狀態機聊天機器人

2021-03-25 09:25:55

機器人人工智能系統

2019-08-27 11:15:20

機器人人工智能編程

2025-08-15 12:50:19

2024-09-02 08:30:00

大模型AI

2024-09-29 06:55:37

2025-09-16 12:53:54

2023-06-29 15:04:21

微軟ChatGPT

2024-12-18 13:24:30

谷歌AI大語言模型

2025-10-13 15:52:11

AI論文模型

2019-08-02 09:25:57

機器人人工智能系統

2017-05-25 12:05:03

機器人軟體機器人大蜘蛛

2017-07-11 13:27:31

人工智能機器智能

2023-10-23 13:31:37

GPT-4語言模型
點贊
收藏

51CTO技術棧公眾號

最近2019中文免费高清视频观看www99| 国产在线精品一区在线观看麻豆| free亚洲| 国产 高清 精品 在线 a| 美女日批免费视频| 91美女精品| 国产综合久久| 欧美日韩国产页| 69久久夜色精品国产69乱青草| 国产尤物av一区二区三区| 在线播放蜜桃麻豆| 最新亚洲激情| 欧美性少妇18aaaa视频| 国产精品九九久久久久久久| av网站在线观看不卡| 免费视频观看成人| 免费久久精品视频| 精品国产91久久久久久久妲己| 久久久神马电影| 黄色免费在线播放| 日韩成人三级| 午夜视频一区在线观看| 国产精品日韩欧美大师| 黄页免费在线| 欧洲毛片在线视频免费观看| 1024国产精品| 国产成人综合久久| 亚洲一区二区三区成人| 国产精品久久天天影视| 亚洲最新视频在线播放| 国产免费一区二区三区在线能观看 | 国产欧美一级| 一本高清dvd不卡在线观看| 91免费在线视频网站| 国外av在线| 国产精品乱人伦一区二区| 欧美一级在线亚洲天堂| 免费网站永久免费观看| 激情欧美日韩| 成人一区二区三区视频| 国产精品毛片高清在线完整版| 亚洲v日韩v综合v精品v| 天堂va久久久噜噜噜久久va| 欧美高清中文字幕| 日韩一二三四区| 欧美高清视频免费观看| 欧美日韩一区二区三区69堂| 欧美在线导航| 久久日一线二线三线suv| 992tv在线成人免费观看| 精品久久在线| 国产亚洲a∨片在线观看| 精品少妇一区二区三区在线| 国产99久久久久久免费看农村| 欧美极品少妇xxxxⅹ裸体艺术| 中文字幕永久视频| 久久一区91| 亚洲国产成人精品女人久久久 | 午夜精品亚洲一区二区三区嫩草 | 日韩高清在线一区| 日本aⅴ中文| 免费大片在线观看| 97精品视频在线看| 国产精品欧美亚洲777777| 琪琪久久久久日韩精品| 久久精品午夜一区二区福利| 99久久精品一区| 精品国内产的精品视频在线观看| 成人有码视频在线播放| 黄色影院一级片| 激情成人综合网| 欧美巨大另类极品videosbest| 欧美视频观看一区| 日本一区二区三区视频免费看| 色8久久久久| 在线免费av一区| 800av在线免费观看| 91丨九色porny丨蝌蚪| 成人免费淫片aa视频免费| 亚洲视频福利| 日本三日本三级少妇三级66| 日韩一区二区在线| 91久色国产| 久久国际精品| 日韩午夜电影av| 小h片在线观看| 精品久久久一区二区| 成人综合视频在线| 亚洲激情一二三区| 国产人妻777人伦精品hd| 日韩天堂av| 成人激情在线观看| 日韩精品亚洲一区二区三区免费| 免费网站永久免费观看| 一区二区三区在线观看国产| 污污视频在线看| 午夜精品一区二区三区三上悠亚 | 日本特黄久久久高潮| 国产精品九九九| 久久一二三四| 92国产精品久久久久首页| 奇米在线7777在线精品 | 奇米影视首页 狠狠色丁香婷婷久久综合| 欧美丰满片xxx777| www.亚洲色图.com| 美女黄色免费看| 亚洲男帅同性gay1069| 日韩欧美一区二区三区四区五区| 成入视频在线观看| 99精品欧美一区二区蜜桃免费 | 亚洲一区在线日韩在线深爱| 欧美va亚洲va国产综合| 一区二区传媒有限公司| 亚洲成人久久影院| a视频免费看| 国产欧美日产一区| 精品一区二区三区视频在线观看| 国内成+人亚洲+欧美+综合在线 | 欧美一级二级三级| 国产精品久久久久久久浪潮网站 | melody高清在线观看| 亚洲国产三级在线| 精品裸体bbb| 色噜噜狠狠狠综合曰曰曰88av| 亚洲小说图片视频| 国产精品v片在线观看不卡| 精品一区二区三区影院在线午夜| 三区在线观看| 欧美性极品少妇精品网站| 国产另类xxxxhd高清| 北条麻妃在线一区二区| 日本黄色一区| 国产精品亚洲综合| 久久久久在线| 曰韩不卡视频| 国产专区欧美精品| 国产有码在线| 国产91露脸中文字幕在线| 欧美手机视频| 92国产精品视频| 国产精品美女一区二区| 97久久网站| 国内精品伊人久久| 丝袜久久网站| 成人国产精品色哟哟| 国产精品另类一区| 在线播放蜜桃麻豆| 久久精品日产第一区二区三区 | 小说区视频区图片区| 精品一区二区免费视频| 日本三级在线播放完整版| 欧美精品一二三区| 久久人体视频| 色播在线视频| 国产精品欧美久久久| 亚洲乱码国产乱码精品精可以看| 国产精品国产| 国产精品毛片va一区二区三区| 国产精品电影一区二区| 国产精一区二区| 亚洲看片一区| 欧美magnet| 亚洲精品一区中文| 国产精品一区在线| 欧美这里只有精品| 久久综合一区| 久久久久国产精品一区二区| 国内激情视频在线观看| 欧美韩国日本| 成人精品水蜜桃| 欧美日韩一区二区在线播放| 久久高清精品| 性xxxx丰满孕妇xxxx另类| 欧美综合在线视频| 你懂的国产精品| 黄色一级大片免费| 亚洲伦理在线精品| 加勒比久久综合| 日本成人黄色免费看| 91精品国产高清一区二区三区蜜臀| 免费看av不卡| 青青草精品视频在线| 欧美性猛交xxxx乱大交3| 91综合在线| 一广人看www在线观看免费视频| 乱一区二区三区在线播放| 欧美成人bangbros| 国产呦精品一区二区三区网站| 浪潮色综合久久天堂| 成人黄色片视频| 7777精品伊人久久久大香线蕉完整版 | 在线播放国产精品| 日韩伦理视频| 九色视频在线播放| 亚洲巨乳在线观看| 五月天一区二区三区| 亚洲一级网站| 韩国主播福利视频一区二区三区| 国产精品极品美女在线观看免费| 色婷婷综合久久久久|