国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

機器人學會轉筆、盤核桃了!GPT-4加持,任務越復雜,表現越優秀

人工智能
家人們,繼人工智能(AI)攻占象棋、圍棋、Dota之后,轉筆這一技能也被 AI 機器人學會了。

大數據文摘出品

家人們,繼人工智能(AI)攻占象棋、圍棋、Dota之后,轉筆這一技能也被 AI 機器人學會了。

上面這個筆轉的賊溜的機器人,得益于名叫Eureka的智能體(Agent),是來自英偉達、賓夕法尼亞大學、加州理工學院和得克薩斯大學奧斯汀分校的一項研究。

得Eureka“指點”后的機器人還可以打開抽屜和柜子、扔球和接球,或者使用剪刀。據英偉達介紹,Eureka有10種不同的類型,可執行29種不同的任務。

要知道在之前,單就轉筆這一功能,僅靠人類專家手工編程,是無法如此順滑的實現的。

機器人盤核桃

而Eureka 能夠自主編寫獎勵算法來訓練機器人,且碼力強勁:自編的獎勵程序在 83% 的任務中超越了人類專家,能使機器人的性能平均提升52%。

Eureka開創了一種從人類反饋中無梯度學習的新途徑,它能夠輕松吸收人類提供的獎勵和文字反饋,從而進一步完善自己的獎勵生成機制。

具體而言,Eureka 利用了 OpenAI 的 GPT-4 來編寫用于機器人的試錯學習的獎勵程序。這意味著該系統并不依賴于人類特定任務的提示或預設的獎勵模式。

Eureka 通過在 Isaac Gym 中使用 GPU 加速的仿真,能夠快速評估大量候選獎勵的優劣,從而實現更有效率的訓練。接著,Eureka 會生成訓練結果的關鍵統計信息摘要,并指導 LLM(Language Model,語言模型)改進獎勵函數的生成。通過這種方式,AI 智能體能夠獨立地改善對機器人的指令。

Eureka的框架

研究人員還發現,任務越復雜,GPT-4 的指令就越能優于所謂的"獎勵工程師"的人類指令。參與該研究的研究員甚至稱 Eureka 為“超人類獎勵工程師”。

Eureka 成功地彌補了高層推理(編碼)和低層運動控制之間的鴻溝。其采用了一種被稱為 "混合梯度架構":一個純推理的黑盒子 LLM(Language Model,語言模型)引導一個可學習的神經網絡。在這個架構中,外層循環運行 GPT-4 來優化獎勵函數(無梯度),而內層循環則運行強化學習以訓練機器人的控制器(基于梯度)。

——NVIDIA的高級研究科學家Linxi "Jim" Fan

Eureka 可以整合人類的反饋,以便更好地調整獎勵,使其更符合開發者的期望。Nvidia 把這個過程稱為"in-context RLHF"(從人類反饋中進行上下文學習)

值得注意的是,Nvidia 的研究團隊已經開源了 Eureka 的 AI 算法庫。這將使得個人和機構能夠通過 Nvidia Isaac Gym 來探索和實驗這些算法。Isaac Gym 是建立在 Nvidia Omniverse 平臺上的,這是一個基于 Open USD 框架用于創建 3D 工具和應用程序的開發框架。

  • 論文鏈接:https://arxiv.org/pdf/2310.12931.pdf
  • 項目鏈接:https://eureka-research.github.io/
  • 代碼鏈接:https://github.com/eureka-research/Eureka

如何評價?

在過去的十年中,強化學習取得了巨大的成功,但我們必須承認其中仍存在持續的挑戰。之前雖然有嘗試引入類似的技術,但與使用語言模型(LLM)來輔助獎勵設計的 L2R(Learning to Reward)相比,Eureka 更為突出,因為它消除了特定任務提示的需要。Eureka 之所以能比 L2R 更出色,是因為它能夠創建自由表達的獎勵算法,并利用環境源代碼作為背景信息。

英偉達的研究團隊進行了一項調查,以探索在使用人類獎勵函數啟動時,是否能提供一些優勢。實驗的目的是想看看是否你們能順利地用初始 Eureka 迭代的輸出替代原始的人類獎勵函數。

在測試中,英偉達的研究團隊在每個任務的情境下,使用相同的強化學習算法和相同的超參數對所有最終獎勵函數進行了優化。為了測試這些特定任務的超參數是否經過良好調整以確保人工設計的獎勵的有效性,他們采用了經過充分調整的近端策略優化(PPO)實現,這個實現基于之前的工作,沒有進行任何修改。對于每個獎勵,研究人員進行了五次獨立的 PPO 訓練運行,并報告了策略檢查點達到的最大任務指標值的平均值,作為獎勵性能的度量。

結果顯示:人類設計者通常對相關狀態變量有很好的理解,但在設計有效獎勵方面可能缺乏一定的熟練度。

Nvidia 的這項開創性研究在強化學習和獎勵設計領域開辟了新的疆界。他們的通用獎勵設計算法 Eureka 利用了大型語言模型和上下文進化搜索的力量,能夠在廣泛的機器人任務領域生成人類水平的獎勵,而無需特定任務提示或人工干預,這在很大程度上改變了我們對 AI 和機器學習的理解。

責任編輯:趙寧寧 來源: 大數據文摘
相關推薦

2023-10-21 21:14:00

AI模型

2019-12-24 09:31:55

機器人人工智能編程

2022-10-28 13:16:07

四足機器人機器人人工智能

2017-03-27 09:59:25

機器人自創語言交流

2023-10-29 18:14:08

GPT4機器人算法

2025-06-11 14:45:26

機器人訓練數據

2025-09-08 09:12:00

2025-09-15 14:50:03

AI機器人開發

2012-10-09 10:12:12

2021-01-04 09:18:36

機器人人工智能系統

2023-07-29 13:14:40

谷歌人工智能

2018-07-06 08:58:53

機器人人工智能系統

2020-04-28 10:20:23

5G窄帶物聯網運營商

2025-10-09 13:19:47

2025-12-11 08:45:00

2024-05-28 13:03:50

2023-03-16 19:17:57

2022-02-13 00:03:06

AndroidAndroid 13安卓

2022-06-07 14:35:53

機器人人工智能

2020-09-02 10:36:52

機器人人工智能系統
點贊
收藏

51CTO技術棧公眾號

欧美孕妇孕交黑巨大网站| 国产精品日韩一区二区| 男人的天堂在线| 首页欧美精品中文字幕| 久久亚洲影音av资源网| 国产丝袜在线| 中文字幕制服丝袜成人av| 一区二区视频在线观看| 欧美r级电影| 欧美大奶子在线| 日韩伦理在线一区| 在线观看免费视频综合| 国模大尺度私拍在线视频| 成人精品视频.| 日韩av一区二区三区在线| 99精品网站| 欧美在线视频导航| 秋霞一区二区| 一本一道久久a久久精品逆3p| 永久免费av在线| 黑丝美女久久久| 色偷偷免费视频| 国产精品美女视频| 久久艹国产精品| 蜜桃视频第一区免费观看| 韩国一区二区三区美女美女秀 | 亚洲人成网站在线| 国产午夜福利100集发布| 日韩成人av影视| 久久精品国产99精品国产亚洲性色| 亚洲国产最新| 69视频在线免费观看| 都市激情久久| 欧美激情一区二区三区高清视频| 成人一区视频| 亚洲美女福利视频网站| 中文在线免费视频| 亚洲天堂成人在线| 久久人体av| 免费av一区二区| 韩国一区二区三区视频| 久久久精品一区| av在线亚洲色图| 97**国产露脸精品国产| 北条麻妃国产九九九精品小说| 日本国产欧美一区二区三区| 日韩电影在线观看完整免费观看| 久久久亚洲成人| 香蕉久久精品日日躁夜夜躁| 国产精品久久久久久一区二区 | 经典一区二区三区| 国产精品av免费| 国产一区二区调教| 国产91xxx| 中文字幕一区二区三区不卡在线| 97在线免费| 欧美午夜精品伦理| 丝袜综合欧美| 最新日韩中文字幕| 涩爱av色老久久精品偷偷鲁 | 欧美亚洲禁片免费| 在线观看麻豆蜜桃| 欧美大片一区二区| 88xx成人网| 欧洲成人在线观看| 影音先锋久久久| 日本精品免费| 97精品国产97久久久久久久久久久久| 黄色手机在线视频| 欧美色另类天堂2015| 久久青青色综合| 另类视频在线观看| 清纯唯美亚洲综合一区| 日韩欧美第二区在线观看| 成人午夜碰碰视频| 少妇免费视频| 亚洲精品在线观看视频| 视频精品一区二区三区| 亚洲精品免费在线视频| 国产在线一区二区| 国产成+人+亚洲+欧美+综合| 欧美男人的天堂一二区| 国产精品久久久久久久久免费高清| 欧美性在线观看| 亚洲精品色图| 少妇无码av无码专区在线观看| 亚洲在线中文字幕| 国产乱码在线| 日韩av色综合| 美女脱光内衣内裤视频久久网站| 黄色片视频在线播放| 一本一道波多野结衣一区二区| 在线高清av| 亚洲一区二区三区久久| eeuss国产一区二区三区| 国产中文在线视频| 欧美精品一二区| 亚洲欧美日本国产专区一区| 亚洲成人福利在线| 亚洲精品成a人在线观看| 国产99久久| 免费看日本黄色| 一本大道综合伊人精品热热| 亚洲高清国产拍精品26u| 国产日韩欧美一区二区三区四区 | 麻豆传媒在线免费看| 九色精品美女在线| 噜噜爱69成人精品| free性亚洲| 亚洲欧美日韩一区二区三区在线| 成人3d精品动漫精品一二三| 亚洲 欧美 日韩 国产综合 在线| 欧美日韩中文字幕精品| 精品国产影院| 欧美日韩激情四射| 在线观看91av| 色天天综合网| 在线免费视频一区| 伊是香蕉大人久久| 日韩精品一级中文字幕精品视频免费观看 | 日本免费久久高清视频| 国产麻豆日韩欧美久久| 国产一级网站视频在线| 久久久久久国产三级电影| 久久精品999| 天堂а√在线官网| 国产中文字幕91| 成人欧美一区二区三区| 手机看片久久| 午夜精品一区二区三区在线观看 | 国产日韩欧美亚洲一区| 亚洲欧洲在线观看av| 日韩久久一区二区三区| 欧美成人第一区| 在线视频国内自拍亚洲视频| 亚洲免费成人av在线| av免费播放网址| 中文字幕精品www乱入免费视频| 西西裸体人体做爰大胆久久久| 亚洲一区二区三区精品中文字幕| 欧美巨乳在线观看| 99在线精品视频| 亚洲欧美se| 制服国产精品| 亚洲精品97久久| 美日韩精品视频| 免费日本一区二区三区视频| 亚洲综合最新在线| 色拍拍在线精品视频8848| 日本一区二区免费高清| 婷婷亚洲天堂| 欧美做受高潮1| 亚洲精品免费视频| 精品成人影院| 最新中文字幕在线视频| 国产欧美一区二区三区久久| 亚洲人123区| 高清精品xnxxcom| 天天综合网天天做天天受| 久久久女人电视剧免费播放下载| 久久久不卡网国产精品一区| 一区二区日韩| 国产黄色影视| 国产精品中文字幕久久久| 精品露脸国产偷人在视频| 午夜电影亚洲| 国产在线看片| 亚洲高清不卡一区| 亚洲女人天堂av| 久久色中文字幕| 天海翼亚洲一区二区三区| 亚洲最大黄色| 日本在线播放一区| 一本色道久久综合亚洲精品小说 | 一区二区国产精品| 性欧美18+| 91深夜福利视频| 在线亚洲人成电影网站色www| 在线不卡视频| 亚洲欧洲日本国产| 亚洲不卡1区| 欧美一级爽aaaaa大片| 国产成人91久久精品| 色老汉av一区二区三区| 91丝袜美腿高跟国产极品老师| 在线成人视屏 | 97国产精品人人爽人人做| 亚洲免费av高清| 国产精品久久观看| a视频在线免费看| 丁香六月激情婷婷| 琪琪第一精品导航| 欧美视频精品在线| 老司机精品视频一区二区三区| 国产精品第一| 开心丁香婷婷深爱五月 | 日本欧美视频在线观看| 国产日韩av网站| 波多野结衣天堂| 中出在线观看|