国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

人工智能 新聞
這是UC伯克利大學帶來的最新成果,讓機器人直接在實際環境中訓練學習,不再依賴于模擬器。

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

現在,讓機械狗自己打滾一個小時,它就能學會走路了!

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

步態看著相當有模有樣:

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

還能扛住大棍子的一通狂懟:

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

就算是摔了個四仰八叉,翻個身自己又站起來了:

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

如此看來,訓機械狗和普通訓狗真是要沒什么兩樣了啊。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

這就是UC伯克利大學帶來的最新成果,讓機器人直接在實際環境中訓練學習,不再依賴于模擬器

應用這一方法,研究人員在短時間內訓練出了4個機器人。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

比如開頭看到的1小時學會走路的機械狗;

還有2個機械臂,在8-10小時實戰抓取后,表現接近于人類水平;

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

以及一個擁有計算機視覺的小機器人,在自己摸索2小時后,能絲滑地滾動到指定位置。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

該研究由Pieter Abbeel等人提出,Pieter Abbeel是吳恩達的第一位博士生,前不久他剛剛獲得2021 ACM 計算獎(ACM Prize in Computing)。

目前,該方法的所有軟件基礎架構已經開源。

一個叫做“空想家”的算法

本文方法的pipeline大致可分為4步:

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

第一步,是先把機器人放在真實環境里,收集數據

第二步,把這些數據傳輸到Replay Buffer。這一步驟就是利用歷史數據進行訓練、“總結經驗”,高效利用收集到的樣本。

第三步,World Model會對已有經驗進行學習,然后“腦補”出策略。

第四步,再用演員評論家(Actor Critic)算法來提升策略梯度法的性能。

然后循環往復,將已經提煉出的辦法再使用到機器人身上,最后達到一種“自己摸索學習”的感覺。

具體來看,這里的核心環節是World Model。

World Models是2018年由DAVID HA等人提出的一種快速無監督學習方式,獲得了NIPS 2018的Oral Presentation。

它的核心理念是認為人類是基于已有經驗,形成了一個心理世界模型,我們所做的決定和行動都是基于這個內部模型。

比如人類在打棒球時,做出反應的速度遠比視覺信息傳達到大腦中的快,那么在這種情況下還能正確回球的原因,就是因為大腦已經做出了本能的預測。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

此前,基于World Model這種“腦補”的學習方法,谷歌提出了Dreamer這種可擴展的強化學習方法。

這一次提出的方法是在此基礎上,叫做DayDreamer。

(貌似可以叫做空想家?)

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

具體來看,World Model就是一個智能體模型。

它包括一個視覺感知組件,能將看到的圖像壓縮成一個低維的表征向量作為模型輸入。

同時還有一個記憶組件,可以基于歷史信息,對未來的表征向量做出預測。

最后,還包括一個決策組件,它能基于視覺感知組件、決策組件的表征向量,決定采取怎樣的動作。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

現在,我們回到本次UC伯克利學者提出的方法。

不難發現,其中World Model Learning部分的邏輯就是一個經驗積累的過程,Behavior Learning部分則是一個動作輸出的過程。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

本篇論文方法的提出,主要解決了機器人訓練中兩方面的問題:

效率和準確率。

一般來說,訓練機器人的常規方法是強化學習,通過反復實驗來調整機器人的運作。

不過這種方法往往需要非常大量的測試,才能達到很好的效果。

不僅效率低下,而且訓練需要付出的成本也不低。

后來,不少人提出在模擬器中對機器人進行訓練,可以很好增效降本。

但是本文作者認為,模擬器訓練方法在準確性方面的表現還是不夠好,只有真實的環境才能讓機器人達到最好的效果。

從結果來看,在訓練機器狗的過程中,只花10分鐘時間,機器狗就能適應自己的行為了。

和SAC方法對比來看,效果有明顯提升。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

在機械臂訓練過程中,這一新方法還克服了視覺定位和稀疏獎勵的挑戰,幾小時內的訓練成果明顯優于其他方法。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

研究團隊

值得一提的是,本次帶來新成果的研究團隊成員,也非常令人矚目。

其中,Pieter Abbeel是吳恩達的開山大弟子。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

他現在是UC伯克利電氣工程和計算機科學教授,伯克利機器人學習實驗室主任,伯克利AI研究院共同主任,曾加入過OpenAI。

前不久,他還獲得了2021 ACM 計算獎(ACM Prize in Computing),以表彰其在機器人學習方面的貢獻。

與此同時,他還是AI機器人公司Covariant的聯合創始人。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

另一位Ken Goldberg,也是AI領域的頂級專家。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

他現在是UC伯克利工程教授,研究方向為強化學習、人機交互等。

2005年,他被評選為IEEE院士。

與此同時,Goldberg還是一位藝術家,是UC伯克利藝術、科技文化研討會的奠基人。

此外,Philipp Wu、Alejandro Escontrela、Danijar Hafner三人為共同一作。

其中Philipp Wu還只是UC伯克利一位大四的學生。

One More Thing

在觀看機械狗訓練的視頻時,我們發現研究人員使用的是Unitree機械狗。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

這個品牌來自中國企業宇樹科技,之前登上過春晚的機器小牛,也來自它家。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

而且,最近宇樹機器狗集體進行Go1測試的視頻曝光,還在國外火了一波。

新出生的機器狗,打滾1小時后自己掌握走路,吳恩達大弟子成果

論文地址:

https://danijar.com/project/daydreamer/

責任編輯:張燕妮 來源: 量子位
相關推薦

2022-06-06 12:53:17

吳恩達AI機器學習

2022-07-20 14:59:51

機器狗算法

2021-04-13 09:25:21

機器學習人工智能計算機

2025-08-08 14:27:22

AI大模型開發

2024-06-13 09:05:36

2021-04-23 10:55:52

人工智能深度學習

2017-12-15 12:44:02

2025-02-07 15:20:00

AI數據訓練

2019-09-24 08:16:14

Reactor響應式編程

2024-09-23 09:00:00

模型訓練

2020-11-09 08:55:10

Python 開發AI

2017-03-22 20:18:04

百度人工智能吳恩達

2019-10-21 09:51:20

AI 數據人工智能

2022-02-13 17:27:59

吳恩達AI小數據

2020-12-25 15:34:35

AI 數據人工智能

2025-10-30 09:48:05

2022-02-21 13:57:47

人工智能小數據機器學習

2024-08-20 14:28:15

2025-09-01 17:22:06

模型LLMAnthropic

2017-01-12 15:35:07

人工智能學習機器
點贊
收藏

51CTO技術棧公眾號

一二三四社区欧美黄| 57pao成人国产永久免费| 每日在线更新av| 99久久九九| 亚洲三级免费看| 中出在线观看| 国产高清在线精品| 成人免费自拍视频| 精品一区91| 日韩免费看网站| 中出福利视频| 97se亚洲国产综合在线| 久久国产一区| 久久美女精品| 久久久久久久久久国产精品| 成人毛片老司机大片| 亚洲一卡二卡三卡| 国产日韩欧美激情| 成人黄色片视频| 91啪亚洲精品| 日韩精品在线视频观看| 国产一区一区三区| 色综合久久中文字幕综合网小说| 亚洲国产精品综合| www.在线视频.com| 伊人久久大香线蕉综合热线 | 亚洲专区一二三| 青青草免费在线视频观看| av不卡一区二区三区| 国产成人av在线| 青青青免费视频在线2| 欧美午夜精品电影| 超碰高清在线| 亚洲一区二区在线观看视频| 日韩和欧美的一区二区| 美美哒免费高清在线观看视频一区二区 | 精品成人佐山爱一区二区| 欧美黑人经典片免费观看| 久久av最新网址| 中文字幕一区二区三区有限公司| 免费成人小视频| 日韩欧美一区二区三区四区五区| 精品av久久707| 婷婷成人基地| 日本在线一区| 国产精品99免费看| 好色先生视频污| 亚洲免费在线视频| 先锋影音成人资源| 亚洲综合另类小说| 中文字幕免费高清电视剧网站在线观看| 久久成人麻豆午夜电影| 奇米影音第四色| 亚洲欧美自拍偷拍色图| 北条麻妃高清一区| 99综合精品| 日韩欧美在线播放视频| 国产精品久久看| av在线电影网| 亚洲成人精品久久| 国产在线播放一区三区四| 欧美78videosex性欧美| 亚洲曰本av电影| 久久国产精品99精品国产| 国产精品三级一区二区| 理论片日本一区| 欧美日韩999| 欧美午夜寂寞| 91夜夜未满十八勿入爽爽影院 | 久久只精品国产| 一本久道综合色婷婷五月| 中文字幕在线免费不卡| 在线观看av片| 5566中文字幕一区二区电影| 狼人综合视频| 欧美激情国产精品| 久久精品高清| 天堂精品一区二区三区| 久久影院午夜论| 最新国产在线视频| 欧美一级午夜免费电影| 日韩毛片在线| 国产999精品| 日韩国产在线一| 日本999视频| 欧美日韩综合视频网址| 精灵使的剑舞无删减版在线观看| 中文字幕精品在线| 欧洲杯什么时候开赛| 欧美日韩一区在线视频| 久久婷婷成人综合色| 国产人成在线视频| 日韩中文字幕网址| 天天射成人网| 日韩在线观看a| 亚欧色一区w666天堂| 97人人爽人人澡人人精品| 18性欧美xxxⅹ性满足| 久久久亚洲人| 成人免费乱码大片a毛片软件| 欧美一区二区精品| 精品网站aaa| 中文精品视频一区二区在线观看| 亚洲视频一区在线观看| 高清毛片在线观看| 国产欧美日韩综合精品| 成人三级在线视频| av资源在线观看免费高清| 欧美日本黄视频| 日韩成人午夜精品| 米奇在线777| 中文字幕欧美精品在线| 精品999成人| baoyu777.永久免费视频| 亚洲男人av在线| 午夜精品亚洲| 成人蜜桃视频网站网址| 亚洲色图美腿丝袜| 亚洲久久一区| gogogo影视剧免费观看在线观看| 日韩亚洲在线观看| 另类国产ts人妖高潮视频| 羞羞的视频免费| 中文字幕亚洲一区| 久久精品二区三区| 九色在线视频| 国产精品情侣自拍| 国产日韩欧美不卡在线| 亚洲欧洲美洲av| 国产精品亚洲综合| 亚洲国产精品久久久久秋霞影院| 99er精品视频| 一级性生活视频| 日韩欧美在线网站| 欧美精品入口| 中文有码在线观看| 日本午夜在线亚洲.国产| 久久亚洲捆绑美女| 国产成人毛片| 欧美极品少妇无套实战| 亚洲第一区在线| 老妇喷水一区二区三区| av资源种子在线观看| 亚洲综合大片69999| 午夜电影一区二区三区| 羞羞色国产精品网站| 国产一级不卡视频| 日韩精品高清视频| 九色|91porny| 手机av在线| 蜜臀av.com| 亚洲女人被黑人巨大进入al| 日韩精品一二三| 里番在线播放| 影音先锋欧美在线| 精品亚洲男同gayvideo网站| 日本欧美加勒比视频| 影音先锋中文在线视频| 日本精品一区二区三区高清 久久| 欧美日韩一卡二卡三卡 | 好吊妞国产欧美日韩免费观看网站 | 天美av一区二区三区久久| 亚洲精品乱码久久久久久自慰| xxx欧美精品| 久久久www免费人成精品| 国产精品欧美一区二区三区不卡 | 日韩美女av在线免费观看| 国产精品欧美极品| 日韩a级大片| 免费看成一片| 国产这里只有精品| 一本到一区二区三区| 一区二区三区四区五区精品视频 | 久久精品免费在线观看| 精品国产三区在线| 91午夜国产| 91一区二区三区| 日韩精品一区二区三区三区免费 | 成人免费看片39| 久草在线青青草| 色就是色欧美| 中文字幕成人精品久久不卡| 97精品久久久午夜一区二区三区| 国产成人一二片| 在线观看黄色| 日韩中文字幕一区二区| 色爱av美腿丝袜综合粉嫩av| 中文字幕日本乱码精品影院| 伊人情人综合网| av剧情在线观看| 国产v亚洲v天堂无码久久久| 国产欧美精品va在线观看| 欧美日本在线看| 成人av在线播放网站| 欧美亚洲国产一区| 黄色成人在线观看| 免费不卡av在线| 成人做爽爽免费视频| 日韩av中文字幕在线免费观看 | gogo大胆日本视频一区|