国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

斯坦福AI智能體爆火研究!「好奇回放」算法讓AI自我反思,主動探索新奇世界

人工智能
斯坦福為AI智能體設計了一種「好奇回放」算法,讓智能體在不斷變化環境中探索新奇世界。斯坦福研究人員Isaac Kauvar設計了一個簡單任務,「探索和適應周圍環境」。

一夜之間,AI智能體突然霸屏全網。

業界大佬紛紛將關注重點從LLM轉向了AI智能體,OpenAI的首席科學家Karpathy認為AI智能體是未來。

就連英偉達老黃表示,下一波人工智能浪潮是具身人工智能,簡之「AI智能體」。

這不,近來斯坦福的最新研究,直接讓AI智能體和一只小鼠來一場面對面的競爭,以確定誰能獲勝。

最新研究結果已發表在arXiv上,并被ICML 2023接收。

圖片

論文地址:https://arxiv.org/pdf/2306.15934.pdf

智能體大戰小鼠

斯坦福研究人員Isaac Kauvar設計了一個簡單任務,「探索和適應周圍環境」。

Kauvar將一只小鼠放在狹小的空盒子里,類似地,將AI智能體放在一個3D虛擬競技場中。

圖片圖片

然后,他在兩個環境中都放了一個紅色的球。接下來,測試誰會更快地探索這個新物體。

結果顯示,小鼠迅速靠近球,并在接下來的幾分鐘里不斷與之互動。但是AI智能體似乎沒有注意到它。

第一回合,小鼠勝,智能體失敗。

Kauvar表示,這完全出乎意料的,我們意識到,即使使用最先進的算法,性能仍然存在差距。

因此,學者們思考著:他們是否可以利用這些看似簡單的動物行為作為啟示,改進AI系統呢?

沿著這個思路的啟發,研究人員設計一種名為「好奇回放」(curious replay)的全新訓練方法。

該方法使AI智能體能夠「自我反思」最近遇到的最新奇,以及最有趣的事物。

添加了「好奇回放」之后,AI智能體就能夠更快地接近,并與紅球進行互動。此外,它還極大地改善了基于Minecraft的游戲「Crafter」的性能。

圖片圖片

通過好奇心學習

要知道,真正的超級AI智能體,是能夠像人類一樣進行感知、交互、理解的AI。

而好奇心,對于人類認知世界,探索周遭環境至關重要,不論是避免危險情況,還是尋找生存必需品都必不可少。

在實驗中,紅球可能是致命的毒藥,亦或是一頓滋養的餐食,如果我們忽視它,將很難找出真相。

這就是為什么斯坦福研究人員,在驅動AI智能體的行為中增加了「好奇信號」,特別是基于模型的深度強化學習智能體。

這個信號告訴它們,去選擇能夠導致更有趣結果的行動,比如,看到門要打開門,而不是忽略它。

好奇回放通過使用好奇心引導的優先級來促進模型在最不熟悉的經驗圖片

好奇回放通過使用好奇心引導的優先級來促進模型在最不熟悉的經驗的訓練,從而關閉了經驗回放和世界模型性能之間的循環

這一次,團隊以一種全新方式,利用好奇心來幫助AI智能體了解其世界,而不僅僅是做出決策。

Kauvar說:「我們不是選擇要做什么,而是選擇要思考什么,或多或少地選擇我們想要從過去的經歷中學到什么」。

換句話說,他們希望鼓勵AI智能體進行「自我反思」。從某種意義上說,關于它最有趣或最奇特的(與好奇心相關的)經歷。

這樣,智能體就可以被促使以不同的方式與物體互動以獲得更多的學習,這將指導它對環境的理解,并可能激發對其他物品的好奇心。

為了以這種方式實現自我反思,研究人員修改了一種常用的用于訓練AI智能體的方法,稱為「經驗回放」。

在這種方法中,智能體存儲其所有互動的記憶,然后隨機重放其中的一些以再次學習。

「經驗回放」受到了有關睡眠的研究的啟發:神經科學家發現,一個被稱為海馬體的大腦區域會「重播」一天的事件(通過重新激活特定的神經元)以加強記憶。

在AI智能體中,「經驗回放」在環境變化不大,且正確行為獲得明確獎勵的場景中,能夠取得高性能。

但是,研究人員推斷,在一個不斷變化的環境中,AI智能體更有意義的是優先回放那些最有趣的經歷,比如紅球的出現,而不是一遍又一遍地回放空蕩的虛擬房間。

他們將這種新方法稱為好奇回放,并發現它立即生效。Kauvar說:「突然之間,智能體與球的互動速度明顯增加。」

圖片圖片

對于算法的設計,優先級信號是新奇和驚喜的疊加組合:

圖片圖片

好奇回放是對現有智能體的簡單修改。這些智能體使用經驗重播,計算開銷最小,利用了經驗采樣次數的計數,以及為每個訓練批次計算的模型損失。

這種優先級在需要適應的不斷變化的環境中特別有用。好奇回放有助于隨著環境的變化,保持世界模型的最新狀態,這是有效行動選擇的先決條件。

另外,研究人員發現,一個領先的好奇心強的人工智能智能體Plan2Explore,在需要適應的情況下,行為明顯變差(例如與對象互動的時間變慢)。

圖片圖片

究其原因,部分是世界模型的訓練,使用「經驗回放」緩沖區的統一抽樣:因此舊的、無聊的經驗和較罕見的新的、有趣的經驗一樣有可能被訓練到。

圖片圖片

如果轉而優先考慮對「有趣的經歷」進行抽樣調查結果如何?AI智能體使用好奇心信號(如新奇感和驚喜)來衡量過去經歷的趣味性。

圖片圖片

結果發現,這個簡單的變化極大地改善了適應性,世界模型的性能得到了改善,與物體的互動也大大增加。

它也比現有的優先考慮「經驗回放」的方法(如使用獎勵相關的信號,如TD錯誤)表現得更好。

圖片圖片

但他們并未止步于此。

研究人員還將好奇回放添加到了玩一個名為Crafter的游戲的AI智能體中,這是一種用于測試AI智能體創造性問題解決能力的標準測試,類似于Minecraft。

智能體需要通過學習如何收集木材和石頭、制作鎬子以及收集鐵礦石來求生和適應。

好奇回放方法將當前的最先進得分從大約14提高到19(人類通常得分約為50)——僅僅通過「這一個改變」,Kauvar說道。

好奇回放在Crafter基準上取得SOTA,超過了DreamerV3,足見其在挑戰技能方面能力的大幅提升。

圖片圖片

一個好奇的未來

好奇回放方法在簡單和復雜任務中的成功表明,它對于未來廣泛的人工智能研究將非常重要。

論文作者Haber說道,「這項工作的總體目標是使智能體能夠利用先前的經驗,在探索新的或變化的環境中高效適應,這將導致更加適應性強、靈活性更高的技術,從家庭機器人到個性化學習工具」。

Kauvar的博士后工作由Haber和神經科學家Karl Deisseroth(生物工程和精神病學系D.H. Chen教授)共同指導,他對從動物行為中汲取靈感以改進人工智能系統的主題感到興奮——他計劃繼續在更復雜的任務上測試小鼠和AI智能體,以比較它們的行為和能力。

「很多人只是嘴上說說受到動物的啟發,但我們正在建立一個直接的橋梁——而不是模糊的橋梁。我們試圖做完全相同的事情」。

Kauvar希望這樣的工作能夠幫助「閉環」AI研究和神經科學之間的聯系,并有助于我們對動物行為和底層神經過程的理解。

他表示,「你可以想象,這整個方法可能會產生以前從未想到的假設和新實驗」。

作者介紹

Isaac Kauvar

圖片

Isaac Kauvar是斯坦福大學的LSRF博士后研究員,與Nick Haber一起在斯坦福自主智能體實驗室工作,研究人工智能、神經科學和心理學的交叉領域。

他對大腦多個區域的細胞網絡如何協同工作來模擬世界感興趣。

Kauvar曾在斯坦福獲得了電氣工程博士學位。在那里,我開發了記錄整個皮層神經活動的光學工具,并發現了一種神經振蕩——奇怪地局限于一個皮層區域——這似乎是氯胺酮等藥物解離作用的基礎。

參考資料:

https://hai.stanford.edu/news/ai-agents-self-reflect-perform-better-changing-environments

https://arxiv.org/abs/2306.15934

責任編輯:武曉燕 來源: 新智元
相關推薦

2025-10-28 15:46:19

AIChatGPT算法

2023-08-10 14:01:08

開源虛擬

2017-11-28 14:18:29

2019-12-16 14:33:01

AI人工智能斯坦福

2023-11-29 14:53:00

AI數據

2024-10-28 10:30:00

AI開源模型

2023-10-17 13:33:00

AI數據

2019-03-27 10:47:05

人工智能法律AI

2024-10-21 12:40:00

視頻生成模型

2022-07-20 16:39:37

AI數據

2024-09-11 15:00:00

2018-01-23 16:48:47

AI

2024-11-26 08:42:14

2023-04-11 13:55:20

AI游戲

2025-12-03 08:47:00

AI智能體框架

2023-07-21 14:28:54

2025-04-09 04:22:00

2025-11-03 17:33:10

AI模型數據

2023-07-21 14:47:24

AI訓練

2024-05-13 12:58:30

點贊
收藏

51CTO技術棧公眾號

日韩精品在线一区| 亚洲精品视频久久| 欧美日韩三区四区| 中文成人在线| 欧美日韩免费在线| 韩日视频在线观看| 欧美日韩hd| 欧美另类高清videos| 成人性生交大片免费看午夜| 91免费国产在线| 少妇特黄a一区二区三区| 精品国产一区二区三区久久久樱花| 亚洲人线精品午夜| 国产鲁鲁视频在线观看免费| 2017欧美狠狠色| 在线视频不卡一区二区三区| 一本一本久久a久久综合精品| 欧美另类极品videosbestfree| 污片视频在线免费观看| 亚洲午夜电影网| 手机在线看福利| 国产精品白丝av| 欧美日韩亚洲综合一区二区三区激情在线| 精品久久国产| 免费yellow网站| 高清久久久久久| 美女网站在线看| 日韩欧美国产中文字幕| 精品999在线| 成人免费三级在线| 亚洲精品日韩在线观看| 欧美视频官网| 国产欧美日韩免费看aⅴ视频| 亚洲人成网站在线在线观看| 亚洲天堂成人在线| 日韩在线视频国产| 青青草综合视频| 美女性感视频久久| 免费av一区二区三区| 亚洲黄色av| 99c视频在线| 欧美日韩1080p| 国产精品福利视频| 一区久久精品| 精品欧美一区二区在线观看视频 | 国内精品伊人久久久久av影院| 国产色综合一区二区三区| 牛夜精品久久久久久久99黑人| 国产精品无码专区在线观看 | 亚洲精品国产精品久久清纯直播| 二区三区四区高清视频在线观看| 欧美三级视频在线| 九七久久人人| 亚洲国产成人久久| 欧美三级精品| 欧美成人精品在线播放| 米奇精品关键词| 国产日韩av在线| 亚洲私拍自拍| 五月婷婷一区| 成人一区在线观看| 天天综合网天天做天天受| 亚洲图片欧美一区| 嫩草香蕉在线91一二三区| 日韩亚洲欧美成人一区| 亚洲国产福利| 欧美激情欧美狂野欧美精品| 欧美日韩中字| 免费在线一区二区| 国产高清视频一区| 中文字幕桃花岛| 欧美艳星brazzers| 高潮一区二区| 日本中文字幕久久看| 亚洲国产婷婷| 3d动漫一区二区三区| 一区二区三区高清在线| 欧美被日视频| 另类图片亚洲另类| 日韩中文在线电影| 影音先锋欧美资源| 中文字幕五月欧美| 成人日韩欧美| 欧美第一黄色网| 亚洲第一区色| 成年网站在线免费观看| 欧美性xxxx极品hd欧美风情| 美女视频在线免费| 国产精品av免费在线观看| 日日夜夜精品视频免费| 男女无套免费视频网站动漫| 日本韩国一区二区三区视频| 日本美女一区| 成人福利在线视频| 成人精品国产福利| 午夜在线观看91| 中文字幕在线日韩| 欧美日韩亚洲三区| 日本中文字幕网址| 欧美三级视频在线观看| 1204国产成人精品视频| 久久精品国产一区二区三区日韩| 久久夜色精品国产欧美乱极品| 欧美男男同志| 久久精品国产亚洲7777| 红桃视频亚洲| 日韩毛片在线免费看| 欧美日韩精品福利| 91精品入口| 亚洲不卡一卡2卡三卡4卡5卡精品| 亚洲人吸女人奶水| 三级成人在线| 国产成人精品一区二区三区福利 | 国产精品成人av在线| 免费成人在线网站| 亚洲男人资源| 久热精品在线视频| 丝袜亚洲另类欧美综合| 黄色污网站在线免费观看| 久久精品成人欧美大片| av成人激情| 中文字幕毛片| 美女av一区二区三区| 蜜桃精品视频在线| 精品久久久久一区二区三区 | 伊人激情综合| jizzjizzjizz亚洲日本| 日韩av影视在线| 妖精视频成人观看www| 性色av一区二区| 久久久久久成人精品| 国产成人8x视频一区二区| 黄色在线播放网站| 成人黄色影片在线| 一区二区三区av电影| 欧亚精品一区| av免费中文字幕| 精品亚洲va在线va天堂资源站| 亚洲一区二区三区免费在线观看| 最新天堂资源在线资源| 97免费视频在线| 中文字幕高清不卡| 在线播放一区二区精品视频| av免费观看网| 久久91亚洲精品中文字幕| 暴力调教一区二区三区| 国产精品美女午夜爽爽| www精品久久| 日韩专区在线播放| 99精品欧美一区二区三区小说| 手机看片久久| 欧美久久在线观看| 在线精品视频视频中文字幕| 东方aⅴ免费观看久久av| 新片速递亚洲合集欧美合集| 国产免费xxx| 中文字幕欧美日韩va免费视频| 国产成人一区在线| 日韩大陆av| 亚洲综合色在线观看| 欧美综合激情网| 亚洲高清中文字幕| 午夜国产欧美理论在线播放| 在线看黄色av| 免费亚洲一区二区| 亚洲成人中文字幕| 不卡的av电影| 亚洲欧洲av| 男同在线观看| 日本不卡一区| 精品福利视频一区二区三区| 国产精品一级片在线观看| 亚洲日日夜夜| 久久99爱视频| 亚洲综合中文字幕68页| 欧美一区二区精品| 精品系列免费在线观看| 自拍偷拍欧美日韩| 国产女主播在线| 国产精品久久一区二区三区| 91精品国产丝袜白色高跟鞋| 国产在线一区二区| 久久99国产精品久久99大师 | 99视频热这里只有精品免费| 国产麻豆精品| 骚视频在线观看| 久久99精品久久久久久水蜜桃 | 日韩精品视频观看| 成人白浆超碰人人人人| 免费观看成人www动漫视频| 头脑特工队2在线播放| 欧美一二三区| 精品国产一区av| 婷婷成人激情在线网| 日本91福利区| 日韩欧美国产大片| 久久bbxx| 99精品视频播放| 5g国产欧美日韩视频| 亚洲精品v欧美精品v日韩精品|