国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

用GPT-2監督GPT-4,防止AI毀滅人類? OpenAI Ilya超級對齊團隊首篇論文出爐

人工智能 新聞
Ilya領銜的OpenAI對齊團隊,剛剛發表了首篇論文——用類似GPT-2監督GPT-4的方法,或可幫人類搞定自己更聰明的超級AI!

就在剛剛,OpenAI首席科學家Ilya領銜的超級對齊團隊,發布了成立以來的首篇論文!

圖片

團隊聲稱,已經發現了對超人類模型進行實證對齊的新研究方向。

未來超級AI系統對齊的一個核心挑戰——人類需要監督比自己更聰明人工智能系統。

OpenAI的最新研究做了一個簡單的類比:小模型可以監督大模型嗎?

論文地址:https://cdn.openai.com/papers/weak-to-strong-generalization.pdf

經驗證,通過GPT-2可以激發出GPT-4的大部分能力(接近GPT-3.5的性能),甚至可以正確地泛化到小模型失敗的難題上。

OpenAI此舉開辟了一個新的研究方向,讓我們能夠直接解決一個核心挑戰,即調整未來的超級AI模型,同時在迭代的實證中取得進展。

為了便于大家理解,超級對齊共同負責人Jan Leike,也發表了對這項研究的簡要概括:

人類如何控制比自己更智能的AI?

OpenAI認為,超級智能(比人類聰明得多的人工智能),很可能在未來十年內出現。

然而,人類卻仍然不知道,該如何可靠地引導和控制超人AI系統。

這個問題,對于確保未來最先進的AI系統安全且造福人類,是至關重要的。

解決這個問題對于確保未來最先進的人工智能系統仍然安全并造福人類至關重要。

為此,今年7月OpenAI成立了「超級對齊團隊」,來解決這類超級智能的對齊難題。

5個月后,團隊發表第一篇論文,介紹了實證對齊超人模型的新研究方向。

當前的對齊方法,例如基于人類反饋的強化學習 (RLHF),非常依賴于人類的監督。

但未來的人工智能系統,顯然能夠做出極其復雜且極具創造性的行為,而這將使人類很難對其進行可靠的監督。

比如,超人模型寫出了數百萬行新穎的且具有潛在危險的計算機代碼,即便是專業人士也難以完全理解,這時人類該怎么辦呢?

可見,相比于超人的AI模型,人類將成為一個「弱監督者」。

而這正是AGI對齊的核心挑戰——「弱小」的人類,如何信任并控制比他們更智能的AI系統?

超級對齊:用小模型監督大模型?

為了在這個核心挑戰上取得進展,OpenAI提出了一可以實證研究的類比:能否用一個更小(能力較弱)的模型來監督一個更大(能力更強)的模型?

超級對齊的簡單類比:在傳統的ML中,人類監督的人工智能系統比自己弱(左)。為了對齊超級智能,人類將需要監督比他們更聰明的人工智能系統(中)。我們今天無法直接研究這個問題,但我們可以研究一個簡單的類比:小模型能否監督大模型(右圖)?

我們可能會天真的認為,一個強大的模型不會比提供訓練信號的弱監督表現得更好。它可能只是學會模仿弱監督所犯的所有錯誤。

另一方面,強大的預訓練模型具有出色的原始能力——不需要從頭開始教它們新任務,只需要引出其潛在知識。

那么關鍵的問題是:強模型是否會根據弱監督的潛在意圖進行泛化,利用其全部能力來解決任務,即使是在弱監督只能提供不完整或有缺陷的訓練標簽的難題上?

團隊放出首個成果:用GPT-2監督GPT-4

對此,團隊使用了NLP基準測試的典型弱到強泛化——用GPT-2級別的模型作為弱監督,來微調GPT-4。

在很多情況下,這種方法都能顯著提高泛化能力。

使用一種簡單的方法,就鼓勵性能更強的模型更加自信,包括在必要時自信地說出與弱監督意見不同的意見。

在NLP任務上使用這種方法用GPT-2級模型監督GPT-4時,生成的模型通常在GPT-3和GPT-3.5之間。

而在更弱的監督下,就可以恢復GPT-4的大部分功能。

當然,這種方法更像是概念證明,具有很多局限性,比如,它并不適用于ChatGPT偏好數據。

不過,團隊也發現了其他方法,比如最佳的早期停止和從小型到中型再到大型模型的引導。

總的來說,結果表明,(1)幼稚的人類監督(比如RLHF)可以在沒有進一步工作的情況下。很好地擴展到超人模型,但(2)大幅改善弱到強的泛化是可行的。

代碼開源,社區共創

OpenAI目前的經驗設置與對齊超級模型的終極問題之間,仍然存在重要的差異。

比如,未來的模型可能比當前強模型,模仿當前的弱模型錯誤更容易,這可能會使未來的泛化更加困難。

盡管如此,OpenAI團隊相信實驗設置,抓住了對齊未來超級模型的一些關鍵難點,使OpenAI能夠在這個問題上取得可以驗證的進展。

同時,他們還透露了未來工作方向,包括修正設置,開發更好的可擴展方法,以及推進對何時以及如何獲得良好的「弱到強」泛化的科學理解。

OpenAI表示,他們正在開源代碼,讓機器學習社區研究人員立即輕松開始從弱到強的泛化實驗。

1千萬美元資助,解決超級對齊難題

這次,OpenAI還與Eric Schmidt合作,啟動了一個價值1000萬美元的資助計劃,支持確保超人類AI系統對齊并安全的技術研究:

- OpenAI為學術實驗室、非營利組織和個人研究人員提供10萬至200萬美元的資助。

- 對于研究生,OpenAI設立了為期一年、總額為15萬美元的OpenAI Superalignment獎學金,包括7.5萬美元的津貼和7.5萬美元的計算及研究資金。

- 申請者無需有對齊工作經驗;OpenAI會特別支持首次從事對齊研究的研究人員。

- 申請過程簡潔高效,具體回復將會在申請截止后的四周內給出。

OpenAI尤其關注以下幾個研究方向:

- 弱到強的泛化:面對超人類模型,人類將是相對弱勢的監督者。人類能否理解并控制強大模型是如何從弱監督中學習和泛化的?

- 可解釋性:人類如何理解模型的內部工作原理?人類能否利用這種理解來開發像AI謊言檢測器這類的工具來幫助人類?

- 可擴展的監督:人類如何利用AI系統幫助人類評估其他AI系統在復雜任務上的表現?

- 還有包括但不限于以下方向的多個研究領域:誠實度、思維鏈的誠實度、對抗魯棒性(adversarial robustness)、評估和測試平臺等等方向。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-12-15 12:52:17

AI模型

2024-06-28 13:40:03

2023-06-19 08:19:50

2023-08-17 08:00:00

2023-05-10 14:54:23

AI

2023-11-02 12:10:00

AI訓練

2023-05-10 17:33:56

2024-07-18 14:11:36

2025-08-04 14:22:33

GPT-5Claude編碼

2024-06-07 16:40:53

2023-08-11 13:41:42

2024-06-07 18:14:53

2023-08-06 08:06:30

OpenAIChatGPTGPT-4

2025-04-16 09:35:03

2023-03-17 07:33:24

GPT-5GPT-4OpenAI

2023-04-09 16:17:05

ChatGPT人工智能

2023-12-09 13:24:40

OpenAIChatGPT人工智能

2024-05-20 08:40:00

2023-07-07 09:32:57

GPT-4OpenAI

2025-08-19 08:40:00

AI技術模型
點贊
收藏

51CTO技術棧公眾號

久久爱www.| 午夜精品影院| 午夜精品一区二区三区免费视频| 久久99久久精品国产| av亚洲一区| 欧美日韩精品欧美日韩精品一| 日产精品久久久久久久蜜臀| 欧美高清日韩| 欧美激情按摩在线| 超碰99在线| 日本韩国一区二区三区| 999精彩视频| 国产电影一区二区三区| 国产精品伊人日日| 妖精视频一区二区三区| 在线播放国产精品| 久草在线视频福利| 色噜噜夜夜夜综合网| 加勒比日本影视| 91亚洲午夜精品久久久久久| 水蜜桃亚洲精品| 欧美国产三级| 国产精品视频大全| 欧美亚视频在线中文字幕免费| 最近中文字幕日韩精品| 牛牛在线精品视频| 777奇米四色成人影色区| 在线观看麻豆视频| 一区二区三区 在线观看视频| 成年人视频在线免费| 不卡av在线免费观看| 男女裸体影院高潮| 久久精品国产网站| 亚洲欧洲精品在线| 久久中文欧美| 欧美一级二级三级九九九| 欧美三区视频| 亚洲一区二区三区在线视频| 日韩精品免费| 成人免费网站在线观看| 国产一区二区欧美| 国产精品网站视频| 97精品视频| av日韩免费电影| 亚洲一级高清| 国产综合色一区二区三区| 国产一区亚洲| 精品一区二区三区日本| 一区二区三区四区五区精品视频 | 激情综合亚洲精品| 亚洲精品欧美精品| 麻豆精品一区二区| 亚洲永久一区二区三区在线| 国产乱码精品1区2区3区| 久无码久无码av无码| 国产·精品毛片| 国产成人精品视频ⅴa片软件竹菊| 国产三级精品在线| 成人做爰高清视频网站| 精品久久久久久久久久久久| 第三区美女视频在线| 91精品国产综合久久久久久漫画 | 国产精品理伦片| 日本按摩中出| 色婷婷久久久久swag精品| 午夜激情视频在线| 亚洲视屏在线播放| 国产精品久av福利在线观看| 国产在线视频91| 日韩av一区二区在线影视| 嫩草影院中文字幕| 亚洲欧美一区二区在线观看| 亚洲私人影吧| 亚洲国产精品99| 亚洲一区二区三区免费| 成人黄在线观看| 老汉av免费一区二区三区 | 亚洲影院免费| 国风产精品一区二区| 欧美极品aⅴ影院| 污网站在线观看视频| 精品欧美一区二区久久| 麻豆一区在线| 成人免费网站在线| 国产精品88888| 中文字幕毛片| 亚洲精品白浆高清久久久久久| 国产午夜久久av| 成人激情av| 91在线云播放| 你懂的在线播放| 亚洲一区二区精品| 66视频精品| 两根大肉大捧一进一出好爽视频| 精品国产91久久久久久| 亚洲高清黄色| 91精品国产综合久久香蕉922| 久久成人麻豆午夜电影| 992tv在线影院| 亚洲另类图片色| 99久久精品国产亚洲精品| wwwjizzjizzcom| 日韩人在线观看| **精品中文字幕一区二区三区| 亚洲最大成人网色| 久久综合色综合88| 成人三级网址| 91精品国产91久久| 激情欧美一区二区三区在线观看| 成年人黄色电影| 亚洲色图17p| 国产精品大片| 最新中文字幕2018| 亚洲国产天堂久久综合网| 国产精品久久久久久麻豆一区软件 | 日韩不卡一二三区| 中文字幕校园春色| 精品国内自产拍在线观看| 香蕉精品999视频一区二区| xxav视频| 久久中文字幕在线| 麻豆成人久久精品二区三区红| 先锋影音欧美性受| 午夜精品视频在线| 国产福利视频一区二区三区| 77导航福利在线| 国产精品国产三级国产aⅴ浪潮| 成人动漫视频在线| 岛国毛片av在线| 国产精品免费一区二区三区在线观看| 国产精品亲子乱子伦xxxx裸| 精品123区| 综合操久久久| 日韩一区国产二区欧美三区| 欧美国产日本| 亚洲成人天堂| 国产精品久久av| 中文字幕在线不卡视频| 国产专区精品| 久久久久久草| 欧美日韩亚洲高清一区二区| 97精品国产| 美女的诞生在线观看高清免费完整版中文 | 国产成人免费高清| 色老头在线观看| 国产精品一区二区三区在线观| 亚洲超碰精品一区二区| 国内精品偷拍| 啊啊啊国产视频| 久久中文字幕在线视频| 91亚洲精品乱码久久久久久蜜桃| 亚洲三级欧美| 成人区一区二区| 国产亚洲美女精品久久久| 精品一区二区免费视频| 九色porny视频在线观看| 午夜精品一区二区在线观看| 精品粉嫩超白一线天av| 日本不卡一区二区三区| bbw在线视频| 国产人妻人伦精品| 在线观看精品自拍私拍| 国产精品 欧美精品| www.26天天久久天堂| 日韩在线一级片| 色综合视频一区中文字幕| 国产精品国产三级国产| 狠狠操综合网| 暖暖视频在线免费观看| 久久资源av| 精品粉嫩aⅴ一区二区三区四区| 理论片日本一区| 日本中文字幕视频一区| 艹b视频在线观看| 国产精品亚洲第一区| 在线日韩一区二区| 日av在线不卡| 日韩黄色碟片| 国产va在线观看| 亚洲伊人一本大道中文字幕| 这里只有精品99re| 精彩视频一区二区| 亚洲欧洲一二区| 国产视频一二区| 国产99在线免费| 精品亚洲男同gayvideo网站| 99精品久久久久久| 天堂网av成人| 成人在线免费视频| 国产又粗又爽又黄的视频| 九九热精品视频| 欧美日韩精品在线视频| 日韩国产在线观看一区| 国产精品2区| 四虎在线免费看| 一区二区在线观看网站| 欧美疯狂xxxx大交乱88av| 狠狠干狠狠久久| 国产精品亚洲第一 | 日韩电影中文字幕|