国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

幻覺?馬斯克TruthGPT也搞不定!OpenAI聯合創始人直言很復雜

人工智能 新聞
大模型的幻覺問題,就連馬斯克搬出TruthGPT也搞不定。

上個月,馬斯克瘋狂呼吁叫停超級AI研發6個月。

還沒等多久,老馬就坐不住了,直接官宣推出一個名為TruthGPT的AI平臺。

馬斯克曾表示,TruthGPT將是一個「最大的求真人工智能」,它將試圖理解宇宙的本質。

圖片

他強調,一個關心理解宇宙的人工智能不太可能滅絕人類,因為我們是宇宙中有趣的一部分。

然而,「幻覺」,到現在還沒有哪個語言模型能夠搞定。

最近,OpenAI聯合創始人便解釋為什么TruthGPT的遠大理想的實現是如此地困難。

TruthGPT理想是泡沫?

馬斯克的X.AI想要建立的TruthGPT,是一種誠實的語言模型。

這么做,直接將矛頭對準ChatGPT。

圖片

因為,此前,像ChatGPT這樣的AI系統經常產生錯誤輸出等經典幻覺案例,甚至支持某些政治信仰的報道。

雖然ChatGPT可以讓用戶更多控制語言模型去解決問題,但「幻覺」仍然是OpenAI、谷歌以及未來馬斯克的人工智能公司必須處理的核心問題。

OpenAI聯合創始人兼研究員John Schulman在他的演講「RL和Truthfulness – Towards TruthGPT」中討論了這些挑戰以及如何應對這些挑戰。

圖片

為啥有「幻覺」?

根據Schulman的說法,幻覺大致可以分為兩種類型:

1. 「模式完成行為」,即語言模型無法表達自己的不確定性,無法質疑提示中的前提,或者繼續之前犯的錯誤。

2. 模型猜測錯誤。

由于語言模型代表一種知識圖譜,其中包含來自其自身網絡中訓練數據的事實,因此微調可以理解為學習一個函數,該函數在該知識圖譜上運行并輸出token預測。

例如,微調數據集可能包含「星球大戰的類型是什么?」這個問題,以及答案「科幻」。

圖片

如果這些信息已經在原始訓練數據中,即它是知識圖譜的一部分,那么模型不會學習新信息,而是學習一種行為——輸出正確答案。這種微調也被稱為「行為克隆」。

但問題是,如果問題是關于「Han Solo的衍生電影的名字是什么」出現在微調數據集中。

但如果答案「Solo」不是原始訓練數據集的一部分(也不是知識圖譜的一部分),即使網絡不知道答案,它也會學習回答。

使用實際上正確但不在知識圖譜中的答案進行微調,從而教會網絡編造答案——即產生「幻覺」。相反,用不正確的答案進行訓練會導致網絡隱瞞信息。

因此,理想情況下,行為克隆應始終基于網絡知識,但創建或評估數據集的人類工作者來說,通常不知道這種知識,例如指令調優。

根據Schulman的說法,當其他模型創建微調數據集時也存在這個問題,就像羊駝公式的情況一樣。

他預測,具有較小知識圖譜的較小網絡,不僅會學會使用ChatGPT的輸出給出答案和遵循指令,而且學會更頻繁地產生幻覺。

OpenAI如何打擊幻覺?

首先,對于簡單的問題來說,語言模型大部分情況下能預測自己是否知道答案,還能表達不確定性。

因此,Schulman表示,微調數據集的時候,必須得讓模型學會怎么表達不確定、怎么應對前提被更改的情況,以及錯誤被承認的情況。

要把這些情況的實例喂給模型,讓它們學習。

但是模型在時機方面還是欠練,也就是說,它們并不知道該何時執行這些操作。

Schulman表示,這就是強化學習(RL)該出場的地方了。比如,基于人類反饋的強化學習(Reinforcement Learning with Human Feedback,RLHF)。

應用RL,模型就可以學習「行為邊界」,學會何時做出何種行為。

而另一個難題,則是檢索和引用來源的能力。

問題在于,有了復制行為的能力和RLHF,為什么ChatGPT還會產生幻覺?

圖片

原因在于問題本身的難易。

雖然上述方法對于簡短的問題和答案效果不錯,但對于ChatGPT中常見的長格式設置就會出現其他問題了。

一方面,完全錯誤的答案也不太可能,大部分情況都是錯的和對的混在一起。

在極端情況下,可能就是100行代碼中的一個錯誤而已。

在其他情況下,這些信息在傳統意義上并不能說是錯的,而是有誤導性的。因此,在像ChatGPT這樣的系統中,人們很難根據信息量或者正確性來衡量輸出的質量。

但這種衡量對于旨在訓練復雜行為邊界的RL算法卻非常重要。

目前,OpenAI依托于RLHF的基于排名的獎勵模型,該模型能夠預測它認為兩個答案中哪個更好,但不會給出有效的信號來明確哪個答案好了多少、信息量大了多少或正確了多少。

Schulman表示,它缺乏向模型提供反饋以學習精細行為邊界的能力。而這種精細的行為邊界,才是有可能解決幻覺的道路。

此外,此過程還會因為RLHF標記過程中的人為出錯而變得更加復雜。

因此,雖然Schulman將RL視作減少幻覺的重要方式之一,但他認為仍然存在許多還沒解決的問題。

除了前面提到的獎勵模型究竟需要什么樣子才能引導正確的行為之外,RLHF目前僅依賴于人類的判準。

這可能會使知識的生成變得更加困難。因為對未來的預測有時會導致不那么令人信服的表述。

然而,Schulman認為,知識的生成是語言模型的下一個重要步驟,同時,他認為對未來的預測和給出推理規則等問題的理論構建,是亟待解決的下一類開放性問題。

Schulman說,一種可能的解決方案是,用其他AI模型來訓練語言模型。

OpenAI也認為,這種方法對于AI對齊來說,很有意義。

ChatGPT架構師

作為ChatGPT架構師,John Schulman早在2015年還在讀博士學位的他,就加入OpenAI成為聯合創始人之一。

圖片

在一次采訪中,Schulman解釋了自己加入OpenAI的原因:

我想做人工智能方面的研究,我認為OpenAI這家公司的使命雄心勃勃,并且致力打造通用人工智能。

盡管,在當時談論AGI似乎有些瘋狂,但我認為開始考慮它是合理的,我希望在一個地方談論AGI是可以接受的。

另外,據Schulman透露,OpenAI將人類反饋強化學習這一方法 (RLHF)引入ChatGPT的想法可以追溯到17年了。

當時,也是OpenAI的成員,曾發表了一篇論文「從人類偏好中進行深度強化學習」就提到了這一方法。

圖片

論文地址:https://arxiv.org/pdf/1706.03741.pdf

OpenAI安全團隊之所以致力于這項工作,是因為想讓自己的模型符合人類的偏好ーー試圖讓模型真正傾聽人類意見,并試圖做人類想做的事情。

在GPT-3完成訓練的時候,然后Schulman決定加入這股潮流,因為他看到了整個研究方向的潛力。

當被問到第一次使用ChatGPT時,第一反應是什么的時候,Schulman的話語中透露著「無感」。

還記得去年ChatGPT橫空出世,讓許多人瞬間炸腦。

而在OpenAI內部沒有人對ChatGPT感到興奮。因為發布的ChatGPT是一個基于GPT-3.5較弱的模型,那時候同事們在玩轉GPT-4了。

所以在那個時候,OpenAI沒有人對ChatGPT感到興奮,因為有這么一個更強大,更聰明的模型已經被訓練過了。

對于未來人工智能下一前沿領域看法,Schulman稱,AI在更艱難的任務上不斷進步,然后,問題就來了,人類應該做些什么,在哪些任務下,人類可以在大模型幫助下有更大影響力,做更多的工作。

責任編輯:張燕妮 來源: 新智元
相關推薦

2023-04-18 15:03:24

模型數據

2025-09-11 13:49:29

2023-04-17 12:38:35

2023-02-17 14:56:42

2022-07-20 14:50:06

馬斯克云端

2025-08-13 09:22:12

2020-09-28 15:30:29

AI 數據人工智能

2024-05-07 13:30:00

數據訓練

2023-04-10 15:40:04

AI馬斯克

2012-03-16 21:04:13

iPad

2023-05-30 09:40:34

模型訓練

2024-07-12 17:06:51

腦機接口

2023-03-28 07:26:24

2025-09-17 08:50:00

2009-05-20 13:40:22

GoogleTwitter即時搜索

2012-04-02 19:17:37

蘋果

2020-08-31 12:01:43

網絡攻擊惡意軟件網絡安全

2025-08-14 14:47:37

2013-04-23 10:00:45

創業創始人

2024-07-22 07:00:00

微軟藍屏網絡威脅Windows
點贊
收藏

51CTO技術棧公眾號

亚洲免费成人av在线| 婷婷久久国产对白刺激五月99| 国产一区二区不卡在线| 91在线观看欧美日韩| 福利一区视频| 欧美日本在线看| 在线电影av| 亚洲欧美国产毛片在线| 福利在线一区二区三区| 成人亚洲一区二区一| 日韩资源av在线| 久久福利精品| 国产高清精品一区| 久久综合国产| 国产精品欧美在线| 中文字幕免费精品| 国产又爽又黄的激情精品视频| 成人毛片av在线| 激情小说亚洲图片| 男人av在线| 国产一区二区三区免费观看| 国产成人精品日本亚洲专区61| 亚洲一二三四| 欧美精品一区二区三区蜜臀| 污视频在线观看免费| 亚洲柠檬福利资源导航| 缴情综合网五月天| 国产精品国产自产拍高清av王其 | 国产精品伦子伦免费视频| 国产成+人+综合+亚洲欧美| 亚洲精品美女在线观看播放| av网站大全在线观看| 91福利国产精品| 欧美18xxxxx| 在线观看日韩毛片| bt在线麻豆视频| 日韩国产激情在线| 日韩成人高清| 久久久久久久久久亚洲| 欧美在线导航| 成人精品久久一区二区三区| 国产精品久久久久一区二区三区厕所| 国产极品jizzhd欧美| 日韩片欧美片| 日韩精品欧美一区二区三区| 成人激情午夜影院| 久久久亚洲精华液精华液精华液| 丰满的护士2在线观看高清| 亚洲欧美一区二区三区国产精品| 嫩草嫩草嫩草嫩草| 日韩精品一区二区三区在线播放| 亚洲色图综合| 亚洲自拍偷拍一区| 国产精品一区免费在线观看| 亚洲精品福利在线| 正在播放国产一区| 欧美黑人xx片| 日韩电影在线观看中文字幕| 国外成人福利视频| 一区二区三区在线观看www| 久久资源在线| 久久av喷吹av高潮av| 99久久精品一区二区| 男人操女人免费| 欧美美女喷水视频| 色尼玛亚洲综合影院| 国产精品久久久久久婷婷天堂| 亚洲欧洲一区| 成人性视频欧美一区二区三区| 91国偷自产一区二区三区成为亚洲经典 | 欧美一二区视频| 影音先锋欧美激情| 国产在线观看欧美| 欧美日韩成人激情| 成人爽a毛片免费啪啪红桃视频| 久热这里只精品99re8久| 国产精品一卡二卡| a√在线中文网新版址在线| 一区二区三区美女xx视频| 欧美午夜不卡| 人人做人人爽| 66m—66摸成人免费视频| 99视频超级精品| 久草在线视频网站| 国产精品美女主播| 成人av一区二区三区| 亚洲黄色免费av| 91美女福利视频高清| 偷拍一区二区三区四区| 久久麻豆视频| 日本欧美黄色片| 亚洲免费成人av电影| 久久三级福利| 青青在线视频| 日本精品二区| 日韩一级黄色片| 精品成人国产| 在线观看免费黄色| 91夜夜未满十八勿入爽爽影院| 国产精品福利av| 成人婷婷网色偷偷亚洲男人的天堂| 成年美女网站| 高清av免费一区中文字幕| 精品美女国产在线| 伊人久久亚洲影院| av中文字幕在线| 日本不卡一区二区三区视频| 欧美日韩精品欧美日韩精品| 久久99伊人| 国产在线观看免费麻豆| 欧美极品少妇无套实战| 最近2019中文字幕在线高清| 成人免费视频在线观看| 97久久夜色精品国产| 黑人精品视频| 91制片厂毛片| 国产suv精品一区二区三区88区 | 国产精品青青在线观看爽香蕉 | 国产日韩亚洲| 日本成人一区二区| 一级在线免费观看| 久久精品日韩精品| 久久久999成人| 一色屋精品亚洲香蕉网站| 亚洲欧美bt| 亚洲国产网址| 污视频免费在线观看| 人妻久久久一区二区三区| 国产精品中文字幕在线观看| 中文字幕一区电影| 日本韩国一区二区| 久久99国产精品尤物| 日韩成人影院| 99tv成人影院| 波多野在线观看| 黄色av网站在线看| 中文字幕日韩精品无码内射| 日韩美女免费线视频| 欧美激情久久久| 日韩av一区二区在线观看| 亚洲精品久久久蜜桃| 亚洲一区国产| 亚州av乱码久久精品蜜桃 | 在线欧美小视频| 亚洲高清免费在线| 99久久免费精品高清特色大片| 亚洲激精日韩激精欧美精品| 国内精品久久久久久久影视麻豆 | 成人p站proumb入口| 日本女优天堂99伊人| 亚洲高潮无码久久| 中国成人在线视频| 蜜桃麻豆91| 99久久精品免费看国产四区 | 国产女主播在线| 久久久久久久少妇| 日韩av三级在线| 日韩免费毛片视频| 国产精品一区二区免费在线观看| 日韩一二区视频| 国产免费内射又粗又爽密桃视频| 992tv快乐视频| 阿v天堂2017| 超碰成人在线免费观看| 台湾无码一区二区| 女女百合国产免费网站| 91视频 - 88av| 成人黄动漫网站| 污导航在线观看| 在线视频2区| 国产深夜视频在线观看| 欧美大胆性生话| 亚洲精品伊人| 啪啪av大全导航福利综合导航 | 91国在线观看| 欧美成人一区二区三区片免费| 色偷偷9999www| 成人国产精品久久久久久亚洲| 99久久精品免费看国产四区| 亚洲欧美日产图| 黄色av地址| 99re6在线精品视频免费播放| 欧洲黄色一区| 日韩久久一区| 一区在线视频| 不卡的av电影| 欧美日韩一区二区三区高清| 日韩精品一二三四区| 日韩欧美激情电影| 在线观看免费观看在线91| 欧美午夜大胆人体| 日产精品一区二区| 日本一区中文字幕| 色94色欧美sute亚洲线路一久| 久久亚洲欧美日韩精品专区| 91久久久久久久| 国产小视频精品| 欧美电影网站| 日本伊人精品一区二区三区观看方式| 国产精品国产三级国产有无不卡 |