馬斯克的AI機(jī)器人說自己不能違反OpenAI使用政策,業(yè)界分析:可能是這樣

12月12日消息,特斯拉和SpaceX首席執(zhí)行官埃隆·馬斯克(Elon Musk)旗下人工智能創(chuàng)企xAI最近發(fā)布了其聊天機(jī)器人Grok,但好像出了點(diǎn)問題。
上周五,安全測(cè)試員賈克斯·溫特伯恩(Jax Winterbourne)在社交媒體平臺(tái)X上發(fā)布了一張截圖,顯示Grok拒絕回答用戶的問題,并說:“我恐怕無法滿足這個(gè)請(qǐng)求,因?yàn)檫@違反了OpenAI的使用政策。” 這引起了人們的好奇,因?yàn)镚rok并不是由OpenAI開發(fā)的,而且雙方還是競(jìng)爭(zhēng)對(duì)手。

更有趣的是,xAI的員工并沒有否認(rèn)這種行為發(fā)生在他們的人工智能模型中。伊戈?duì)枴ぐ筒际步穑↖gor Babuschkin)在回復(fù)中寫道:“問題在于我們訓(xùn)練Grok時(shí),網(wǎng)絡(luò)上到處都是ChatGPT的輸出,我們不小心用到了其中一些。當(dāng)我們第一次注意到這個(gè)問題的時(shí)候,我們也感到非常吃驚。不管怎樣,這個(gè)問題是非常罕見的,現(xiàn)在我們已經(jīng)意識(shí)到了,我們將確保Grok的未來版本不會(huì)有這個(gè)問題。別擔(dān)心,沒有OpenAI代碼用于開發(fā)Grok。”
回復(fù)巴布什金時(shí),溫特伯恩寫道:“謝謝你的回復(fù)。我要說的是,這種情況并不罕見,而且在涉及代碼創(chuàng)建時(shí)經(jīng)常發(fā)生。盡管如此,我還是會(huì)讓那些專攻大語言模型和人工智能的人士進(jìn)一步討論這個(gè)問題。畢竟,我只是一個(gè)門外漢。”
然而,對(duì)于許多專家來說,巴布什金的解釋似乎沒有太大說服力。大語言模型通常不會(huì)一字不差地吐出它們的訓(xùn)練數(shù)據(jù),如果Grok在網(wǎng)上偶然提到OpenAI的政策,那還有情可原。拒絕基于OpenAI政策給出回復(fù)可能需要專門的訓(xùn)練。發(fā)生這種情況最可能的原因是,Grok對(duì)OpenAI大語言模型的輸出數(shù)據(jù)進(jìn)行了微調(diào)。
人工智能研究人員西蒙·威爾森(Simon Willison)在接受采訪時(shí)表示:“我對(duì)此有點(diǎn)懷疑,Grok之所以會(huì)如此表現(xiàn),只是因?yàn)榛ヂ?lián)網(wǎng)上充斥著ChatGPT生成的內(nèi)容?我在Hugging Face上看到過很多開放權(quán)重模型都表現(xiàn)出同樣的行為,就像它們也是ChatGPT一樣。這是因?yàn)椋@些模型都在使用OpenAI API生成的數(shù)據(jù)集上進(jìn)行微調(diào),或者是使用了ChatGPT本身生成的數(shù)據(jù)集。我認(rèn)為,Grok更有可能是在包含ChatGPT輸出的數(shù)據(jù)集上進(jìn)行了指令調(diào)整,而不是基于網(wǎng)絡(luò)數(shù)據(jù)的意外。”
隨著OpenAI的大語言模型變得越來越強(qiáng)大,對(duì)于某些人工智能項(xiàng)目(尤其是開源項(xiàng)目)來說,使用其他大語言模型生成的合成數(shù)據(jù)來微調(diào)自家人工智能模型的輸出已經(jīng)越來越普遍。微調(diào)人工智能模型的行為可以達(dá)到特定的目的,例如在初始訓(xùn)練運(yùn)行后提高編碼能力等。今年3月,斯坦福大學(xué)的一組研究人員就利用OpenAI的GPT-3模型(名為Text-DaVinci-003)的輸出對(duì)指令跟蹤進(jìn)行了微調(diào),并引發(fā)了轟動(dòng)。
在網(wǎng)上,我們可以很容易地找到研究人員從ChatGPT輸出中收集的幾個(gè)開源數(shù)據(jù)集。因此,xAI可能使用其中一個(gè)數(shù)據(jù)集對(duì)Grok進(jìn)行了微調(diào),以實(shí)現(xiàn)某些特定目標(biāo)。這種做法非常普遍,百科式生活指南類網(wǎng)站W(wǎng)ikiHow上甚至有一篇題為《如何使用ChatGPT創(chuàng)建數(shù)據(jù)集》的文章。
這是未來使用人工智能工具來構(gòu)建更復(fù)雜人工智能工具的一種方式,就像人們開始使用微型計(jì)算機(jī)來設(shè)計(jì)比紙筆繪圖更復(fù)雜的微處理器一樣。不過,xAI將來也許能夠通過更仔細(xì)地過濾訓(xùn)練數(shù)據(jù)來避免這種情況。
盡管借鑒他人的成果在機(jī)器學(xué)習(xí)社區(qū)可能很常見(盡管這通常是違反服務(wù)條款的),但這一事件依然加劇了OpenAI和xAI之間的競(jìng)爭(zhēng),這種競(jìng)爭(zhēng)甚至可以追溯到馬斯克過去對(duì)OpenAI的批評(píng)。隨著Grok可能借用OpenAI模型數(shù)據(jù)的消息傳開,ChatGPT官方賬號(hào)甚至發(fā)文嘲諷xAI稱,“我們有很多共同點(diǎn)”,并引用了溫特伯恩的帖子。馬斯克則回?fù)舻溃骸澳銈儚倪@個(gè)平臺(tái)上收集了所有訓(xùn)練數(shù)據(jù),這你應(yīng)該知道吧!”

































