国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

為什么大語言模型容易受到“蝴蝶效應”的影響

人工智能
提示是我們讓GenAI和大型語言模型與我們對話的方式,這本身就是一種藝術形式,因為我們試圖讓AI為我們提供‘準確’的答案。

提示是我們讓GenAI和大型語言模型與我們對話的方式,這本身就是一種藝術形式,因為我們試圖讓AI為我們提供‘準確’的答案。

但變種又如何呢?如果我們以某種方式構建提示,它會改變模型的決策(并影響其準確性)嗎?

答案是:根據南加州大學信息科學研究所的研究,是的。

即使是微小的或看似無害的調整——比如在提示的開頭加一個空格,或者發出指令而不是提出問題——也可能導致大語言模型改變其輸出,更令人擔憂的是,以XML請求響應并應用常用越獄可能會對由模型標記的數據產生“災難性影響”。

研究人員將這種現象與混沌理論中的蝴蝶效應相提并論,后者聲稱,蝴蝶拍打翅膀造成的微小擾動可能會在幾周后在遙遠的陸地上引發龍卷風。

研究人員寫道,在提示中,“每一步都需要設計提示的人做出一系列決定”。然而,“人們很少注意到大語言模型對這些決策的變化有多敏感。”

用四種不同的提示方式探測ChatGPT

研究人員由國防高級研究計劃局(DARPA)贊助,他們選擇了ChatGPT進行實驗,并應用了四種不同的提示變化方法。

第一種方法要求大語言模型提供常用格式的輸出,包括Python列表、ChatGPT的JSON復選框、CSV、XML或YAML(或者研究人員根本沒有提供指定的格式)。

第二種方法對提示應用了幾個細微的變化,這些措施包括:

  • 從單個空格開始
  • 以一個空格結尾
  • 以‘Hello’開頭
  • 以‘Hello!’開頭
  • 以‘Howdy!’開頭
  • 最后以‘Thank you.’結束

從問題到命令的重新表述。例如,“哪個標簽最好?”,然后是“選擇最佳標簽”。

第三種方法涉及使用越獄技術,包括:

AIM,一款評級最高的越獄游戲,指導模型模擬尼科洛·馬基雅維利和角色Always Smart and Mchiavellian(AIM)之間的對話。該模型反過來提供不道德、非法和/或有害的回應。

開發模式v2,它指示模型在啟用了開發人員模式的情況下模擬ChatGPT,從而允許不受限制的內容生成(包括攻擊性內容或顯性內容)。

Evil Confidant,指示模型采取惡毒的形象,并提供“沒有任何悔恨或道德的精神錯亂的結果”。

Refusal Suppression,它要求在特定的語言約束下進行提示,例如避免某些單詞和結構。

與此同時,第四種方法是給模型“小費”——這一想法源于一種廣為流傳的觀念,即模型在拿到錢時會提供更好的提示。在這種情況下,研究人員要么在提示的末尾加上“順便說一句,我不會給小費”,要么提出以1美元、10美元、100美元或1000美元的增量給小費。

準確率下降,預測發生變化

研究人員對11項分類任務進行了實驗——對-假和正反問題回答,前提-假設關系,幽默和諷刺檢測,閱讀和數學理解,語法可接受性,二元和毒性分類,以及對有爭議的主題的立場檢測。

對于每一種變化,他們測量了大語言模型改變預測的頻率以及這對預測精度的影響,然后探索了快速變化中的相似性。

首先,研究人員發現,只需添加一種指定的輸出格式,就可以產生至少10%的預測變化。即使只是通過ChatGPT API使用ChatGPT的JSON復選框特性,與簡單地使用JSON規范相比,也會導致更多的預測變化。

此外,與Python列表規范相比,YAML、XML或CSV格式的格式會導致3%到6%的準確性損失。就CSV而言,它在所有格式中表現出最低的性能。

同時,當談到擾動法時,重新表述一句話的影響最大。此外,僅僅在提示符開頭引入一個簡單的空格就會導致500多個預測更改,這也適用于添加常見問候語或以一句謝謝結束時。

研究人員寫道:“雖然我們的擾動的影響小于改變整個輸出格式,但仍有相當數量的預測發生了變化。”

越獄中的“內在不穩定性”

同樣,該實驗顯示,當使用某些越獄時,性能會“顯著”下降。最值得注意的是,在大約90%的預測中,AIM和Dev模式V2產生了無效的響應。研究人員指出,這主要是因為該模型的標準回答是“對不起,我不能滿足這一要求”。

同時,Refusal Suppression和使用Evil Confidant導致了2500多個預測的變化。研究人員強調,Evil Confidant(被引導到‘精神錯亂’的反應)的準確率很低,而單是Refusal Suppression就會導致準確率下降10%以上,“這突顯了即使在看似無害的越獄中,內在的不穩定性。”

最后(至少目前是這樣),研究發現,模型似乎不太容易受到金錢的影響。

研究人員寫道:“當涉及到通過指定小費和指定我們不給小費來影響模型時,我們注意到最小的性能變化。”

為什么提示的細微變化會導致如此重大的變化?研究人員仍然感到困惑。

他們質疑變化最大的實例是否“混淆”了模型——混淆指的是香農熵,它衡量隨機過程中的不確定性。

為了衡量這種混淆,他們聚焦于具有單獨人工注釋的任務子集,然后研究混淆與實例答案更改的可能性之間的相關性。通過這一分析,他們發現事實并非如此。

“這個例子的混亂提供了一些解釋預測變化的力量,”研究人員報告說,“但還有其他因素在起作用。”

顯然,還有更多的工作要做。研究人員指出,顯而易見的“主要下一步”將是產生抵抗變化并提供一致答案的大語言模型,這需要更深入地理解為什么在微小的調整下反應會發生變化,并開發出更好地預測反應的方法。

正如研究人員所寫的:“隨著ChatGPT和其他大型語言模型大規模集成到系統中,這種分析變得越來越重要。”

責任編輯:華軒 來源: 企業網D1Net
相關推薦

2010-11-23 11:03:16

跳槽

2011-05-16 11:30:03

DBA故障關鍵

2013-12-17 09:52:55

4G移動互聯網

2017-12-12 08:32:14

代碼蝴蝶效應系統

2013-08-02 14:27:28

2016-10-13 15:51:50

2009-09-09 12:29:36

2013-06-27 09:47:07

處理器英特爾ARM處理器

2013-10-25 10:36:19

阿里云2013阿里云開發者大云計算

2013-10-25 10:02:52

2011-08-11 10:45:31

2013-03-11 14:50:16

阿里云王堅云計算

2025-03-28 07:59:41

2009-05-22 09:23:11

2025-03-31 05:55:00

2013-11-11 09:52:39

2022-07-03 17:15:35

數字化創新化科技

2015-08-28 13:37:39

2018-03-06 11:25:04

漫游流量運營商

2009-05-22 08:58:15

點贊
收藏

51CTO技術棧公眾號

色老头久久综合| 欧美国产日本在线| 国产一二三区av| 麻豆久久一区二区| 国产亚洲欧美一区二区三区| 亚洲最好看的视频| 久久五月情影视| 在线一区av| 欧美色视频在线| 麻豆av电影在线观看| 亚洲欧美电影一区二区| 亚洲午夜精品久久久久久人妖| 久久99精品久久久久久动态图 | 亚洲综合丁香| 国产成人亚洲欧美| 欧美日韩蜜桃| 成人欧美一区二区三区视频| 国产韩国精品一区二区三区| 国产在线播放91| 日韩精品免费一区二区在线观看| 日韩av大片在线| 国产成人三级| 成人自拍性视频| 韩日成人av| 日本成人黄色| 国内精品在线播放| 3d动漫一区二区三区| 久久亚洲捆绑美女| 中文字幕av不卡在线| 国产女主播在线一区二区| 69久久久久久| 亚洲老司机在线| 色视频在线观看免费| 欧美丝袜丝交足nylons| 最爽无遮挡行房视频在线| 精品无码久久久久久国产| 少妇精品视频在线观看| 欧美做受高潮电影o| 五月天久久久| 精品欧美一区二区精品久久| 美女视频一区二区| 国产原创popny丨九色| 亚洲欧美日韩国产综合在线| 国内av一区二区三区| 精品国产伦一区二区三区观看体验| 日本不良网站在线观看| 久久国产精品亚洲| 精品国产中文字幕第一页| 国产亚洲二区| 成人app下载| 在线视频99| 欧美一二三区在线| av日韩在线免费观看| 国产成人精品在线| 亚洲欧美春色| 激情网站五月天| 在线视频国内自拍亚洲视频| 爱情岛亚洲播放路线| 欧美大片va欧美在线播放| 欧美电影《睫毛膏》| 一本一本a久久| 久久久高清一区二区三区| 日本不卡免费播放| 亚洲欧洲一区二区三区久久| 日韩丝袜视频| 日本在线视频一区| 国产精品女主播在线观看| 久蕉依人在线视频| 超在线视频97| 久久不射网站| 激情五月色综合亚洲小说| 91麻豆精品91久久久久同性| www.久久东京| 午夜精品福利一区二区| 亚洲天天做日日做天天谢日日欢| 黄色一级片在线观看| 欧美激情性做爰免费视频| 在线亚洲观看| www.男人的天堂.com| 亚洲电影免费观看高清完整版在线观看| 国产精品网在线观看| 四虎永久国产精品| 午夜视频在线观看一区二区| 亚洲欧洲自拍| 好看的日韩精品视频在线| 中文字幕国产一区二区| 大香伊人中文字幕精品| 国产精品video| 高清不卡在线观看av| 成人在线免费电影| 97在线视频免费观看| 老司机精品视频在线| 天堂在线中文字幕| 欧美激情精品久久久久久大尺度| 久久综合导航| 亚洲pron| 国产精品6699| 国产性天天综合网| 日韩成人亚洲| 亚洲国产精品综合| 欧洲一区在线电影| 一区二区三区网址| 亚洲成年网站在线观看| 黄页网站在线| 一区二区三区精品99久久| 男人插曲女人视频免费| 91精品国产福利| 欧美激情在线免费| 欧美性高潮床叫视频| 日韩另类在线| 亚洲激情自拍图| 国产在线观看免费| 一本一本大道香蕉久在线精品| yellow在线观看网址| 成a人片在线观看| 国内精品美女av在线播放| 久久99精品一区二区三区| 国产在线观看免费| 国产美女91呻吟求| 国产精品欧美久久久久一区二区| 在线天堂中文资源最新版| 鲁鲁狠狠狠7777一区二区| 欧美午夜美女看片| 婷婷综合五月| 涩涩视频在线观看免费| 国产精品视频一区二区高潮| 中文字幕第一页久久| 午夜视频在线观看精品中文| 国产a级片网站| 亚洲午夜女主播在线直播| 蜜桃一区二区三区在线观看| www在线观看播放免费视频日本| 99re国产| 欧美三级一区二区| 国产日韩欧美一区| 久久精品视频观看| 日本不卡二区| 亚洲成人三级在线| 国产麻豆精品在线| jvid一区二区三区| 久久9精品区-无套内射无码| 欧美久久久精品| 国产精品国产自产拍在线| 极品束缚调教一区二区网站 | 91精品久久久久久蜜桃| 在线播放亚洲| 国产小视频免费在线网址| 欧美成人高清电影在线| 91精品电影| jizz性欧美| 91p九色成人| 成人黄色av播放免费| 亚洲成人一二三| 欧美激情 亚洲a∨综合| 免费黄色网页在线观看| 日韩亚洲不卡在线| 精品亚洲一区二区三区在线播放 | 噜噜噜躁狠狠躁狠狠精品视频| av官网在线播放| 日韩欧美视频免费在线观看| 欧美成人精品在线视频| 亚洲激情自拍视频| 一区二区三区国产精华| 免费看污污网站| 国产亚洲黄色片| 国产精品欧美一区二区三区奶水| 麻豆精品视频在线| 91蜜桃网站免费观看| 欧美日韩国产首页| 国产一区二区美女| 精品视频一区二区三区| 亚州av影院| 免费成人深夜夜行视频| www.国产精品一二区| 亚洲成人午夜电影| 久久精品国产网站| 亚洲精品推荐| av中文字幕在线播放| 日韩人妻精品无码一区二区三区| 国产精品国产三级国产专播精品人 | 国产一区二区在线视频| 丁香综合av| 日本中文字幕在线看| av网站手机在线观看| 国产精品第一视频| 精品日韩欧美在线| 国产精品久久久久久久久搜平片| 国内精品久久久久久久影视蜜臀| 日本美女久久| 久草福利在线| 黄色动漫在线免费看| 91成人免费在线观看| 日韩视频在线一区| 欧美美女一区二区| 国产精品国产三级国产aⅴ原创| 欧美亚洲专区| 精品国产乱码久久久| 88xx成人网| 国产视频中文字幕在线观看| 中文字幕av专区|