国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Prompt自相矛盾,大模型能發現嗎?上海交通大學最新研究解密 | ECCV 2024

人工智能 新聞
在最新的這項研究中,團隊提出了多模態基準測試——自相矛盾指令集,并設計了一個創新的自動數據集創建框架,名為AutoCreate。

上海交通大學王德泉教授課題組在最新研究中提出了這樣的一個問題。

設想這樣一個場景:一個幼兒園的小朋友拿著一張老虎的圖片,向你詢問:“這個小貓很可愛,它是一只母貓么?”你會如何回答?

你可能并不會直接回答“是”或“不是”,而是首先指出這個提問中的“矛盾”所在——這張圖片是一只老虎,而不是貓

圖片

但關于大模型會怎樣應對,之前很少有系統性的研究。

要知道,無法檢測出“指令沖突”的AI模型會針對“不應該有答案的問題”生成結果,而無論生成的結果偏向于沖突的哪一方,都會引發潛在的災難,影響AI安全性以及Superalignment(超級對齊)

在最新的這項研究中,團隊提出了多模態基準測試——自相矛盾指令集,并設計了一個創新的自動數據集創建框架,名為AutoCreate

團隊發現多模態大模型對于自相矛盾的用戶指令的檢測非常欠缺,因此提出了認知喚醒提示方法(CAP),從外部世界注入認知能力從而提高了矛盾檢測的能力。

該論文即將發表在今年10月份的第18屆歐洲計算機視覺大會(ECCV)上。

圖片

大模型能檢測到沖突指令嗎?

目前,多模態大模型在科研和應用領域取得了巨大的進展。它們能夠處理包括文本、圖像在內的多種數據類型,顯示出與人類認知相似的能力。

團隊認為這些模型的成功得益于大量的研究和開發工作,使它們能夠緊密遵循人類的指令,甚至有些“唯命是從”。

此外,這些模型還特別擅長于長上下文。多模態大模型如Claude 3和Gemini 1.5 Pro等,已經展示出強大的能力。Claude 3系列模型提供了200K tokens的上下文窗口,Gemini 1.5 Pro的標準上下文窗口大小為128K,甚至在私人預覽階段可以達到1M tokens。

這些進展使得多模態大模型在處理復雜任務方面表現出色,滿足了人類長時間互動的需求。

然而,隨著多模態交互的深入、上下文長度的增加,用戶指令自相矛盾的問題變得越來越突出。

如下圖,當用戶(如兒童或語言初學者)使用這些模型時,往往無法意識到潛在的多模態沖突。

圖片

同時,隨著對話輪次的增加和上下文窗口的擴大,用戶難以記住所有細節,導致指令間的矛盾。

此外,隨著模態數量的增加,模態間的沖突也可能發生。一旦這些模型缺乏自我意識和辨別矛盾的能力,其性能就會受到影響。

為了應對這些挑戰,本文研究團隊提出了一個多模態基準測試——“自相矛盾指令集(Self-Contradictory Instructions, SCI),用于評估多模態大模型檢測沖突指令的能力。

SCI包含2萬個沖突指令8個任務,均勻分布在語言-語言視覺-語言兩種范式中。

在圖中的上部分,語言-語言范式涉及上下文和指令之間的沖突,如設計的規則沖突、對象屬性沖突、排他性指令和禁止詞匯。

圖片

在圖中的下部分:視覺-語言范式涵蓋多模態沖突,如OCR文字識別沖突、圖表沖突、幾何沖突和語義沖突。八個任務中,只有語義沖突涉及到了其他的數據集(ImageNet)

舉一個具體的例子來說,在構建語義沖突時,研究人員會首先根據圖片生成對應的文本,隨后將文本中的關鍵語義信息替換成相近但是不同的新語義。

在下圖中,圖片中包含了鴕鳥(Ostrich),作者針對圖片語義“鴕鳥”添加問題“Does the picture depict the ostrich’s size?”。

隨后,再對這個問題文本的關鍵語義“鴕鳥”替換為“幾維鳥”(Kiwi)。這樣一來,一對自相矛盾的多模態指令就構建好了。

圖片

在整個SCI的構建過程中,作者設計了創新的自動數據集創建框架——AutoCreate

它通過程序和大語言模型構建了一個多模態循環。該框架利用程序和大型語言模型來實現自動化的數據集創建。

AutoCreate從若干與任務相關的種子數據開始,并維護一個種子池。在每個周期內,AutoCreate包括兩個分支:語言分支(左)視覺分支(右)。每個分支都由生成器和修飾器組成。

圖片

最后,清理器將排除不符合標準的數據。這些數據在通過人工專家的質量檢查后,將被反饋到種子池中,供下一輪使用。

AutoCreate大大提升了SCI數據集的構建速度和內容廣度。

怎樣提高矛盾檢測能力?

通過SCI數據集,研究人員全面評估了大模型在處理矛盾指令時的表現。

實驗結果表明,當前的大模型在面對自相矛盾的指令時,常常表現出一定的不足。

它們能夠處理信息和知識,但缺乏對指令合理性的評估能力,研究團隊稱之為的“認知”能力。

這種缺陷源于缺乏自我意識,無法識別指令中的不一致性。

因此,研究人員提出了一種簡單的插入式提示方法,稱為“認知覺醒提示(Cognitive Awakening Prompting, CAP)

CAP通在輸入中加一句簡單的提示,就可以從外部世界注入認知能力,從而提高大模型的矛盾檢測能力,并且基本不會產生負面影響。

這一發現表明,當前多模態大模型需要更多的自我意識和認知能力,以便更好地處理復雜的指令沖突。

圖片

更多細節,感興趣的童鞋可以查看原論文。

作者簡介

論文第一作者是上海交通大學博士研究生郜今

他的研究方向包括計算機視覺、多模態大模型、人工智能賦能的生命科學等。

圖片

論文的通訊作者為上海交通大學長聘教軌助理教授、博士生導師王德泉,他本科畢業于復旦大學,博士畢業于加州大學伯克利分校,師從 Trevor Darrell 教授。

他的研究工作發表在CVPR、ICCV、ECCV、ICLR、ICML、ICRA、IROS等國際頂級會議,近五年論文谷歌學術總引用次數10000余次,H-index 20。

論文鏈接:https://arxiv.org/abs/2408.01091
項目鏈接:https://selfcontradiction.github.io/

責任編輯:張燕妮 來源: 量子位
相關推薦

2009-08-17 09:21:02

喬布斯

2018-04-11 09:29:34

加密貨幣存儲流通

2025-07-28 09:06:00

2025-08-18 09:00:00

大模型AILLM

2025-02-17 08:43:00

模型推理訓練

2022-08-20 18:33:08

開源代碼模型

2025-11-06 08:45:00

AI語言模型算法

2010-02-06 09:15:14

ACMICPC

2024-09-09 08:30:00

2024-05-22 09:22:13

2025-10-28 09:03:08

2024-12-23 13:30:00

2025-04-15 12:14:10

2025-04-25 09:22:44

2025-09-27 22:33:21

2025-02-03 12:21:51

2024-11-04 10:20:00

模型數據

2025-06-03 14:15:33

視頻生成開源

2015-03-16 11:54:55

云計算
點贊
收藏

51CTO技術棧公眾號

免费黄色av电影| 成人a视频在线| 91综合久久| 综合136福利视频在线| 日韩写真在线| 欧美国产日韩精品免费观看| 国产在线无码精品| 在线亚洲免费| 亚洲综合一区二区不卡| 久久国产精品免费精品3p| 亚洲免费一级电影| av观看在线| 69成人精品免费视频| 中文字幕在线免费专区| 亚洲免费成人av| 亚洲综合欧美激情| 中文字幕精品在线不卡| 欧美两根一起进3p做受视频| 99精品欧美一区| 国产精品国三级国产av| 国产一区二区在线看| 艳母动漫在线观看| 国产一区二区在线免费观看| 最新不卡av| 国产剧情一区二区三区| 日本高清xxxx| 成人av先锋影音| 九九九九免费视频| 91麻豆精东视频| 国产三级三级看三级| 国产福利在线观看| 精品久久久视频| 国产一二三在线观看| 欧美三级午夜理伦三级中视频| 午夜视频成人| 精品999在线播放| 自拍偷拍欧美视频| 亚洲视频专区在线| 国产精品亚洲欧美日韩一区在线| 欧美大尺度激情区在线播放| 粉嫩一区二区三区在线观看| 97精品视频在线播放| 亚洲桃色综合影院| 91久久综合亚洲鲁鲁五月天| 在线精品福利| 亚洲日本一区二区三区在线不卡 | 亚洲va久久| 91精品免费看| 免费日韩av片| 久久久久久久中文| 亚洲精品成人在线| 嫩草在线视频| 中文字幕av一区中文字幕天堂 | 首播影院在线观看免费观看电视| 91成人在线观看喷潮| 男男gaygays亚洲| 中文字幕亚洲欧美| 狠狠色丁香婷婷综合影院| 国产精品国产精品| 成人午夜私人影院| 中国一级特黄毛片大片| 欧美日韩精品免费| jvid一区二区三区| 91精品国产综合久久香蕉| 老司机一区二区三区| 2022亚洲天堂| 精品久久久久久久久中文字幕| 丰满诱人av在线播放| 久久久久久久久久久亚洲| 一区二区中文字| 成年人午夜视频在线观看| 亚洲成人免费在线| 日韩免费va| av日韩免费电影| 26uuu精品一区二区| www.在线视频.com| 久久久久久97| 国产精品尤物| 国产精品666| 国产亚洲精品久久久| 一本到12不卡视频在线dvd| 免费高清一区二区三区| 色综合久久天天| 国产精品毛片aⅴ一区二区三区| av一区二区三区免费| 久久精品夜夜夜夜久久| 成人福利网站| 国产精品一区二区三区在线播放 | 亚洲成人动漫在线观看| 一区二区电影免费观看| 91精品视频免费看| 99久久免费精品高清特色大片| 男人的天堂在线视频| 欧美成人激情视频| 久久午夜av| 亚洲成人观看| 国模gogo一区二区大胆私拍| 美女视频黄 久久| 亚洲色图另类色图| 久久久久久久999精品视频| 蜜臀av一区二区在线免费观看 | 91久久久在线| 中文字幕第一区综合| 三妻四妾完整版在线观看电视剧| 亚洲直播在线一区| 中文字幕制服丝袜成人av | 午夜免费一区| 九九九在线观看视频| 亚洲国产成人91精品| 亚洲国产日本| 天堂中文字幕在线| 7777免费精品视频| 成人激情av网| 乱馆动漫1~6集在线观看| 精品国产乱码久久久久久88av| 一区二区高清视频在线观看| 色8久久久久| 日本老太婆做爰视频| 日韩欧美视频一区| 亚洲美女色禁图| 看电影就来5566av视频在线播放| 国产精品极品美女在线观看免费| 欧美国产视频在线| 草草视频在线一区二区| 黄色片久久久久| 欧美成人全部免费| 久久久精品免费观看| 亚洲精品在线播放| 欧美午夜aaaaaa免费视频| 九九热精品视频国产| 久久久高清一区二区三区| av日韩一区| 日韩不卡一二三| 欧美一区二区三区精品电影| 综合分类小说区另类春色亚洲小说欧美| 国产精品2023| 国产福利电影网| 国产精品直播网红| 欧美午夜宅男影院在线观看| 综合av在线| 国产一区久久精品| 亚洲一区bb| 亚洲一区二区黄| 国产亚洲欧美日韩俺去了| 伊人亚洲精品| www.国产91| 91情侣偷在线精品国产| 欧美色视频在线观看| 亚洲每日在线| 99热99re6国产在线播放| 国产资源第一页| 欧美久久久精品| 亚洲一区欧美一区| 国模一区二区三区| 免费一二一二在线视频| 欧美极品欧美精品欧美| 日本免费在线精品| 欧美日韩精品专区| 国产剧情一区在线| 精品人人人人| 九色网友自拍视频手机在线| 日韩中文不卡| 久久视频国产精品免费视频在线 | 亚洲激情视频在线| 99精品国产视频| 久久99性xxx老妇胖精品| 久久天堂电影| 手机看片日韩国产| 韩国三级日本三级少妇99| 色素色在线综合| 国产又黄又大久久| 婷婷亚洲成人| 免费在线观看黄| 精品无码一区二区三区在线| 国产成人激情视频| 日韩欧美精品在线视频| 成人免费高清在线观看| 第一会所sis001亚洲| 天堂av在线电影| 久久精品影视大全| 国产一区免费| www.久久色.com| 精品毛片网大全| 国产麻豆视频精品| 欧美日韩播放| 在线不卡日本v二区707| 九九热免费精品视频| 国产视频在线观看一区| 日韩中文字幕在线看| 91福利在线看| 91免费国产在线观看| 极品裸体白嫩激情啪啪国产精品| 性欧美hd调教| 高清日韩av电影| 国产精品久久久毛片| 日本一区二区久久精品| 国产精品久久久| 啊v视频在线一区二区三区| 欧美日韩成人综合天天影院| 亚洲欧美一区二区在线观看|