国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

強化學習成幫兇,對抗攻擊LLM有了新方法

人工智能 新聞
近日,威斯康星大學麥迪遜分校的一個研究團隊發(fā)現(xiàn),可以通過強化學習對模型實施有效的黑盒逃避攻擊(Black-Box Evasion Attacks)。

事物都有多面性,正如水,既能載舟,亦能覆舟,還能煮粥。強化學習也是如此。它既能幫助 AlphaGo 擊敗頂級圍棋棋手,還能幫助 DeepSeek-R1 獲得強大的推理能力,但它也可能被惡意使用,成為攻擊 AI 模型的得力武器。

近日,威斯康星大學麥迪遜分校的一個研究團隊發(fā)現(xiàn),可以通過強化學習對模型實施有效的黑盒逃避攻擊(Black-Box Evasion Attacks)。研究團隊表示:「從安全角度來看,這項工作展示了一種強大的新攻擊媒介,即使用強化學習來有效且大規(guī)模地攻擊機器學習模型。」

圖片

  • 論文標題:Adversarial Agents: Black-Box Evasion Attacks with Reinforcement Learning
  • 論文地址:https://arxiv.org/pdf/2503.01734

下面我們就來簡單看看這項研究。

首先,為什么要研究如何攻擊模型?答案自然是為了安全。

現(xiàn)在 AI 發(fā)展迅猛,各種應用層出不窮,并且已經給許多領域帶來了巨大變革。而隨著應用的普及,攻擊這些模型也漸漸開始變得有利可圖,其中一類攻擊方式是:生成能夠欺騙 AI 模型的輸入,從而繞過安全過濾器。這個領域被稱為對抗機器學習(AML),研究的是能針對目標模型生成對抗樣本的算法。

現(xiàn)有的 AML 通常使用優(yōu)化算法來最小化施加到輸入的變化(稱為擾動),使得受害者機器學習模型對帶有擾動的輸入進行分類時會犯錯。不過,技術社區(qū)對模型防御和對抗能力的理解依然有限。

對抗樣本生成算法依賴基于梯度的優(yōu)化,該優(yōu)化與任何其他信息無關。這些方法無法利用從以前的攻擊中獲得的信息來改進對其他數(shù)據(jù)的后續(xù)攻擊。

這是 AML 研究中的一個空白,即研究對抗樣本是否可以學習 —— 攻擊的有效性和效率是否會隨著經驗的積累而提高。那么,對受害者模型訪問權限有限(稱為黑盒訪問)的對手能夠大規(guī)模生成對抗樣本(例如分布式拒絕服務攻擊)嗎?

將強化學習引入對抗攻擊

考慮到最近強化學習的成功,該團隊猜想能否將 AML 對手建模為強化學習智能體 —— 這樣一來,或許能讓攻擊策略隨著時間而變得越來越高效和有效。

他們按照這個思路進行了研究,提出了基于強化學習生成對抗樣本的攻擊方法并對其進行了評估。

他們發(fā)現(xiàn),當把對手建模成強化學習智能體時,其就能學習到哪些擾動最能欺騙模型。一旦學會了策略,對手就會使用該策略生成對抗樣本。因此,對抗性智能體無需昂貴的梯度優(yōu)化即可完成對模型的攻擊。

具體來說,該團隊將對抗樣本生成過程建模成了馬爾可夫決策過程(MDP)。如此一來,便可以輕松地使用強化學習,實現(xiàn)對攻擊的底層語義的封裝:輸入樣本和受害者模型輸出為狀態(tài),擾動為動作,對抗性目標的差異為獎勵。

該團隊提出了兩種強化學習攻擊方法:RL Max Loss 和 RL Min Norm。它們對應于兩類傳統(tǒng)的 AML 算法。

圖片

其攻擊流程是這樣的:首先使用一個強化學習算法來訓練智能體,然后在策略評估設置中使用攻擊來生成對抗樣本。

圖片

實驗評估

為了驗證強化學習攻擊方法的有效性,該團隊在 CIFAR-10 圖像分類任務上,使用一個 ResNet50 受害者模型進行了評估,使用的算法是近端策略優(yōu)化(PPO)。該團隊在此框架下進行多步驟評估,評估內容包括 (a) 學習、(b) 微調和 (c) 相對于已知方法的準確度。

圖片

首先,他們評估了強化學習智能體能否學習對抗樣本。換句話說,強化學習能否在訓練過程中提高對抗樣本的有效性和效率?

結果發(fā)現(xiàn),RL Max Loss 和 RL Min Norm 攻擊都會增加訓練過程中的平均回報,從而驗證了強化學習技術學習任務的能力。

圖片

圖片

在整個訓練過程中,對抗樣本的產生速度平均提升了 19.4%,而與受害者模型的交互量平均減少了 53.2%。

這些結果表明,通過高效地生成更多對抗樣本,智能體可在訓練過程中變得更加強大。

接下來,他們還分析了 RL Max Loss 和 RL Min Norm 中的獎勵和轉換超參數(shù)會如何影響對抗樣本。

ε 參數(shù)控制的是 RL Max Loss 智能體在給定輸入上允許的失真量。c 參數(shù)控制的是 RL Min Norm 智能體因降低受害者模型置信度而不是最小化失真而獲得獎勵的程度。

雖然訓練智能體可以提高這兩種攻擊的性能,但他們的研究表明這也取決于 ε 和 c 的選擇。具體實驗中,他們根據(jù)平衡對抗性目標的敏感性分析選擇了 ε = 0.5 和 c = 1.0。當對手使用這些攻擊時,為了達到預期目標,必須在攻擊之前考慮它們。

圖片

最后,該團隊還評估了經過訓練的智能體如何將對抗樣本泛化到未見過的數(shù)據(jù),以及它相對于廣泛使用的基于優(yōu)化的 SquareAttack 算法的表現(xiàn)如何。

在訓練外的未見過的數(shù)據(jù)集上,訓練后的智能體的錯誤分類率、中位數(shù)查詢和對抗樣本的平均失真都落在訓練對抗樣本的分布中。

圖片

在與 SquareAttack 的黑盒比較中,他們將 5000 episode 的強化學習攻擊與其它 SOTA 技術進行了比較,結果表明學習對抗樣本讓強化學習攻擊能夠生成多 13.1% 的對抗樣本。

圖片

這些結果表明,如果對手通過強化學習方法學習對抗樣本,會比現(xiàn)有方法更有效。

你怎么看待這項研究,我們又該怎么防御對手的強化學習攻擊呢?

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-05-31 10:45:01

深度學習防御

2017-06-10 16:19:22

人工智能智能體強化學習

2025-10-28 15:42:32

AlphaGo強化學習算法

2025-04-25 09:12:00

2025-10-20 08:50:00

2014-05-19 09:25:33

2018-11-16 10:10:09

2025-06-27 04:00:00

RLSC強化學習微調

2021-10-11 17:15:30

AI 數(shù)據(jù)人工智能

2023-12-06 13:20:00

AI模型

2021-09-27 10:12:42

欺騙防御rMTD網絡攻擊

2023-11-15 14:55:00

2025-05-28 02:25:00

2024-12-30 07:11:00

大型視覺語言模型VLMs人工智能

2025-04-27 09:12:00

AI模型技術

2015-08-21 09:14:40

大數(shù)據(jù)

2010-04-01 09:30:57

2021-01-15 23:08:01

區(qū)塊鏈食品安全供應鏈

2015-10-15 15:31:50

2025-06-10 11:22:09

強化學習AI模型
點贊
收藏

51CTO技術棧公眾號

日韩一区二区三| 粉嫩av一区二区| 久久精品国产一区二区三区不卡| 日韩中文在线字幕| 外国成人在线视频| 亚洲欧美激情另类校园| 国产污视频在线| 国产精品福利在线观看播放| 日韩禁在线播放| 亚洲一区3d动漫同人无遮挡| 精品视频网站| 久久视频国产精品免费视频在线| bt在线麻豆视频| 午夜精品一区二区三区电影天堂| 国产经典一区二区| 成人激情综合| 成人sese在线| 国产有色视频色综合| 欧美极品在线观看| 久久九九国产精品怡红院 | 黄网站在线免费| 亚洲制服丝袜在线| 天天色综合4| 波多野结衣在线播放一区| 在线视频一区二区| 国产美女永久无遮挡| 欧美专区18| 高清视频在线观看一区| 成人精品久久| 国产精品久在线观看| 亚洲kkk444kkk在线观看| 91免费精品国自产拍在线不卡| 一区二区冒白浆视频| 99视频精品免费观看| 国产欧美一区二区白浆黑人| 中文有码一区| 欧美激情视频在线免费观看 欧美视频免费一| 美女的胸无遮挡在线观看 | 欧美性猛交xxxx富婆弯腰| 黄网视频在线观看| 最新久久zyz资源站| 91日韩在线播放| 久久av综合| 日本国产精品视频| 麻豆导航在线观看| 亚洲成人午夜影院| 日本一区二区久久精品| 99人久久精品视频最新地址| 久久本道综合色狠狠五月| 久久福利毛片| 一本色道久久综合亚洲精品婷婷 | 欧美精品一区二区三区蜜桃| 羞羞的视频在线观看| 国产成人av福利| 2019中文字幕全在线观看| 91综合久久爱com| 欧美亚洲国产视频小说| 欧美日韩一二| 肥熟一91porny丨九色丨| 亚洲乱亚洲高清| 欧美一级二级三级九九九| 秋霞成人午夜伦在线观看| 91网站在线观看免费| 国产午夜亚洲精品午夜鲁丝片 | 久久精品国产sm调教网站演员| 成人av动漫在线| 手机在线免费观看毛片| 夜夜爽夜夜爽精品视频| 北岛玲一区二区三区| hitomi一区二区三区精品| 少妇高潮喷水在线观看| 国产精品久久看| 亚洲国产高清国产精品| 国产在线精品视频| 天天干天天爽天天射| 欧美日韩国产精品一区二区三区四区| 国产在线高清| 亚洲日本中文字幕| 啪啪亚洲精品| 日本视频一区二区不卡| 久久久.com| 日韩精品另类天天更新| 成人在线综合网| 中文字幕福利片| 99精品一区二区三区| 欧美精品七区| 成人永久aaa| 特黄特色特刺激视频免费播放| 在线精品国精品国产尤物884a| 一女被多男玩喷潮视频| 99国产精品久久久久久久| 亚洲精品8mav| 综合在线观看色| 老司机精品影院| 欧美黑人一级爽快片淫片高清| 亚洲综合影视| 久久综合免费视频| 中文字幕av一区| 国产精品扒开腿做爽爽爽视频软件| 超碰日本道色综合久久综合| 亚洲男女av一区二区| 中文字幕久热精品在线视频| 深夜福利久久| 日本丰满少妇黄大片在线观看| 色婷婷综合网| 中文字幕在线观看一区二区三区| 97精品在线| 男人c女人视频| 亚洲第一主播视频| 欧美hdxxx| 9191成人精品久久| 国产香蕉在线| 日韩亚洲欧美中文高清在线| 多野结衣av一区| 欧美专区在线播放| 丝袜亚洲另类欧美综合| av二区三区| 色妞一区二区三区| 91精品韩国| 国产日韩一区欧美| 成人欧美一区二区三区视频网页| 黄频免费在线观看| 国产亚洲一区在线播放| 亚洲精品国产无天堂网2021 | 久久久久久久国产精品| 另类成人小视频在线| 天天av综合网| 4438全国亚洲精品在线观看视频| 极品少妇一区二区| 在线观看免费黄色| 精品国产鲁一鲁一区二区张丽| 欧美成人精品三级网站| 九九热久久66| 亚洲国产精品精华液网站| 中文字幕一区二区三区中文字幕| 欧美午夜视频在线| 在线观看一区不卡| 久久人人99| 一级一片免费视频| 97视频免费看| 国产精品成人av| av免费看大片| 欧美激情视频在线免费观看 欧美视频免费一 | 美腿丝袜亚洲图片| 久久av红桃一区二区小说| 蜜臀av国产精品久久久久| 国产女人18毛片| 日韩欧美一区在线| 精品999成人| 亚洲成人精品一区二区三区| 国产成一区二区| 最近日韩中文字幕| 日韩精品免费一区二区三区竹菊| 麻豆av免费在线| 亚洲综合丝袜美腿| 视频免费一区二区| 日韩av片在线看| 正在播放亚洲1区| 9l国产精品久久久久麻豆| yy6080久久伦理一区二区| 欧美亚洲视频在线观看| 91免费版在线看| 国产95亚洲| 91文字幕巨乱亚洲香蕉| 国产成+人+综合+亚洲欧洲| 成人激情小说乱人伦| 日韩不卡视频在线观看| 狠狠干视频网站| 日韩中文字幕网| 国产精品网站导航| 国产亚洲电影| 九九在线视频| 日韩精品一区二区三区外面| 日韩激情视频在线播放| 成人av电影免费观看| 中文字幕一区二区三区四区久久| 污污网站免费看| 日韩暖暖在线视频| 色综合天天综合狠狠| 久久精品主播| 欧美性理论片在线观看片免费| 国产成人精品视频免费看| 欧美一级视频在线观看| 色欲综合视频天天天| 日韩国产欧美视频| 日本午夜免费一区二区| 99久久国产免费免费| 大胆亚洲人体视频| 一区二区三区亚洲变态调教大结局| 日韩一区二区三区不卡视频| 欧美日韩精品欧美日韩精品一综合| 宅男噜噜噜66国产日韩在线观看| 亚洲欧美成人影院| 国产精品网站免费| 国产精品久久久久久av下载红粉| 欧美午夜免费电影| 国产精品小仙女| 高清日韩av电影| 天天综合色天天综合色hd| 日韩在线视频国产|