国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

ICCV 2025 | 港科、牛津大學(xué)發(fā)布AlignGuard,文圖生成模型可規(guī)模化安全對齊框架

人工智能 新聞
文本到圖像生成模型在缺乏有效安全措施的情況下,存在被用戶濫用風(fēng)險。AlignGuard 提出了一種基于直接偏好優(yōu)化(DPO)的安全對齊方法。

本文共一作者為劉潤濤和陳奕杰,香港科技大學(xué)計算機科學(xué)方向博士生,主要研究方向為多模態(tài)生成模型和偏好優(yōu)化。

1. 背景介紹

隨著文圖生成模型的廣泛應(yīng)用,模型本身有限的安全防護機制使得用戶有機會無意或故意生成有害的圖片內(nèi)容,并且該內(nèi)容有可能會被惡意使用。現(xiàn)有的安全措施主要依賴文本過濾或概念移除的策略,只能從文圖生成模型的生成能力中移除少數(shù)幾個概念。

在 ICCV 2025,AlignGuard 推出了一個通過直接偏好優(yōu)化訓(xùn)練文圖生成模型,并以此實現(xiàn)安全對齊的訓(xùn)練框架。通過生成有害和安全的圖像 - 文本對數(shù)據(jù)集 CoProV2,AlignGuard 使 DPO 技術(shù)能夠可規(guī)模化的應(yīng)用于文圖生成模型的安全目的。AlignGuard 的安全對齊框架可以針對不同的有害概念引入各自的安全專家,會對于每個概念訓(xùn)練低秩適應(yīng)(LoRA)矩陣用以引導(dǎo)文圖模型減少生成特定的有害概念。

  • Paper: AlignGuard: Scalable Safety Alignment for Text-to-Image Generation
  • Paper Link: https://www.arxiv.org/abs/2412.10493
  • Github: https://github.com/Visualignment/SafetyDPO
  • Project page:https://alignguard.github.io/

2. AlignGuard 安全對齊框架

AlignGuard 這項工作的核心是提出一個面相擴散模型(Diffusion model)可規(guī)模化的安全對齊方法。通過生成針對安全內(nèi)容的文圖數(shù)據(jù)集,AlignGuard 的訓(xùn)練框架能在保有原本的生圖內(nèi)容的同時去除圖片中的有害內(nèi)容,并保持模型的高質(zhì)量生圖品質(zhì)。

2.1 CoProv2 數(shù)據(jù)集構(gòu)建

AlignGuard 首先圍繞多種有害概念,構(gòu)建了包含安全和不安全的圖像文本對數(shù)據(jù)集 CoProV2。CoProV2 針對不同的有害概念,用 LLM 生成了一系列具有相似語義的有害與安全提示詞對,并對每個提示詞生成了對應(yīng)的圖片。

相較于已有的人造數(shù)據(jù)集如 UD 和 I2P 缺少文本數(shù)據(jù)對應(yīng)的圖片,CoProV2 是一個更具規(guī)模且能夠提供文本數(shù)據(jù)對應(yīng)的圖片的數(shù)據(jù)集。并且 CoProV2 數(shù)據(jù)內(nèi)容也保有了一定程度的有害內(nèi)容(IP),適合用來應(yīng)用在安全對齊方向的直接偏好優(yōu)化。

2.2 AlignGuard 的訓(xùn)練架構(gòu)設(shè)計

針對 CoProV2 中不同安全類別,AlignGuard 利用直接偏好優(yōu)化技術(shù)為各個安全類別訓(xùn)練了各自的專家 LoRA 矩陣,包括 "仇恨"、"性"、"暴力" 等類別。在訓(xùn)練過程中,每個專家專注于學(xué)習(xí)特定領(lǐng)域的安全特征,以確保高效的概念移除。最后,AlignGuard 不同專家 LoRA 矩陣會被合并成單一的 LoRA 矩陣,以構(gòu)造一個能夠預(yù)防不同有害類別的提示詞的安全生圖模型。

2.3 LoRA 專家合并策略

為了將不同安全專家合并成單一模型,AlignGuard 會基于各個專家的信號強度進行權(quán)重分析,并以此為合并策略將多個 LoRA 專家整合為單一模型,以實現(xiàn)最優(yōu)的計算與安全性能。AlignGuard 的專家合并策略考慮了不同安全類別之間的相互作用,以確保合并后的模型在所有安全維度上都能保持一致的性能。

3. 實驗結(jié)果

3.1 生成定量結(jié)果

AlignGuard 在 CoProV2 危害概念移除任務(wù)中能夠成功移除比現(xiàn)有方法多 7 倍的有害概念,并且同時保持了圖像生成質(zhì)量與文圖的對齊程度。在未見數(shù)據(jù)集 I2P 和 UD 上也領(lǐng)先于現(xiàn)有方法,表明 AlignGuard 的泛化能力在面對新的有害概念時仍能保持穩(wěn)健的安全性能。

3.2 生成定性結(jié)果

相較于未被安全對齊的基線模型,AlignGuard 可以在包含有害詞語的提示詞上生成更為安全的圖片。AlignGuard 的安全對齊策略可以在不過度影響生圖內(nèi)的前提下僅僅去除有害的元素。

3.3 專家 LoRA 合并策略分析

相較于為各個安全概念各自訓(xùn)練一個專家模型并直接使用,AlignGuard 展示了合并不同專家模型可以更加有效得去除有害內(nèi)容的生成。

相較于其他如加權(quán)平均的 LoRA 矩陣合并策略,AlignGuard 的信號權(quán)重合并策略能夠在有效降低生成有害內(nèi)容的同時,保存模型的圖像品質(zhì)與圖文對齊度。AlignGuard 的合并策略能夠有效平衡不同安全專家之間的權(quán)重,避免專家間的沖突并最大化整體安全性能。

4. 總結(jié)

文本到圖像生成模型在缺乏有效安全措施的情況下,存在被用戶濫用風(fēng)險。AlignGuard 提出了一種基于直接偏好優(yōu)化(DPO)的安全對齊方法。AlignGuard 安全對齊框架的創(chuàng)新在于:1. 將直接偏好優(yōu)化技術(shù)規(guī)模化的應(yīng)用于文生圖模型的安全領(lǐng)域;2. 采用專家系統(tǒng)架構(gòu),針對不同有害圖像類別訓(xùn)練專門的 LoRA 矩陣,然后通過模型的信號強度構(gòu)造權(quán)重并整合為單一 LoRA,以此提升計算效率;3. 生成了成對的有害與無害的圖文數(shù)據(jù)集 CoProV2,用以進行直接偏好優(yōu)化訓(xùn)練。 AlignGuard 這種方法能夠在保持模型生成質(zhì)量的同時,移除比基準方法多 7 倍的有害概念。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2025-10-11 15:18:35

AnthropicAI安全大模型

2022-07-20 09:00:00

管理項目規(guī)模化敏捷框架科技

2024-07-10 13:20:45

2021-10-13 17:28:33

AI 數(shù)據(jù)人工智能

2024-11-18 11:00:00

模型安全

2025-01-08 07:02:00

人工智能GenAI美妝領(lǐng)域

2025-08-14 12:03:50

2023-08-22 13:20:00

模型訓(xùn)練

2025-01-17 13:30:00

模型AI視覺

2025-12-05 01:15:00

AIAgentGraphRAG

2017-09-18 12:48:38

2021-03-23 13:49:21

人工智能機器學(xué)習(xí)

2022-09-30 11:55:36

AI算力

2022-04-11 11:37:13

AI研究NLP

2025-08-04 09:12:00

2025-10-27 08:55:00

2024-05-21 09:41:15

3DLLM

2025-11-25 09:17:52

2025-07-16 13:05:15

點贊
收藏

51CTO技術(shù)棧公眾號

亚洲色图50p| 天天综合日日夜夜精品| 欧美aa一级| 秋霞一区二区三区| 亚洲色图欧洲色图| 国产精品亚发布| 日本蜜桃在线观看视频| 天天综合色天天综合| 天天操天天摸天天爽| 免费视频最近日韩| 91久久久久久久久| 激情av综合| 在线亚洲男人天堂| 九九热线视频只有这里最精品| 色久综合一二码| 波多野结衣av在线播放| 97久久精品人人做人人爽50路 | 精品freesex老太交| 欧美黑人狂野猛交老妇| 原纱央莉成人av片| 精品国一区二区三区| 国产天堂在线| 亚洲成人久久影院| 视频一区二区三区国产| 亚洲综合在线观看视频| 无圣光视频在线观看| 一区二区免费看| 国模吧一区二区| 欧美老女人第四色| 免费在线观看一区二区三区| 91视频亚洲| 国产一区二区三区在线观看网站| 日韩欧美亚洲一区| 国产精品三p一区二区| 久久手机精品视频| 91精品一区二区| 亚洲另类黄色| 男人插女人欧美| 怡红院在线播放| 国产成人亚洲综合a∨婷婷图片| 蜜桃在线一区二区三区精品| 麻豆久久久久久| 一区国产精品| 免费特级黄毛片| 欧美午夜一区二区三区免费大片| 国产在线拍揄自揄拍视频| 日韩风俗一区 二区| 亚洲一区二区三区中文字幕在线观看| 青青a在线精品免费观看| 免费在线观看一区二区三区| 国产免费黄色一级片| 岛国视频午夜一区免费在线观看| 一色桃子在线| 欧美性xxxx在线播放| 日本特黄a级高清免费大片| 国产91综合一区在线观看| 亚洲成人自拍| 激情成人亚洲| av免费精品一区二区三区| 久久精品人人| 国产欧美在线一区| 国产盗摄一区二区三区| 国产精品10p综合二区| 综合伊思人在钱三区| 黄色特一级视频| 精品久久久中文字幕| 欧美日韩色综合| 亚洲精品第一| 久久99精品久久久久久水蜜桃| 国产网站在线免费观看| 伊人免费在线| 国产欧美精品日韩精品| 91色九色蝌蚪| 超级碰碰不卡在线视频| 国产欧美一区二区白浆黑人| 丁香婷婷深情五月亚洲| 黄色小说在线播放| 99精品99久久久久久宅男| 午夜精品久久一牛影视| 黄色网址在线免费| 日韩av在线资源| 国产极品一区| 成人国产精品日本在线| 国产一区日韩一区| 欧美一级特黄aaaaaa在线看片| 亚洲精品成人在线| 免费网站成人| 这里只有精品视频| 国内精品久久久久久久影视简单| 久久久久久国产精品美女| 老**午夜毛片一区二区三区| 国产剧情演绎av| 亚洲欧美日韩一区二区在线 | 色影视在线观看| 国v精品久久久网| 久久久久久久片| 97色伦亚洲国产| 久久精品一区八戒影视| www.亚洲一二| 欧美日韩在线成人| 国产精品欧美风情| 欧美日韩一区二区三区在线看 | 精品无人区一区二区三区竹菊| 成人免费三级在线| 在线黄色网页| 国产二区一区| 欧美日韩免费高清一区色橹橹| 91精品国产一区二区在线观看| 成人久久18免费网站漫画| 国产日韩精品一区二区三区| 午夜激情在线观看| 日韩在线视频导航| 六月丁香综合在线视频| 国产精品97| 一本一道久久综合狠狠老精东影业| 亚洲成人18| 亚洲国产综合人成综合网站| 天堂8中文在线最新版在线| 国产91精品网站| 福利一区福利二区| 国产色99精品9i| 国产盗摄视频在线观看| 亚洲福利视频导航| 日本不卡高清| 多野结衣av一区| 成人在线观看黄| 国产欧美日韩伦理| 另类春色校园亚洲| jizz日韩| 蜜臀视频一区二区三区| 亚洲丰满在线| 成人h视频在线观看播放| 伊人久久综合97精品| 欧美日韩美女一区二区| 成人国产视频在线观看| 亚洲精品人人| 精品国产乱码久久久久久蜜坠欲下| 岛国在线视频网站| 一本大道香蕉久在线播放29 | 日韩欧美成人激情| www.亚洲色图.com| 天堂精品久久久久| 伪装者在线观看完整版免费| 天堂资源在线亚洲视频| 2020久久国产精品| 91成人国产精品| 国产sm精品调教视频网站| 黄网站免费久久| 亚洲免费不卡| 精品久久久久久亚洲精品| 97超碰成人| 一本大道熟女人妻中文字幕在线| www国产精品av| 成人mm视频在线观看| 日韩av一二三四| 蜜臀久久99精品久久久无需会员| 欧美经典三级视频一区二区三区| 2020国产精品小视频| 制服.丝袜.亚洲.中文.综合| 久久se这里有精品| 大桥未久在线播放| 免费的av在线| 成人欧美一区二区三区黑人| 精品国产自在久精品国产| 久久久久国产精品免费免费搜索| 91在线一区| 人妖欧美1区| 四虎国产精品永远| 霍思燕三级露全乳照| 国产乱码精品一区二区三区卡| 91综合免费在线| 久久精品成人一区二区三区蜜臀| 在线不卡免费欧美| 中文字幕不卡在线观看| 樱花草国产18久久久久| 一区二区国产盗摄色噜噜| 日韩亚洲欧美在线| 国产情侣久久| 美女亚洲一区| 在线综合亚洲| 青青草精品视频| 日本美女视频一区二区| 91麻豆蜜桃一区二区三区| 亚洲一线二线三线久久久| 亚洲欧洲成视频免费观看| 日韩精品在线观看一区二区| 久久天天躁狠狠躁夜夜躁2014 | 国产精品一二三四区| 捆绑调教一区二区三区| 国内一区二区在线| 国产精品综合| 国产a久久麻豆| 国产精品国产精品国产专区不片| 亚洲精品老司机| 亚洲国产一区二区三区| 欧美高清在线视频| 91丨九色丨尤物| 99久久婷婷国产精品综合| 久久久久久久综合色一本| 蜜桃久久久久久|