国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

用GPT-4實現(xiàn)可控文本圖像生成,UC伯克利&微軟提出新框架Control-GPT

人工智能 新聞
擴散模型雖好,但如何保證生成的圖像準確高質(zhì)量?GPT-4或許能幫上忙。

文本到圖像生成領域近兩年取得了很大的突破,從 GAN 到 Stable Diffusion,圖像生成的速度越來越快,生成效果越來越好。然而,AI 模型生成的圖像在細節(jié)上還有很多瑕疵,并且使用自然語言指定對象的確切位置、大小或形狀存在一定的困難。為了生成精準、高質(zhì)量的圖像,現(xiàn)有方法通常依賴于廣泛的提 prompt 工程或手動創(chuàng)建圖像草圖。這些方法需要大量的人工工作,因此非常低效。

最近,來自加州大學伯克利分校(UC 伯克利)和微軟研究院的研究者從編程的角度思考了這個問題。當前,用戶能夠使用大型語言模型較好地控制代碼生成,這讓該研究看到了編寫程序來控制生成圖像細節(jié)的可能,包括物體的形狀、大小、位置等等。基于此,該研究提出利用大型語言模型(LLM)生成代碼的功能實現(xiàn)可控型文本到圖像生成。

圖片

論文地址:https://arxiv.org/pdf/2305.18583.pdf

該研究提出了一個簡單而有效的框架 Control-GPT,它利用 LLM 的強大功能根據(jù)文本 prompt 生成草圖。Control-GPT 的工作原理是首先使用 GPT-4 生成 TikZ 代碼形式的草圖。如下圖 1 (c) 所示,程序草圖(programmatic sketch)是按照準確的文本說明繪制的,隨后這些草圖被輸入 Control-GPT。Control-GPT 是 Stable Diffusion 的一種變體,它能接受額外的輸入,例如參考圖像、分割圖等等。這些草圖會充當擴散模型的參考點,使擴散模型能夠更好地理解空間關系和特殊概念,而不是僅僅依賴于文本 prompt。這種方法使得 prompt 工程和草圖創(chuàng)建過程不再需要人為干預,并提高了擴散模型的可控性。

圖片

我們來看一下 Control-GPT 方法的具體細節(jié)。

方法

對圖像生成來說,訓練過程的一個較大挑戰(zhàn)是缺乏包含對齊文本和圖像的數(shù)據(jù)集。為了解決這個難題,該研究將現(xiàn)有實例分割數(shù)據(jù)集(例如 COCO 和 LVIS)中的實例掩碼轉換為多邊形的表示形式,這與 GPT-4 生成的草圖類似。

然后,該研究構建了一個包含圖像、文本描述和多邊形草圖的三元數(shù)據(jù)集,并微調(diào)了 ControlNet。該研究發(fā)現(xiàn)這種方法有助于更好地理解 GPT 生成的草圖,并且可以幫助模型更好地遵循文本 prompt 指令。

ControlNet 是擴散模型的一種變體,它需要額外的輸入條件。該研究使用 ControlNet 作為基礎圖像生成模型,并通過編程草圖和 grounding token 的路徑對其進行擴展。

框架

如下圖 2 所示,在 Control-GPT 中,首先 GPT-4 會根據(jù)文本描述生成 TikZ 代碼形式的草圖,并輸出圖像中物體的位置。然后該研究用 LATEX 編譯 TikZ 代碼,將草圖轉換為圖像格式,再將編程草圖、文本描述和物體位置的 grounding token 提供給經(jīng)過調(diào)優(yōu)的 ControlNet 模型,最終生成符合條件的圖像。

圖片

使用 GPT-4 生成的草圖訓練 ControlNet 是必要的,因為預訓練的 ControlNet 不理解生成的草圖,不能將其轉換為現(xiàn)實圖像。為了 prompt GPT-4,該研究要求用戶遵循如下的 prompt 樣本,以讓 GPT-4 請求 TikZ 代碼片段的結構化輸出,以及相關物體的名稱和位置。然后,該研究使用 GPT-4 的輸出來編譯草圖圖像并獲得 grounding token。

LLM 繪制草圖的準確性如何

Control-GPT 的精度取決于 LLM 生成草圖時的準確性和可控性。因此,該研究對 LLM 在草圖生成方面的性能進行了基準測試。實驗結果表明 GPT 系列模型在草圖生成方面明顯優(yōu)于 LLaMa 等開源模型,并且 GPT-4 在遵循文本指令方面表現(xiàn)出驚人的高準確性(約 97%)。

該研究對 Control-GPT 和一些經(jīng)典模型的生成結果進行了人工評估,結果表明當圖像中包含兩個不相關的罕見物體組合時,一些模型的生成效果比較差,而 Control-GPT 的生成結果相對較好,如下表 2 所示:

圖片

查詢 LLMs,生成一個 TikZ 代碼片段來描述給定的文本,進而檢查 LLMs 的性能。如下表 1 所示,GPT-series 模型的大多數(shù)代碼片段都可以編譯為有效的草圖,而 LLaMA 和 Alpaca 的輸出要么是空的,要么不可運行。在 GPT-series 模型中,最新的 GPT-4 在 95 個查詢中只有 3 次失敗,這些查詢成功地生成了有效草圖,在遵循文本指令方面的成功率大約有 97%。ChatGPT 是 GPT-3.5 的 RLHF 微調(diào)版本,其性能明顯低于原始 GPT-3.5。在調(diào)優(yōu)過程中,聊天能力和代碼生成之間可能存在著權衡。

圖片

在下圖 4 中,研究者提供了一個來自 GPT 系列模型的可視化草圖例子。雖然生成的草圖不如照片那樣逼真,但它們往往能捕捉到語義,并正確推理出物體的空間關系。生成的草圖經(jīng)常出人意料地通過簡單的代碼片斷來正確處理物體形狀。

下圖最后一行展示了 GPT-4 的一個失敗案例,即模型無法生成物體形狀,而 GPT-3.5 卻能給出一個正確的草圖。GPT-4 在草圖生成方面的高精度帶來的啟發(fā)是:可以使用它來提高圖像生成模型的可控性。

實驗

基于 Visor 數(shù)據(jù)集,研究者對 Control-GPT 進行了一系列實驗設置的評估,測試其在空間關系、物體位置和大小方面的可控性。他們還將評估擴展到多個物體和分布外的 prompt。廣泛的實驗表明,Control-GPT 可以大大提升擴散模型的可控性。

下表 3 中列出了定量評估結果??梢钥吹?,Control-GPT 模型可以在給定的一些規(guī)格下更好地控制物體的大小和位置。與幾乎無法控制物體位置和尺寸的 Stable Diffusion 模型(SD-v1.5)相比,Control-GPT 將總體精度從 0% 提高到 14.18%。與現(xiàn)成的 ControlNet 相比,Control-GPT 在所有指標上也取得了更好的表現(xiàn),獲得了從 8.46% 到 4.18% 的整體改善。這些結果展示了本文的 LLM 集成框架在更細化和精確控制圖像生成過程方面的潛力。

圖片

視覺化。下圖 6 展示了定性評估結果,可以看到,ControlGPT 可以按照物體位置和尺寸的規(guī)范繪制物體。相比之下,ControlNet 也能遵循,但卻很難生成正確的物體,而 Stable Diffusion 則無法遵循規(guī)范。

圖片

對空間關系的消融實驗。研究者還探討了模型是否對不同類型的空間關系(如左 / 右 / 上 / 下)有偏好,作為空間關系基準分析的一部分。從下表 4 中可以看出,Control-GPT 在 Visor Score 和物體準確性方面一直比所有的基線模型工作得更好。

圖片

多個物體之間的關系。研究者對 Control-GPT 生成多個物體的能力進行了進一步的評估,這些物體的空間關系由 prompt 指定。下圖 7 展示了一些例子,Control-GPT 能理解不同物體之間的空間關系,并在 GPT-4 的幫助下將它們放入布局中,表現(xiàn)出了更好的性能。

圖片

可控性與圖像逼真度。通常,在生成逼真圖像與遵循精確布局之間往往存在著妥協(xié),特別是對于分布外的文字 prompt。如下圖 8 所示,(a)是一個例子,生成的圖像完全遵循布局,但這導致了圖像中的一些偽影;而在(b)中,照片往往看起來很逼真,但沒有很好地遵循草圖。


圖片

更多研究細節(jié),可參考原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-11-26 13:40:00

2024-03-25 08:30:00

AI數(shù)據(jù)

2024-04-07 00:45:00

開源模型

2023-05-16 13:32:23

模型排行

2023-06-08 11:27:10

模型AI

2023-07-15 23:54:57

GPT-4AI谷歌

2024-11-29 09:18:01

2025-01-22 15:21:00

2024-12-02 08:20:00

2023-08-14 08:04:13

2023-08-14 08:37:54

2023-08-15 10:33:06

微軟必應人工智能

2023-06-19 08:19:50

2025-05-15 09:10:00

2023-12-26 08:17:23

微軟GPT-4

2023-11-14 07:47:42

IGN擴散模型

2025-04-16 09:35:03

2018-10-09 14:00:41

SQL深度學習神經(jīng)網(wǎng)絡

2025-05-30 07:40:56

2023-12-04 13:52:00

模型數(shù)據(jù)
點贊
收藏

51CTO技術棧公眾號

99久久99| 欧洲免费在线视频| caoporn-草棚在线视频最| 精品国产亚洲一区二区在线观看| 亚洲精品老司机| 精品日韩电影| 久久亚洲黄色| 亚洲跨种族黑人xxx| 三级av在线播放| 国产日韩av一区| 日韩欧美一区二区在线观看 | 91精品婷婷国产综合久久竹菊| 成人毛片视频网站| 香蕉久久国产| 欧美日韩一区二区不卡| www.色偷偷.com| 91久久精品无嫩草影院| 欧美一区二区精品久久911| 日本xxxx高清色视频| 91麻豆国产在线观看| 亚洲国内在线| 亚洲理论在线| 日韩视频国产视频| 亚洲精蜜桃久在线| 国产高清欧美| 日韩av不卡在线| 一区二区三区国产好| 在线成人激情黄色| 在线观看免费黄网站| 精品在线免费视频| 久久大片网站| 影院欧美亚洲| 99一区二区| 国产精品x453.com| 日本精品在线视频| 国产精品久久久久久久久久白浆| 国产色综合一区| 国产黄色激情视频| 精品一区二区三区免费毛片爱| 欧美日本韩国一区二区三区| 久久久久国产| 亚洲va电影大全| 久久精品播放| 亚洲国产福利在线| 青青青在线播放| 粉嫩av一区二区三区在线播放 | 乱熟女高潮一区二区在线| 性欧美videohd高精| 日韩欧美精品三级| 国产又黄又大又粗视频| 国产成人精品影院| 欧美亚洲黄色片| 成人手机电影网| 日本在线观看a| 久久久久久久精| 午夜激情av在线| 中文字幕日韩av资源站| 国产一区免费视频| 粉嫩91精品久久久久久久99蜜桃| 亚洲美女视频网| 日本在线视频一区二区| 亚洲码国产岛国毛片在线| 超级污的网站| 五月天久久比比资源色| 亚洲精品视频导航| 男男电影完整版在线观看| 亚洲一区免费在线观看| 在线一级观看| 精品视频在线免费看| 国产黄a三级三级三级av在线看 | 全色精品综合影院| 欧美性欧美巨大黑白大战| 久久艹国产精品| 久久久久国产精品麻豆| 嫩草影院在线观看网站成人| 午夜国产不卡在线观看视频| 免费大片在线观看www| 亚洲欧洲偷拍精品| 老司机aⅴ在线精品导航| 亚洲一区二区三区香蕉| 久久国产精品露脸对白| 伊人国产在线视频| 在线观看中文字幕不卡| 在线观看欧美日韩电影| 国产无遮挡裸体视频在线观看| a天堂资源在线观看| 91视频xxxx| 欧美3p视频在线观看| 亚洲欧洲高清在线| blacked蜜桃精品一区| 欧美久久久久久久| 亚洲第一精品电影| 精品在线视频一区二区| 国产在线精品一区二区三区不卡 | 亚洲女性喷水在线观看一区| 国产精品日韩在线观看| 国产区视频在线观看| 亚洲色图欧洲色图| 男女裸体影院高潮| 亚洲美女区一区| 午夜伦理大片视频在线观看| 中文国产成人精品| 欧美阿v一级看视频| 国产99久久精品一区二区 夜夜躁日日躁| 欧美黄色一级视频| 精品丰满人妻无套内射| 午夜精品久久久久久久 | 国产91色在线| 国产精品久久久久久久免费软件| 中文字幕中文字幕99| 亚洲欧洲综合另类| 97人人爽人人澡人人精品| 欧美一区二区三区图| 日av在线不卡| 99re6热在线精品视频播放| 亚洲欧美日韩另类| 午夜精品影院| www.com黄色片| 亚洲女人天堂网| 亚洲人体偷拍| 香港三级经典全部种子下载| 色99之美女主播在线视频| 美女尤物在线视频| 日本国产一区二区三区| 国产裸体歌舞团一区二区| 国产中文在线视频| 国产91色在线免费| 国产区在线观看成人精品 | 性欧美激情精品| 激情亚洲综合在线| 成人h视频在线观看播放| 国产成+人+综合+亚洲欧洲| 精品成人在线观看| 国产乱人伦偷精品视频免下载 | 国产专区欧美精品| 99久久这里有精品| www.成年人视频| 久久美女艺术照精彩视频福利播放| 久操视频在线播放| 成人福利网站在线观看| 国产精品免费久久久久| 日本在线成人一区二区| 午夜精品一区二区三区电影天堂| 国产精品一区免费在线| 影音先锋成人资源网站| 成人高清视频免费观看| 97中文字幕在线| 欧美日韩高清不卡| 亚洲成av人片一区二区密柚| 国产男小鲜肉同志免费| 萌白酱国产一区二区| 成人一区二区视频| 欧美另类老肥妇| 在线综合视频网站| 亚洲国产中文字幕久久网| 久久高清国产| 青青草影院在线观看| 欧美一区在线视频| 日韩图片一区| 成人精品视频在线播放| 亚洲另类图片色| 韩国三级在线一区| 91破解版在线观看| 欧美日韩亚洲国产成人| 亚洲男人天堂网| 国产aⅴ综合色| 久久婷婷五月综合色丁香| 精品国产一区二区三区性色av| 久久久久综合| 亚洲色图图片网| 欧美性xxxxx极品| 色喇叭免费久久综合网| 操操操综合网| 亚洲一区二区三区xxx视频| 亚洲午夜激情网站| 日韩精品免费| 国产系列在线观看| 精品国产一区二区三区四区精华| 538prom精品视频线放| 可以免费看不卡的av网站| 国产黄色大片在线观看| 国产 欧美 日本| 欧美xxxx14xxxxx性爽| 亚洲特黄一级片| 亚州av乱码久久精品蜜桃| 2017亚洲天堂1024| 一区二区不卡视频| 亚洲摸摸操操av| 国产毛片一区二区三区 | 亚洲一区二区三区无吗| 亚洲一区免费看| 在线成人中文字幕| 久久久久国产精品麻豆ai换脸 | 欧美极品少妇xxxxⅹ喷水| 国产日韩精品视频一区| 欧美极品中文字幕| 久久天天东北熟女毛茸茸| 欧美男插女视频| 亚洲主播在线观看| 亚洲在线网站|