国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

CMU朱俊彥、Adobe新作:512x512圖像推理,A100只用0.11秒

人工智能 新聞
作者之一為 CMU 助理教授朱俊彥,其團(tuán)隊(duì)在 ICCV 2021 會(huì)議上發(fā)表過一項(xiàng)類似的研究:僅僅使用一個(gè)或數(shù)個(gè)手繪草圖,即可以自定義一個(gè)現(xiàn)成的 GAN 模型,進(jìn)而輸出與草圖匹配的圖像。

簡筆素描一鍵變身多風(fēng)格畫作,還能添加額外的描述,這在 CMU、Adobe 聯(lián)合推出的一項(xiàng)研究中實(shí)現(xiàn)了。

作者之一為 CMU 助理教授朱俊彥,其團(tuán)隊(duì)在 ICCV 2021 會(huì)議上發(fā)表過一項(xiàng)類似的研究:僅僅使用一個(gè)或數(shù)個(gè)手繪草圖,即可以自定義一個(gè)現(xiàn)成的 GAN 模型,進(jìn)而輸出與草圖匹配的圖像。

圖片

  • 論文地址:https://arxiv.org/pdf/2403.12036.pdf
  • GitHub 地址:https://github.com/GaParmar/img2img-turbo
  • 試玩地址:https://huggingface.co/spaces/gparmar/img2img-turbo-sketch
  • 論文標(biāo)題:One-Step Image Translation with Text-to-Image Models

效果如何?我們上手試玩了一番,得出的結(jié)論是:可玩性非常強(qiáng)。其中輸出的圖像風(fēng)格多樣化,包括電影風(fēng)、3D 模型、動(dòng)畫、數(shù)字藝術(shù)、攝影風(fēng)、像素藝術(shù)、奇幻畫派、霓虹朋克和漫畫。

圖片

prompt 為「鴨子」。

圖片

prompt 為「一個(gè)草木環(huán)繞的小房子」。

圖片

prompt 為「打籃球的中國男生」。

圖片

prompt 為「肌肉男兔子」。

圖片


圖片

圖片

在這項(xiàng)工作中,研究者對條件擴(kuò)散模型在圖像合成應(yīng)用中存在的問題進(jìn)行了針對性改進(jìn)。這類模型使用戶可以根據(jù)空間條件和文本 prompt 生成圖像,并對場景布局、用戶草圖和人體姿勢進(jìn)行精確控制。

但是問題在于,擴(kuò)散模型的迭代導(dǎo)致推理速度變慢,限制了實(shí)時(shí)應(yīng)用,比如交互式 Sketch2Photo。此外模型訓(xùn)練通常需要大規(guī)模成對數(shù)據(jù)集,給很多應(yīng)用帶來了巨大成本,對其他一些應(yīng)用也不可行。

為了解決條件擴(kuò)散模型存在的問題,研究者引入了一種利用對抗學(xué)習(xí)目標(biāo)來使單步擴(kuò)散模型適應(yīng)新任務(wù)和新領(lǐng)域的通用方法。具體來講,他們將 vanilla 潛在擴(kuò)散模型的各個(gè)模塊整合到擁有小的可訓(xùn)練權(quán)重的單個(gè)端到端生成器網(wǎng)絡(luò),從而增強(qiáng)模型保留輸入圖像結(jié)構(gòu)的能力,同時(shí)減少過擬合。

研究者推出了 CycleGAN-Turbo 模型,在未成對設(shè)置下,該模型可以在各種場景轉(zhuǎn)換任務(wù)中優(yōu)于現(xiàn)有基于 GAN 和擴(kuò)散的方法, 比如晝夜轉(zhuǎn)換、添加或移除霧雪雨等天氣效果。

同時(shí),為了驗(yàn)證自身架構(gòu)的通用性,研究者對成對設(shè)置進(jìn)行實(shí)驗(yàn)。結(jié)果顯示,他們的模型 pix2pix-Turbo 實(shí)現(xiàn)了與 Edge2Image、Sketch2Photo 不相上下的視覺效果,并將推理步驟縮減到了 1 步。

總之,這項(xiàng)工作表明了,一步式預(yù)訓(xùn)練文本到圖像模型可以作為很多下游圖像生成任務(wù)的強(qiáng)大、通用主干。

方法介紹

該研究提出了一種通用方法,即通過對抗學(xué)習(xí)將單步擴(kuò)散模型(例如 SD-Turbo)適配到新的任務(wù)和領(lǐng)域。這樣做既能利用預(yù)訓(xùn)練擴(kuò)散模型的內(nèi)部知識,同時(shí)還能實(shí)現(xiàn)高效的推理(例如,對于 512x512 圖像,在 A6000 上為 0.29 秒,在 A100 上為 0.11 秒)。

此外,單步條件模型 CycleGAN-Turbo 和 pix2pix-Turbo 可以執(zhí)行各種圖像到圖像的轉(zhuǎn)換任務(wù),適用于成對和非成對設(shè)置。CycleGAN-Turbo 超越了現(xiàn)有的基于 GAN 的方法和基于擴(kuò)散的方法,而 pix2pix-Turbo 與最近的研究(如 ControlNet 用于 Sketch2Photo 和 Edge2Image)不相上下,但具有單步推理的優(yōu)勢。

添加條件輸入

為了將文本到圖像模型轉(zhuǎn)換為圖像轉(zhuǎn)換模型,首先要做的是找到一種有效的方法將輸入圖像 x 合并到模型中。

將條件輸入合并到 Diffusion 模型中的一種常用策略是引入額外的適配器分支(adapter branch),如圖 3 所示。

具體來說,該研究初始化第二個(gè)編碼器,并標(biāo)記為條件編碼器(Condition Encoder)。控制編碼器(Control Encoder)接受輸入圖像 x,并通過殘差連接將多個(gè)分辨率的特征映射輸出到預(yù)訓(xùn)練的 Stable Diffusion 模型。該方法在控制擴(kuò)散模型方面取得了顯著成果。

如圖 3 所示,該研究在單步模型中使用兩個(gè)編碼器(U-Net 編碼器和條件編碼器)來處理噪聲圖像和輸入圖像遇到的挑戰(zhàn)。與多步擴(kuò)散模型不同,單步模型中的噪聲圖直接控制生成圖像的布局和姿態(tài),這往往與輸入圖像的結(jié)構(gòu)相矛盾。因此,解碼器接收到兩組代表不同結(jié)構(gòu)的殘差特征,這使得訓(xùn)練過程更加具有挑戰(zhàn)性。

直接條件輸入。圖 3 還說明了預(yù)訓(xùn)練模型生成的圖像結(jié)構(gòu)受到噪聲圖 z 的顯著影響。基于這一見解,該研究建議將條件輸入直接饋送到網(wǎng)絡(luò)。為了讓主干模型適應(yīng)新的條件,該研究向 U-Net 的各個(gè)層添加了幾個(gè) LoRA 權(quán)重(見圖 2)。

保留輸入細(xì)節(jié)

潛在擴(kuò)散模型 (LDMs) 的圖像編碼器通過將輸入圖像的空間分辨率壓縮 8 倍同時(shí)將通道數(shù)從 3 增加到 4 來加速擴(kuò)散模型的訓(xùn)練和推理過程。這種設(shè)計(jì)雖然能加快訓(xùn)練和推理速度,但對于需要保留輸入圖像細(xì)節(jié)的圖像轉(zhuǎn)換任務(wù)來說,可能并不理想。圖 4 展示了這一問題,我們拿一個(gè)白天駕駛的輸入圖像(左)并將其轉(zhuǎn)換為對應(yīng)的夜間駕駛圖像,采用的架構(gòu)不使用跳躍連接(中)。可以觀察到,如文本、街道標(biāo)志和遠(yuǎn)處的汽車等細(xì)粒度的細(xì)節(jié)沒有被保留下來。相比之下,采用了包含跳躍連接的架構(gòu)(右)所得到的轉(zhuǎn)換圖像在保留這些復(fù)雜細(xì)節(jié)方面做得更好。

為了捕捉輸入圖像的細(xì)粒度視覺細(xì)節(jié),該研究在編碼器和解碼器網(wǎng)絡(luò)之間添加了跳躍連接(見圖 2)。具體來說,該研究在編碼器內(nèi)的每個(gè)下采樣塊之后提取四個(gè)中間激活,并通過一個(gè) 1×1 的零卷積層處理它們,然后將它們輸入到解碼器中對應(yīng)的上采樣塊。這種方法確保了在圖像轉(zhuǎn)換過程中復(fù)雜細(xì)節(jié)的保留。

實(shí)驗(yàn)

該研究將 CycleGAN-Turbo 與之前的基于 GAN 的非成對圖像轉(zhuǎn)換方法進(jìn)行了比較。從定性分析來看,如圖 5 和圖 6 顯示,無論是基于 GAN 的方法還是基于擴(kuò)散的方法,都難以在輸出圖像真實(shí)感和保持結(jié)構(gòu)之間達(dá)到平衡。

圖片

圖片

該研究還將 CycleGAN-Turbo 與 CycleGAN 和 CUT 進(jìn)行了比較。表 1 和表 2 展示了在八個(gè)無成對轉(zhuǎn)換任務(wù)上的定量比較結(jié)果。

圖片

CycleGAN 和 CUT 在較簡單的、以對象為中心的數(shù)據(jù)集上,如馬→斑馬(圖 13),展現(xiàn)出有效的性能,實(shí)現(xiàn)了低 FID 和 DINO-Structure 分?jǐn)?shù)。本文方法在 FID 和 DINO-Structure 距離指標(biāo)上略微優(yōu)于這些方法。

圖片

如表 1 和圖 14 所示,在以對象為中心的數(shù)據(jù)集(如馬→斑馬)上,這些方法可以生成逼真的斑馬,但在精確匹配對象姿勢上存在困難。

在駕駛數(shù)據(jù)集上,這些編輯方法的表現(xiàn)明顯更差,原因有三:(1)模型難以生成包含多個(gè)對象的復(fù)雜場景,(2)這些方法(除了 Instruct-pix2pix)需要先將圖像反轉(zhuǎn)為噪聲圖,引入潛在的人為誤差,(3)預(yù)訓(xùn)練模型無法合成類似于駕駛數(shù)據(jù)集捕獲的街景圖像。表 2 和圖 16 顯示,在所有四個(gè)駕駛轉(zhuǎn)換任務(wù)上,這些方法輸出的圖像質(zhì)量較差,并且不遵循輸入圖像的結(jié)構(gòu)。

圖片

圖片

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2009-12-04 14:43:55

Windows7

2023-12-22 09:32:13

引擎模型

2023-03-13 16:11:37

模型文本

2009-09-09 08:51:16

Windows 7雪豹圖標(biāo)

2022-12-27 09:57:41

線程數(shù)CPU

2023-11-27 13:43:00

AI模型

2025-10-22 14:38:25

AI模型計(jì)算機(jī)視覺

2025-06-03 08:51:00

2022-10-10 09:50:55

AI模型

2025-12-10 16:53:16

AI模型分布式

2024-07-08 13:04:01

2010-06-12 09:31:25

Tilera多核服務(wù)器

2023-05-31 08:29:08

數(shù)據(jù)庫CPU類型

2010-06-17 14:11:23

Atom超算

2024-01-10 17:13:42

模型數(shù)據(jù)

2025-01-20 07:30:00

2009-02-09 09:55:07

Windows 7VistaXp

2025-01-16 08:03:44

2021-12-22 10:23:03

AI 元宇宙人工智能

2025-01-06 10:30:00

圖像AI模型
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

色姑娘综合网| 日韩精品免费一区| 欧美成人日韩| 麻豆精品一区| 九九视频精品在线观看| av中文字幕在线播放| 国产午夜精品一区二区三区视频| 午夜av一区二区| av免费观看大全| 亚洲自拍偷拍麻豆| 五月香视频在线观看| 国产亚洲欧美aaaa| 亚洲天堂av资源在线观看| 97超碰国产精品女人人人爽| 久久人体视频| 国产精品爱久久久久久久| 秋霞影视一区二区三区| 国产成人亚洲欧美| 久久久国际精品| 国产精品一区二区三区视频网站| 日韩情涩欧美日韩视频| 香蕉成人app免费看片| 欧美激情欧美激情| 国产福利资源一区| 91成人在线观看喷潮教学| 亚洲精品综合精品自拍| 999久久精品| 中国成人在线视频| 蜜臀av性久久久久蜜臀aⅴ | 成人亚洲综合天堂| 萌白酱国产一区二区| 亚洲视频高清| 91看片淫黄大片91| 日本高清无吗v一区| 日韩免费在线电影| 亚洲图色在线| 日韩欧美亚洲另类制服综合在线| 欧美岛国激情| 成年在线播放小视频| 欧美xxxx做受欧美.88| 国产精品一区二区男女羞羞无遮挡 | 91极品女神在线| 三级亚洲高清视频| 都市激情在线视频| 欧美日韩爱爱视频| 欧美超碰在线| 欧美变态视频| 欧美中文在线观看| 99精品黄色片免费大全| av在线导航| 2024亚洲男人天堂| 国产欧美综合在线观看第十页| 一区二区电影网| 精品日韩一区二区三区| 免费日韩视频| av在线免费网站| 日韩精品国内| 亚洲欧美激情在线视频| 99精品国产一区二区三区不卡| 国产va免费精品观看精品| 少妇av一区二区三区无码| 欧美日本视频在线| 欧美日韩一卡| 激情图片在线观看高清国产| 青青草影院在线观看| 久久国产精彩视频| 中文字幕一区二区三区不卡在线 | 国产日本在线| 成人在线视频国产| 香港成人在线视频| 动漫av一区| 小香蕉视频在线| 欧美人与性动交a欧美精品| 国产日韩欧美亚洲| 亚洲最新色图| 人妖欧美1区| www.av99| 免费99视频| 欧美激情精品久久久久| 亚洲一区二区三区四区五区黄| 精品九九在线| heyzo在线欧美播放| 精品人妻一区二区三区四区在线| 国产精品678| 欧美一区二区视频免费观看| 97se亚洲国产综合自在线不卡| 久久性感美女视频| 性爽视频在线| 亚洲嫩模一区| 亚洲一区 在线播放| 95av在线视频| 欧美尺度大的性做爰视频| 欧美色涩在线第一页| 男女视频一区二区| 西野翔中文久久精品字幕| 久久五月精品| 中文字幕毛片| 亚洲国产精品久久久久婷蜜芽| 99久re热视频这里只有精品6| 欧美另类高清videos| 日韩免费性生活视频播放| 国产欧美一二三区| 99久久九九| 日本妇女一区| 青青草原av在线| yw193.com尤物在线| 黑巨人与欧美精品一区| 成人黄色大片在线免费观看| 日韩一区二区三区视频在线| 久久免费午夜影院| 成人性生交大片| 欧美亚洲专区| 久久成人在线| 99国产精品久久久久久久成人热| 成人午夜在线| 蜜桃视频在线观看播放| 校园春色综合| av免费播放网址| 久久综合久久网| 日韩一区不卡| 久久久久成人精品免费播放动漫| 欧美二区在线播放| 日韩一区二区欧美| 日韩欧美激情在线| 午夜精品123| 五月激情六月综合| 国产精品久久久久久一区二区三区| 欧美日韩伦理| 亚洲电影在线一区二区三区| 精品久久久久久久| japanese色系久久精品| av成人综合| 日韩av片子| 国产日韩欧美一区在线 | 在线亚洲精品| 国产亚洲毛片| 国产一区二区三区四区在线观看| 高清国产一区二区三区| 久久久久久久久久电影| 久久久精品国产99久久精品芒果| 国产亚洲综合性久久久影院| 91色在线porny| 婷婷久久综合九色综合伊人色| 午夜不卡av免费| 中文字幕永久在线不卡| 欧美日韩亚洲综合一区二区三区| 成人黄色av网站在线| 久久久不卡影院| 亚洲国产精品久久人人爱蜜臀| 国产欧美一区二区精品性 | 美女的诞生在线观看高清免费完整版中文| 你懂得网站在线| 在线a人片免费观看视频| 四虎成人免费在线| 日日夜夜精品一区| 成人精品在线| 日本免费在线视频不卡一不卡二| 国产精品v亚洲精品v日韩精品| 久久99国内精品| 欧美曰成人黄网| 欧美日韩美少妇| 成人在线电影在线观看视频| 可以免费看不卡的av网站| 亚洲精品国产精品乱码不99 | 国产一区二区三区在线观看网站 | 在线丝袜欧美日韩制服| 国产成人精品亚洲精品| 亚洲男人天堂九九视频| 色94色欧美sute亚洲线路一ni| 91在线视频播放| 视频一区视频二区中文字幕| 亚洲精选中文字幕| 分分操这里只有精品| 成人免费高清完整版在线观看| 精品国产综合区久久久久久| 欧美另类在线播放| 久久精品在这里| 欧美美女激情18p| 亚洲色图欧美制服丝袜另类第一页| 97av在线影院| 国产精品三级一区二区| 精灵使的剑舞无删减版在线观看| 国外成人福利视频| 精品动漫av| 香蕉av福利精品导航| 国产欧美在线视频| 性欧美极品xxxx欧美一区二区| 羞羞视频在线观看不卡| 欧美一区精品| 欧美亚洲综合久久| 99久久精品无码一区二区毛片 | 亚洲午夜黄色| 婷婷国产v国产偷v亚洲高清| 91深夜福利视频| 国产免费人做人爱午夜视频| 欧洲一区精品| 精品在线播放午夜| 国产成人综合亚洲| 日日噜噜夜夜狠狠视频| 成人情趣视频网站|