国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架

發(fā)布于 2024-4-22 09:59
瀏覽
0收藏

過去幾年里,基于文本來生成圖像的擴散模型得到了飛速發(fā)展,生成能力有了顯著的提升,可以很容易地生成逼真的肖像畫,以及各種天馬行空的奇幻畫作。


近期的相關(guān)研究主要集中在控制模型生成「個性化」的內(nèi)容,即用戶先提供一個最小概念圖像集,然后對預(yù)訓(xùn)練的文本轉(zhuǎn)圖像擴散模型進行增強,從而使模型可以生成包含個性化概念的新場景。


現(xiàn)有的一些工作可以增強用戶對生成過程的控制,并衍生出許多量身定制的應(yīng)用場景;但要同時對多個概念進行個性化處理,并控制圖像生成以準(zhǔn)確遵循給定的文本描述,仍然具有挑戰(zhàn)性。


最近,來自加州大學(xué)伯克利分校、牛津大學(xué)、哈佛大學(xué)、卡內(nèi)基梅隆大學(xué)、香港大學(xué)、加州大學(xué)戴維斯分校的研究人員聯(lián)合發(fā)表了一篇論文,討論了「圖像生成個性化」領(lǐng)域下的兩個關(guān)鍵問題。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)

論文鏈接:??https://arxiv.org/abs/2402.15504??

項目主頁:??https://danielchyeh.github.io/Gen4Gen/??


1. 當(dāng)前的個性化技術(shù)無法可靠地擴展到多個概念,研究人員推測是由于預(yù)訓(xùn)練數(shù)據(jù)集(如 LAION)中復(fù)雜場景和簡單文本描述之間的不匹配造成的。


2. 對于包含多個個性化概念的圖像,缺乏一種全面的衡量標(biāo)準(zhǔn),不僅評估個性化概念的相似程度,還評估圖像中是否包含所有概念,以及圖像是否準(zhǔn)確反映了整體文本描述。


為了解決上述問題,研究人員提出了一種半自動數(shù)據(jù)集創(chuàng)建管道Gen4Gen,利用生成模型將個性化概念與文本描述結(jié)合成復(fù)雜的組合;并且創(chuàng)建了一個可用于多概念個性化任務(wù)的基準(zhǔn)測試數(shù)據(jù)集MyCanvas。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


此外,研究人員還設(shè)計了一個由兩個分?jǐn)?shù)(CP-CLIP 和 TI-CLIP)組成的綜合指標(biāo),用于更好地量化多概念、個性化文本到圖像擴散方法的性能。


我們在 Custom Diffusion 的基礎(chǔ)上提供了一個簡單的基線,其中包含經(jīng)驗性提示策略,供未來的研究人員在MyCanvas上進行評估。


實驗結(jié)果表明,通過改進數(shù)據(jù)質(zhì)量和提示策略,可以顯著提高多概念個性化圖像生成的質(zhì)量,而無需對模型架構(gòu)或訓(xùn)練算法進行任何修改。


結(jié)果也證明,chaining基礎(chǔ)模型可能是生成高質(zhì)量數(shù)據(jù)集的一個有前途的方向,主要面向計算機視覺領(lǐng)域的各種挑戰(zhàn)性任務(wù)。


Gen4Gen:面向多概念個性化的數(shù)據(jù)驅(qū)動方法


給定一組由用戶提供的、多個概念的照片,多概念個性化的目標(biāo)是學(xué)習(xí)每個概念的特征,以便能合成由多個概念組成的、背景和構(gòu)圖各不相同的新圖像。


但隨著要注入圖像的個性化概念數(shù)量的增加,問題的難度也會大大增加。


之前的研究主要集中在優(yōu)化訓(xùn)練策略上,而這篇論文證明了在整個訓(xùn)練過程中提高數(shù)據(jù)質(zhì)量可以提高多概念個性化圖像的生成質(zhì)量。


1. 數(shù)據(jù)集設(shè)計原則


從 LAION 數(shù)據(jù)集中最具美感的子集(LAION-2B-en improved Aesthetics)中,可以清楚地看到圖像的復(fù)雜程度與簡單描述之間的不匹配。


由于該數(shù)據(jù)集主要通過網(wǎng)絡(luò)檢索,因此可能會出現(xiàn)差異:例如,圖像可能存在不準(zhǔn)確的大量文本描述,以及包含多個對象的圖像分辨率較低。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


研究人員從這些差異中汲取靈感,并提供了三個關(guān)鍵的設(shè)計原則:


1)詳細(xì)的文字描述和圖像配對:文本必須與相應(yīng)的圖像對齊,為前景和背景對象提供信息;


2)合理的物體布局和背景生成:為了避免圖像看起來像人工剪切混合圖像(Cut-Mixes),并充分利用 LAION 數(shù)據(jù)集已有的信息,必須確保只有在現(xiàn)實生活中有可能捕捉到物體時,這些物體才會同時出現(xiàn)在一張圖像中,而且它們在圖像中的位置也要合理;


3)高分辨率:確保數(shù)據(jù)集能夠滿足生成高質(zhì)量、多概念個性化圖像的最終目標(biāo)。


2. Gen4Gen管道


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


如上圖所示,Gen4Gen主要包括三個階段:


1)對象關(guān)聯(lián)(object association)和前景分割;


2)LLM 引導(dǎo)的對象組合;


3)背景重繪和圖像重構(gòu)。


3. 數(shù)據(jù)集統(tǒng)計


對于MyCanvas數(shù)據(jù)集,研究人員收集了150個對象(每個對象有一張或多張圖片),并創(chuàng)建了41個可能的組合(composition)和 10,000 多張圖片,然后手動篩選出 2684 張重繪結(jié)果質(zhì)量最好的圖片。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


在該數(shù)據(jù)集中,圖像描述的平均單詞長度為17.7個,大約30%的描述長度超過了20個單詞。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


與之前的基準(zhǔn)(如 DreamBooth 和 Custom Diffusion)相比,新數(shù)據(jù)集涵蓋了更多種類的對象和多概念組合,因此是衡量個性化任務(wù)的更全面的數(shù)據(jù)集。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


4. 提升訓(xùn)練時間的文本提示


除了設(shè)計與數(shù)據(jù)集中的圖像完全一致的提示外,研究人員在訓(xùn)練過程中進一步探索最佳提示設(shè)計。


全局合成token


之前的工作(如DreamBooth)已經(jīng)表明,模型可以學(xué)會將一個新token映射到非常困難的概念上,如莫奈藝術(shù)這樣的抽象風(fēng)格。


研究人員將這一概念應(yīng)用于復(fù)雜的合成:通過引入全局token和每個物體的單獨token,該模型在描述詳細(xì)場景安排方面的能力得到了增強,從而生成的圖像更加逼真、更加連貫


在訓(xùn)練過程中重復(fù)概念token提示


可以注意到,在很多情況下,涉及多個概念的復(fù)雜組合往往會導(dǎo)致一個或兩個概念缺失,可能是由于模型有時會忘記冗長提示中的細(xì)節(jié);所以在訓(xùn)練過程中采用了重復(fù)概念token提示的策略,可以促使模型確保生成的圖像中存在每個指定的概念,從而提高整體對象的持久性和完整性。


結(jié)合背景提示


研究人員觀察到一個問題,即在token特征空間中,背景會無意中與object identity一起學(xué)習(xí)。


為了區(qū)分背景和概念的構(gòu)成,必須確保在訓(xùn)練提示中說明背景,以鼓勵concept tokens只學(xué)習(xí)object identity


5. 個性化組合指標(biāo)(composition metric)


為了克服這一問題,我們從文獻[3, 18]中汲取靈感,提出了兩個指標(biāo)。第一個指標(biāo)是合成個性化 CLIP 分?jǐn)?shù)(CP-CLIP),用于評估合成和個性化的準(zhǔn)確性。第二個指標(biāo)是文本-圖像對齊 CLIP 分?jǐn)?shù)(TI-CLIP),通過評估模型在不同文本背景下的泛化質(zhì)量,作為潛在過擬合的指標(biāo)。


組合個性化CLIP評分(CP-CLIP)


用于評估組合和個性化的準(zhǔn)確率。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


該指標(biāo)主要解決兩個問題:


1)文本中提到的每個個性化概念是否都在圖像生成過程中得到了反映?(組合準(zhǔn)確性)


2)生成的個性化概念是否與其源對應(yīng)概念相似?(忠實度)


文本圖像對齊CLIP評分(TI-CLIP)


通過評估模型在不同文本背景下的泛化質(zhì)量,作為潛在過擬合的指標(biāo)。


為了定量衡量過度擬合的程度,研究人員將TI-CLIP計算為「生成圖像」與「提示詞」之間的 CLIP 分?jǐn)?shù)。


雖然 TI-CLIP 的表述與 CP-CLIP 非常相似(即可以將 TI-CLIP 視為個性化剪輯得分的一種特例,其邊界框為整個圖像,個性化目標(biāo)為文本),但其評估的是模型泛化質(zhì)量的一個正交概念,因此應(yīng)作為一個單獨的指標(biāo)來衡量。


從高層次來看,TI-CLIP 衡量的是整個生成圖像的背景提示(不包括對象),在提高CP-CLIP分?jǐn)?shù)時,其目標(biāo)應(yīng)該是維持 TI-CLIP 的評分,也能表明模型并沒有過度擬合訓(xùn)練集的背景。


評分解釋


在實踐中,研究人員發(fā)現(xiàn)CP-CLIP的理想分?jǐn)?shù)約為0.5,而TI-CLIP的分?jǐn)?shù)應(yīng)保持不變,不會增加。


實驗結(jié)果


定量分析


研究人員使用了 41 個文本提示,每個提示有 6 個樣本,共生成 246 幅圖像。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


很明顯,在使用原始源圖像進行學(xué)習(xí)時,Custom Diffusion的性能比使用 MyCanvas 數(shù)據(jù)集的同類產(chǎn)品降低了 50%。


將我們的提示策略應(yīng)用于自定義擴散后,CP-CLIP 分?jǐn)?shù)進一步提高。


值得注意的是,TI-CLIP 分?jǐn)?shù)(表示背景泛化)在所有方法中都保持一致,可以確保組合準(zhǔn)確率的提高不是因為過擬合。


定性分析


研究人員精心設(shè)計了多個prompt來測試模型在不同于訓(xùn)練場景的新場景中生成概念、將概念與其他已知對象(如獨木舟上的貓、漂浮物上的獅子)組合在一起以及描述概念相對位置(如并排、背景中)的能力。


主要對比了三種設(shè)置下的定性結(jié)果:


1)使用原始源圖像進行自定義擴散;


2)使用MyCanvas(由源圖像組成的數(shù)據(jù)集)進行自定義擴散;


3)提示策略建立在使用MyCanvas進行自定義擴散的基礎(chǔ)之上。


「個性化」圖像生成時代來了!六大頂尖高校聯(lián)手發(fā)布全新Gen4Gen框架-AI.x社區(qū)


可以看到,即使背景描述極具挑戰(zhàn)性,組合策略也能成功分離出潛在空間中相似的物體(如獅子和貓、兩輛拖拉機)。


此外,隨著組合的難度增加(即每一行的下降會增加組合中對象的數(shù)量),提示方法可確保在生成過程中不會遺漏任何概念。


值得注意的是,結(jié)果證明了通過使用 MyCanvas 數(shù)據(jù)集,現(xiàn)有個性化模型(如自定義擴散模型)的生成質(zhì)量可以顯著提高。


本文轉(zhuǎn)自 新智元 ,作者:新智元


原文鏈接:??https://mp.weixin.qq.com/s/t1LYaIGgDIRHdAoB0KpNyQ??

標(biāo)簽
收藏
回復(fù)
舉報
回復(fù)
相關(guān)推薦
69av一区二区三区| 国产精品高潮呻吟久久av无限 | 国产日韩一区二区三区在线| 国产午夜一区二区| 牛牛影视精品影视| 成人午夜电影网站| 久久久com| 色男人天堂综合再现| 久久综合免费视频| 国精产品一区一区三区mba下载| 亚洲图片欧美色图| 黄色一级大片在线观看| 麻豆国产91在线播放| av激情久久| 日韩欧美高清在线播放| 高清欧美一区二区三区| 国产精品无码久久久久| 日韩午夜电影av| 毛片免费在线播放| 伊人开心综合网| 国产色视频在线播放| 成人激情av网| 强开小嫩苞一区二区三区网站| 奶水喷射视频一区| 国产精品视频入口| 91精品国产调教在线观看| 欧美在线视频在线播放完整版免费观看 | 亚洲成色777777女色窝| 毛片在线能看| 午夜av区久久| 三级免费网站| 久久奇米777| 欧美黑人经典片免费观看| 紧缚捆绑精品一区二区| 亚洲免费不卡| 久久黄色级2电影| 欧美激情视频一区二区三区| 欧美黄在线观看| 成人黄色大片在线免费观看| 欧美色图在线播放| 国产精品一区二区电影| 成人嘿咻视频免费看| 国产精品白嫩美女在线观看| 天天操综合520| 国产精品久久77777| 成人在线国产| 成人激情视频在线播放| 欧美99在线视频观看| 成人午夜电影免费在线观看| 亚洲看片免费| 亚洲激情电影在线| 国产成人免费在线视频| 国产白丝袜美女久久久久| 91蝌蚪porny九色| 欧美亚洲日本在线观看| 亚洲欧洲精品一区二区精品久久久| 成人伦理视频网站| 精品国产成人av| av大片在线观看| 在线综合亚洲欧美在线视频| 第一av在线| xvideos亚洲| 久久影院资源站| 国产精品中文字幕在线| 伊人影院久久| 宅男av一区二区三区| 91在线精品一区二区| 日本高清不卡中文字幕| 五月综合激情婷婷六月色窝| 含羞草www国产在线视频| 亚洲欧洲高清在线| 99re91这里只有精品| 成人有码在线视频| 美国十次了思思久久精品导航| 玩弄中年熟妇正在播放| 一区二区三区在线播放| 在线看av的网址| 中文字幕亚洲自拍| 亚洲小说图片| 国产一区二区免费电影| 国产精品一二三四区| 一级黄色特级片| 在线精品视频一区二区三四| 成年美女黄网站色大片不卡| 97视频在线观看免费高清完整版在线观看 | aa免费在线观看| 亚洲图片欧美色图| 亚洲大胆人体大胆做受1| 国产午夜精品一区二区三区| 日韩理论电影中文字幕| 精品国产综合久久| 久久久亚洲欧洲日产国码αv| 在线观看你懂得| 日韩精品免费一线在线观看| 五月国产精品| 亚洲一区二区三区午夜| 自拍偷在线精品自拍偷无码专区| 巨大荫蒂视频欧美大片| 欧美激情精品久久久久久大尺度| 伊人久久亚洲影院| 牛夜精品久久久久久久| 7777精品伊人久久久大香线蕉最新版| 国产日韩欧美中文在线| 国产一区二区三区四区五区在线 | 45www国产精品网站| 在线亚洲国产精品网站| a√天堂在线观看| 欧美日韩精品免费观看视频| 在线视频亚洲欧美中文| 免费一区二区三区在在线视频| 中文字幕二三区不卡| www久久日com| 国产99视频精品免视看7| 狠狠色丁香久久婷婷综合_中| 动漫h在线观看| yellow中文字幕久久| 新67194成人永久网站| 狠狠干婷婷色| 中文字幕久热精品在线视频| 激情综合中文娱乐网| 色琪琪原网站亚洲香蕉| 亚洲欧美在线一区二区| 亚洲黄色精品| 羞羞视频网站在线免费观看| 怡红院精品视频| 亚洲欧美日韩在线观看a三区| 高清日韩av| 久久久91精品国产| 老司机午夜精品| 免费在线黄色网址| 日韩美女中文字幕| 97成人超碰视| 免费成人直播| 五月天色一区| 欧美日韩免费不卡视频一区二区三区 | 久久久久久国产精品免费免费| 亚洲人妖av一区二区| 欧美一级二级视频| 欧美日韩高清免费| 色婷婷综合五月| 九九精品久久| 美女网站视频黄色| 久久亚洲精品一区二区| 国产一区欧美二区| 久草在线新免费首页资源站| 国产91视觉| 日本乱人伦一区| 色婷婷色综合| 91久久影院| 欧美亚洲日本网站| 久久中文娱乐网| 伊人久久精品| 欧美日韩精品在线一区二区 | 成人三级av| 欧美激情高清视频| 久久精品网站免费观看| 亚洲视频自拍| 丰满少妇被猛烈进入高清播放| 中文字幕精品久久| 成人不卡免费av| 亚洲少妇视频| 久久久久亚洲av无码专区喷水| 亚洲精品电影网| 国产在线精品不卡| 香蕉久久免费电影| 无码中文字幕色专区| 久热精品视频在线观看| 国产亚洲女人久久久久毛片| 欧美1区二区| 日本h片在线看| 不卡一区二区三区四区五区| 欧美性videosxxxxx| 久久福利影视| 电影在线观看一区| 日本黄色片一级片| xxxxxxxxx欧美| 国产精品蜜臀在线观看| 亚洲人和日本人hd| 尤物免费看在线视频| 亚洲va久久久噜噜噜久久天堂| 日本道色综合久久| 久久国产精品久久w女人spa| 久久五月精品中文字幕| 久久久亚洲国产精品| 欧美精品aaa| 黄色成人在线免费| 久久一本综合频道| 日韩一级特黄| 免费播放av| 乱色588欧美| 亚洲热线99精品视频| 中文字幕欧美国产| 日本电影一区二区| 岛国成人毛片| 久久精品视频16| 日韩免费不卡av| 欧美高清精品3d| 99久久精品免费看| 三级电影一区| 一区二区三区短视频|