国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

人工智能 新聞
本文詳細(xì)解讀了 Imagen 的工作原理,分析并理解其高級(jí)組件以及它們之間的關(guān)聯(lián)。

近年來,多模態(tài)學(xué)習(xí)受到重視,特別是文本 - 圖像合成和圖像 - 文本對(duì)比學(xué)習(xí)兩個(gè)方向。一些 AI 模型因在創(chuàng)意圖像生成、編輯方面的應(yīng)用引起了公眾的廣泛關(guān)注,例如 OpenAI 先后推出的文本圖像模型 DALL?E 和 DALL-E 2,以及英偉達(dá)的 GauGAN 和 GauGAN2。

谷歌也不甘落后,在 5 月底發(fā)布了自己的文本到圖像模型 Imagen,看起來進(jìn)一步拓展了字幕條件(caption-conditional)圖像生成的邊界。

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

僅僅給出一個(gè)場景的描述,Imagen 就能生成高質(zhì)量、高分辨率的圖像,無論這種場景在現(xiàn)實(shí)世界中是否合乎邏輯。下圖為 Imagen 文本生成圖像的幾個(gè)示例,在圖像下方顯示出了相應(yīng)的字幕。

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

這些令人印象深刻的生成圖像不禁讓人想了解:Imagen 到底是如何工作的呢?

近期,開發(fā)者講師 Ryan O'Connor 在 AssemblyAI 博客撰寫了一篇長文《How Imagen Actually Works》,詳細(xì)解讀了 Imagen 的工作原理,對(duì) Imagen 進(jìn)行了概覽介紹,分析并理解其高級(jí)組件以及它們之間的關(guān)聯(lián)。

Imagen 工作原理概覽

在這部分,作者展示了 Imagen 的整體架構(gòu),并對(duì)其它的工作原理做了高級(jí)解讀;然后依次更透徹地剖析了 Imagen 的每個(gè)組件。如下動(dòng)圖為 Imagen 的工作流程。

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

首先,將字幕輸入到文本編碼器。該編碼器將文本字幕轉(zhuǎn)換成數(shù)值表示,后者將語義信息封裝在文本中。Imagen 中的文本編碼器是一個(gè) Transformer 編碼器,其確保文本編碼能夠理解字幕中的單詞如何彼此關(guān)聯(lián),這里使用自注意力方法。

如果 Imagen 只關(guān)注單個(gè)單詞而不是它們之間的關(guān)聯(lián),雖然可以獲得能夠捕獲字幕各個(gè)元素的高質(zhì)量圖像,但描述這些圖像時(shí)無法以恰當(dāng)?shù)姆绞椒从匙帜徽Z義。如下圖示例所示,如果不考慮單詞之間的關(guān)聯(lián),就會(huì)產(chǎn)生截然不同的生成效果。

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

雖然文本編碼器為 Imagen 的字幕輸入生成了有用的表示,但仍需要設(shè)計(jì)一種方法生成使用這一表示的圖像,也即圖像生成器。為此,Imagen 使用了擴(kuò)散模型,它是一種生成模型,近年來得益于其在多項(xiàng)任務(wù)上的 SOTA 性能而廣受歡迎。

擴(kuò)散模型通過添加噪聲來破壞訓(xùn)練數(shù)據(jù)以實(shí)現(xiàn)訓(xùn)練,然后通過反轉(zhuǎn)這個(gè)噪聲過程來學(xué)習(xí)恢復(fù)數(shù)據(jù)。給定輸入圖像,擴(kuò)散模型將在一系列時(shí)間步中迭代地利用高斯噪聲破壞圖像,最終留下高斯噪聲或電視噪音靜態(tài)(TV static)。下圖為擴(kuò)散模型的迭代噪聲過程:

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

然后,擴(kuò)散模型將向后 work,學(xué)習(xí)如何在每個(gè)時(shí)間步上隔離和消除噪聲,抵消剛剛發(fā)生的破壞過程。訓(xùn)練完成后,模型可以一分為二。這樣可以從隨機(jī)采樣高斯噪聲開始,使用擴(kuò)散模型逐漸去噪以生成圖像,具體如下圖所示:

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

總之,經(jīng)過訓(xùn)練的擴(kuò)散模型從高斯噪聲開始,然后迭代地生成與訓(xùn)練圖像類似的圖像。很明顯的是,無法控制圖像的實(shí)際輸出,僅僅是將高斯噪聲輸入到模型中,并且它會(huì)輸出一張看起來屬于訓(xùn)練數(shù)據(jù)集的隨機(jī)圖像。

但是,目標(biāo)是創(chuàng)建能夠?qū)⑤斎氲?Imagen 的字幕的語義信息封裝起來的圖像,因此需要一種將字幕合并到擴(kuò)散過程中的方法。如何做到這一點(diǎn)呢?

上文提到文本編碼器產(chǎn)生了有代表性的字幕編碼,這種編碼實(shí)際上是向量序列。為了將這一編碼信息注入到擴(kuò)散模型中,這些向量被聚合在一起,并在它們的基礎(chǔ)上調(diào)整擴(kuò)散模型。通過調(diào)整這一向量,擴(kuò)散模型學(xué)習(xí)如何調(diào)整其去噪過程以生成與字幕匹配良好的圖像。過程可視化圖如下所示:

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

由于圖像生成器或基礎(chǔ)模型輸出一個(gè)小的 64x64 圖像,為了將這一模型上采樣到最終的 1024x1024 版本,使用超分辨率模型智能地對(duì)圖像進(jìn)行上采樣

對(duì)于超分辨率模型,Imagen 再次使用了擴(kuò)散模型。整體流程與基礎(chǔ)模型基本相同,除了僅僅基于字幕編碼調(diào)整外,還以正在上采樣的更小圖像來調(diào)整。整個(gè)過程的可視化圖如下所示:

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

這個(gè)超分辨率模型的輸出實(shí)際上并不是最終輸出,而是一個(gè)中等大小的圖像。為了將該圖像放大到最終的 1024x1024 分辨率,又使用了另一個(gè)超分辨率模型。兩個(gè)超分辨率架構(gòu)大致相同,因此不再贅述。而第二個(gè)超分辨率模型的輸出才是 Imagen 的最終輸出。

為什么 Imagen 比 DALL-E 2 更好?

確切地回答為什么 Imagen 比 DALL-E 2 更好是困難的。然而,性能差距中不可忽視的一部分源于字幕以及提示差異。DALL-E 2 使用對(duì)比目標(biāo)來確定文本編碼與圖像(本質(zhì)上是 CLIP)的相關(guān)程度。文本和圖像編碼器調(diào)整它們的參數(shù),使得相似的字幕 - 圖像對(duì)的余弦相似度最大化,而不同的字幕 - 圖像對(duì)的余弦相似度最小化。

性能差距的一個(gè)顯著部分源于 Imagen 的文本編碼器比 DALL-E 2 的文本編碼器大得多,并且接受了更多數(shù)據(jù)的訓(xùn)練。作為這一假設(shè)的證據(jù),我們可以在文本編碼器擴(kuò)展時(shí)檢查 Imagen 的性能。下面為 Imagen 性能的帕累托曲線:

擴(kuò)散+超分辨率模型強(qiáng)強(qiáng)聯(lián)合,谷歌圖像生成器Imagen背后的技術(shù)

放大文本編碼器的效果高得驚人,而放大 U-Net 的效果卻低得驚人。這一結(jié)果表明,相對(duì)簡單的擴(kuò)散模型只要以強(qiáng)大的編碼為條件,就可以產(chǎn)生高質(zhì)量的結(jié)果。

鑒于 T5 文本編碼器比 CLIP 文本編碼器大得多,再加上自然語言訓(xùn)練數(shù)據(jù)必然比圖像 - 字幕對(duì)更豐富這一事實(shí),大部分性能差距可能歸因于這種差異。

除此以外,作者還列出了 Imagen 的幾個(gè)關(guān)鍵要點(diǎn),包括以下內(nèi)容:

  • 擴(kuò)展文本編碼器是非常有效的;
  • 擴(kuò)展文本編碼器比擴(kuò)展 U-Net 大小更重要;
  • 動(dòng)態(tài)閾值至關(guān)重要;
  • 噪聲條件增強(qiáng)在超分辨率模型中至關(guān)重要;
  • 將交叉注意用于文本條件反射至關(guān)重要;
  • 高效的 U-Net 至關(guān)重要。

這些見解為正在研究擴(kuò)散模型的研究人員提供了有價(jià)值的方向,而不是只在文本到圖像的子領(lǐng)域有用。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2018-07-12 10:08:31

圖像超分辨率重建技術(shù)原理

2017-04-10 09:17:08

神經(jīng)網(wǎng)絡(luò)分辨率像素遞歸

2022-01-17 17:01:23

深度學(xué)習(xí)圖像人工智能

2023-12-07 10:22:26

人工圖像生成器Meta圖像生成模型

2021-01-20 11:14:47

人工智能算法技術(shù)

2024-04-08 12:18:57

訓(xùn)練AI

2021-02-24 09:30:44

人工智能PULSE超分辨率算法

2020-09-08 12:58:48

人工智能機(jī)器學(xué)習(xí)技術(shù)

2021-06-02 10:01:20

開源技術(shù) 軟件

2023-05-04 16:24:10

人工智能圖像生成器

2013-03-11 13:48:24

投影

2021-09-10 16:24:00

框架AI開發(fā)

2017-11-10 11:02:36

2024-07-05 10:41:30

目標(biāo)檢測算法

2022-10-08 09:49:14

谷歌模型

2025-03-03 08:36:24

2025-09-17 09:43:26

2023-03-06 10:29:37

人工智能威脅

2023-12-04 13:23:00

數(shù)據(jù)訓(xùn)練

2022-04-11 14:21:49

模型視頻AI
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

欧美巨猛xxxx猛交黑人97人| 成人国产在线看| 成人超碰在线| 亚洲精品水蜜桃| 一二三四视频社区在线| 久久aⅴ乱码一区二区三区| 国产综合色香蕉精品| 在线日韩网站| 国产精品99免视看9| 欧美91在线| 久久久久久com| 欧美激情精品| xvideos国产精品| 在线观看欧美日韩电影| 亚洲精品在线不卡| 亚洲风情在线资源| 亚洲精品97久久| 黑人巨大精品| 中文字幕视频在线免费欧美日韩综合在线看 | 国产无遮挡裸体视频在线观看| 7777精品久久久大香线蕉| 日本亚洲一区| 在线日韩一区二区| 番号集在线观看| 欧美一区二区视频在线观看| 久久精品视频观看| 欧美成人一区二区三区片免费| 手机在线免费看av| 亚洲人永久免费| 精品91久久| 九九久久国产精品| 亚洲丝袜美腿一区| 国产精品久久久久不卡| 亚洲91精品| 久久99精品久久久久久久久久| 久久精品国语| 真人抽搐一进一出视频| 亚洲国产高清aⅴ视频| 福利在线国产| 欧美一区二区在线免费播放| 蜜臀国产一区| 性欧美长视频免费观看不卡| 99精品电影| 日本一区视频在线观看| 成人一级片网址| 嫩草影院永久入口| 欧美日韩国产高清一区二区三区| 欧美6一10sex性hd| 欧美插天视频在线播放| 99久久www免费| 日韩精品极品视频在线观看免费| 国产精品99久久久| 成人免费观看在线网址| 欧美日韩加勒比精品一区| 97caopor国产在线视频| 久久成年人免费电影| 久久综合av| 视频一区三区| 国产亚洲精品资源在线26u| 中文字幕不卡| 日韩高清人体午夜| 欧美三级电影在线| 欧美极品jizzhd欧美| 91小视频免费观看| 国产九九在线| 久久国产精品亚洲| 在线观看日韩av电影| www.九色.com| 五月天久久比比资源色| 周于希免费高清在线观看| 日本精品一区二区三区在线| 销魂美女一区二区三区视频在线| 成人黄色一区二区| 日韩一本二本av| 九九热精品视频在线观看| 在线观看日韩羞羞视频| 亚洲成年人影院| 成人国产精品一区二区免费麻豆| 亚洲xxxx做受欧美| 91美女福利视频| av网站免费在线观看| 欧美性在线观看| 狠狠色综合色综合网络| 天堂成人在线| 国语对白做受69| 紧缚捆绑精品一区二区| 色网视频在线| 色中色综合影院手机版在线观看| 日韩av中文在线观看| 伊人国产在线看一| 午夜精品久久久99热福利| 久久电影国产免费久久电影| 日韩a在线观看| 97视频com| 成人v精品蜜桃久久一区| 国产日产一区二区| 欧洲一区二区视频| av一二三不卡影片| 亚洲七七久久综合桃花剧情介绍| 国产精品国产三级国产aⅴ9色| 国产一区二区你懂的| 国产精品入口久久| 可以免费看的黄色网址| 国产精品麻豆网站| 丝袜美女在线观看| 久久精品国产亚洲精品2020| 亚洲精品裸体| 在线观看免费国产小视频| 日韩av在线免费看| 国产精品久久久免费| 在线观影网站| 中文字幕久久一区| 亚洲素人一区二区| 国产丝袜在线播放| 久久精品夜夜夜夜夜久久| 悠悠资源网久久精品| 国产日本在线播放| 精品国产91乱码一区二区三区 | 国产成人鲁色资源国产91色综| av免费在线观看网址| 国产精品久久久久久超碰| 久久精品人人做人人爽97| 日韩一级二级| 久久精品.com| 欧美精品激情视频| 国产精品女主播av| 国产精品资源在线看| 成久久久网站| 国产伊人精品| 国内精品在线播放| 日韩高清不卡一区二区| 色图在线观看| 国模一区二区三区私拍视频| 亚洲美女在线国产| 精品国产欧美日韩一区二区三区| 精品电影在线| 春暖花开成人亚洲区| 国产福利在线| seseavlu视频在线| 3d玉蒲团在线观看| 黄色综合网址| 久久久加勒比| 黄色污网站在线观看| 久草福利资源在线视频| 性chinese极品按摩| 黄色aaa级片| 国产又黄又爽免费视频| 日韩亚洲在线视频| 男女午夜激情视频| 欧美欧美一区二区| 亚洲在线免费看| 风间由美一区二区三区| 成人乱色短篇合集| 国产精品视频免费在线观看| 久久久欧美一区二区| xvideos亚洲人网站| 日韩av电影手机在线观看| 国产精品一区二区三区成人| 久久爱av电影| αv一区二区三区| 日本视频一区二区不卡| 久久久99国产精品免费| 青青草成人激情在线| 国产wwwxx| 国产乱码在线| 国产精品一区hongkong| 国产黄在线看| 久草在线资源视频在线观看| 无需播放器的av| 免费看黄色一级大片| 在线成人动漫| eeuss鲁一区二区三区| 在线中文视频| 国外av网站| 污网站在线观看视频| 青青青草视频在线| 亚洲一区二区电影| 99精品美女| 国产一区二区三区久久悠悠色av| 99久久伊人网影院| 7777精品伊人久久久大香线蕉最新版| 久久久久国产一区二区三区| 97在线资源站| 每日在线观看av| 成人性生活视频免费看| 最新国产在线视频| 老司机午夜在线| 精品国内产的精品视频在线观看| 91浏览器在线视频| 欧美gayvideo| 1024在线看片你懂得| 成人黄色免费电影| 久久99国产精品99久久| 欧美另类高清videos| 欧美日韩一级片在线观看| 波波电影院一区二区三区| 一区二区在线| 国产日韩中文在线中文字幕| 秋霞午夜理伦电影在线观看| 欧美婷婷精品激情|