国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

無懼圖像中的文字,TextDiffuser提供更高質量文本渲染

人工智能 新聞
本文提出了 TextDiffuser 模型,該模型包含兩個階段,第一階段生成 Layout,第二階段生成圖像。

近幾年來,Text-to-Image 領域取得了巨大的進展,特別是在 AIGC(Artificial Intelligence Generated Content)的時代。隨著 DALL-E 模型的興起,學術界涌現出越來越多的 Text-to-Image 模型,例如 Imagen,Stable Diffusion,ControlNet 等模型。然而,盡管 Text-to-Image 領域發展迅速,現有模型在穩定地生成包含文本的圖像方面仍面臨一些挑戰。

嘗試過現有 sota 文生圖模型可以發現,模型生成的文字部分基本上是不可讀的,類似于亂碼,這非常影響圖像的整體美觀度。

圖片

現有 sota 文生圖模型生成的文本信息可讀性較差

經過調研,學術界在這方面的研究較少。事實上,包含文本的圖像在日常生活中十分常見,例如海報、書籍封面和路牌等。如果 AI 能夠有效地生成這類圖像,將有助于輔助設計師的工作,激發設計靈感,減輕設計負擔。除此之外,用戶可能只希望修改文生圖模型結果的文字部分,保留其他非文本區域的結果。

因此,研究者希望設計一個全面的模型,既能直接由用戶提供的 prompt 生成圖像,也能接收用戶給定的圖像修改其中的文本。目前該研究工作已被NeurIPS 2023接收。

圖片

  • 論文地址:https://arxiv.org/abs/2305.10855
  • 項目地址:https://jingyechen.github.io/textdiffuser/
  • 代碼地址:https://github.com/microsoft/unilm/tree/master/textdiffuser
  • Demo地址:https://huggingface.co/spaces/microsoft/TextDiffuser

TextDiffuser 的三個功能

本文提出了 TextDiffuser 模型,該模型包含兩個階段,第一階段生成 Layout,第二階段生成圖像。

圖片

 TextDiffuser框架圖

模型接受一段文本 Prompt,然后根據 Prompt 中的關鍵詞確定每個關鍵詞的 Layout(也就是坐標框)。研究者采用了 Layout Transformer,使用編碼器-解碼器的形式自回歸地輸出關鍵詞的坐標框,并用 Python 的 PILLOW 庫渲染出文本。在這個過程中,還可以利用 Pillow 現成的 API 得到每個字符的坐標框,相當于得到了字符級別的 Box-level segmentation mask?;诖诵畔ⅲ芯空邍L試微調 Stable Diffusion。

他們考慮了兩種情況,一種是用戶想直接生成整張圖片(稱為 Whole-Image Generation)。另一種情況是 Part-Image Generation,在論文中也稱之為 Text-inpainting,指的是用戶給定一張圖像,需要修改圖里的某些文本區域。

為了實現以上兩種目的,研究者重新設計了輸入的特征,維度由原先的 4 維變成了 17 維。其中包含 4 維加噪圖像的特征,8 維字符信息,1 維圖像掩碼,還有 4 維未被 mask 圖像的特征。如果是 Whole-image generation,研究者將 mask 的區域設為全圖,反之,如果是 part-image generation,就只 mask 掉圖像的一部分即可。擴散模型的訓練過程類似于 LDM,有興趣的伙伴可以參考原文方法部分的描述。

在 Inference 階段,TextDiffuser 非常靈活,有三種使用方式:

  • 根據用戶給定的指令生成圖像。并且,如果用戶不大滿意第一步 Layout Generation 生成的布局,用戶可以更改坐標也可以更改文本的內容,這增加了模型的可控性。
  • 直接從第二個階段開始。根據模板圖像生成最終結果,其中模板圖像可以是印刷文本圖像,手寫文本圖像,場景文本圖像。研究者專門訓練了一個字符集分割網絡用于從模板圖像中提取 Layout。
  • 同樣也是從第二個階段開始,用戶給定圖像并指定需要修改的區域與文本內容。并且,這個操作可以多次進行,直到用戶對生成的結果感到滿意為止。

圖片

構造的 MARIO 數據

為了訓練 TextDiffuser,研究者搜集了 1000 萬張文本圖像,如上圖所示,包含三個子集:MARIO-LAION, MARIO-TMDB 與 MARIO-OpenLibrary。

研究者在篩選數據時考慮了若干方面:例如在圖像經過 OCR 后,只保留文本數量為 [1,8] 的圖像。他們篩掉了文本數量超過 8 的文本,因為這些文本往往包含大量密集文本,OCR 的結果一般不太準確,例如報紙或者復雜的設計圖紙。除此之外,他們設置文本的區域大于 10%,設置這個規則是為了讓文本區域在圖像的比重不要太小。

在 MARIO-10M 數據集訓練之后,研究者將 TextDiffuser 與現有其他方法做了定量與定性的對比。例如下圖所示,在 Whole-Image Generation 任務中,本文的方法生成的圖像具有更加清晰可讀的文本,并且文本區域與背景區域融合程度較高。

與現有工作比較文本渲染性能

研究者還做了定性的實驗,如表 1 所示,評估指標有 FID,CLIPScore 與 OCR。尤其是 OCR 指標,本文方法相對于對比方法有很大的提升。

圖片

表1:定性實驗

對于 Part-Image Generation 任務,研究者嘗試著在給定的圖像上增加或修改字符,實驗結果表明 TextDiffuser 生成的結果很自然。

圖片

文本修復功能可視化

總的來說,本文提出的 TextDiffuser 模型在文本渲染領域取得了顯著的進展,能夠生成包含易讀文本的高質量圖像。未來,研究者將進一步提升 TextDiffuser 的效果。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2023-10-11 09:53:27

人工智能AI 圖像

2020-12-30 15:14:46

人工智能數據技術

2017-07-14 09:54:47

代碼函數程序

2012-09-24 10:08:05

JSjQueryHTML5

2021-08-08 14:26:24

SQL數據庫開發

2011-05-31 13:43:46

外鏈

2012-09-13 10:44:18

Python代碼

2011-03-04 10:11:09

JavascriptAPI

2023-07-06 14:51:30

開發高質量軟件

2023-11-30 13:04:56

LCM圖像

2025-01-07 13:19:48

模型AI訓練

2010-03-01 14:31:04

Java

2025-01-17 11:05:00

模型訓練

2015-08-25 08:29:11

編寫高質量命名

2015-08-03 10:40:59

程序員代碼質量Quora

2024-03-07 11:39:24

HadolintDockerfile工具
點贊
收藏

51CTO技術棧公眾號

wwww国产精品欧美| 中文字幕日韩欧美在线| 日本高清xxxx| 中文字幕免费一区二区三区| 欧美精品福利视频| 中文字幕成在线观看| 精品女厕一区二区三区| 国产1区2区视频| 国产日韩v精品一区二区| 丰满人妻一区二区三区53号| 亚洲欧美视频一区二区三区| 国产精华一区| 亚洲小说欧美另类社区| 97久久夜色精品国产九色 | 日韩成人av电影| 精品精品国产高清a毛片牛牛 | 中文字幕免费精品| 国产精品影片在线观看| 亚洲午夜久久| 欧美综合激情网| 国产va免费精品观看精品视频 | 日韩美女视频一区二区| 色偷偷亚洲第一综合| **欧美大码日韩| 婷婷综合影院| 91国偷自产一区二区开放时间| 国产1区2区3区在线| 欧美日韩亚洲国产综合| caoporn免费在线| 亚洲黄色av女优在线观看| 中文字幕在线视频网站| 久久精品成人欧美大片古装| 一区三区自拍| 国产精品爽爽爽| 亚洲高清网站| 公共露出暴露狂另类av| 91视频国产资源| 欧美aaa一级片| 色久优优欧美色久优优| 男人影院在线观看| 日韩精品亚洲精品| 成人国产激情| 欧美亚洲国产另类| 91精品国产自产拍在线观看蜜| 国产精品二区三区四区| 免费成人在线视频观看| 日韩欧美一区二| 一片黄亚洲嫩模| 国产乱色在线观看| 精品久久国产精品| 日韩一区二区在线免费| 午夜老司机精品| 久久久精品国产99久久精品芒果| 97超视频免费观看| 亚洲三级网址| 欧美连裤袜在线视频| 91视频在线观看免费| 四虎精品成人影院观看地址| 日韩av网址在线观看| 欧美大奶一区二区| 国内视频一区二区| 国产v日产∨综合v精品视频| 99在线欧洲视频| 欧美日韩精品一区二区三区| 欧美视频免费看| 91色精品视频在线| 懂色av一区二区三区免费观看| 国产区视频在线观看| 精品国产乱码久久久久久1区2区| 中文字幕一区二区三区中文字幕| 99在线影院| 26uuu久久综合| 日本在线观看| 欧美黑人巨大xxx极品| 国产精品嫩草99av在线| 国产激情在线观看视频| 欧美一区日本一区韩国一区| 牛牛精品成人免费视频| 色播五月综合| 一区二区在线观看免费| 欧美成人h版| 国产精品视频网站| 99精品国产99久久久久久白柏| 黄色大片在线看| 久久九九国产精品怡红院| 国语自产精品视频在线看8查询8| 精品中文字幕av| 国产欧美自拍一区| 欧美不卡福利| 午夜一区二区三区视频| 欧美不卡高清一区二区三区| 国产精品美女av| 97成人超碰视| 日本大胆在线观看| 91色精品视频在线| 国产精品三级在线观看| 男女在线观看视频| 91传媒在线免费观看| 中文字幕在线不卡视频| 韩国理伦片久久电影网| 欧美日韩一区二区视频在线观看 | 欧美一区二区三区视频| 国产精品嫩模av在线| 国产 福利 在线| 日韩美女在线视频| 一本一道久久a久久精品蜜桃| 成人18网站| 欧美裸体xxxx极品少妇| 国产成人在线色| 超级碰碰不卡在线视频| 久久久com| 欧美色大人视频| 亚洲视频电影在线| 香蕉视频在线网站| 国产精品99久久久久久人| 国产精品天美传媒沈樵| 国产精品一级在线观看| 欧美一区二区三区成人| 蜜臀av免费一区二区三区 | 国产精品18久久久久久久久 | 一区二区三区在线免费看| 一二三四中文字幕| 亚洲激情在线观看| 日本欧美久久久久免费播放网| www.成人.com| 国产精品青青草| 欧美性猛交xxxx偷拍洗澡| 精品日韩免费| 中文字幕毛片| 国产精品视频一区国模私拍| 亚洲精品视频在线观看免费| 欧洲亚洲成人| 69日小视频在线观看| 欧美一级淫片videoshd| 一区二区三区四区亚洲| 成人毛片在线| 欧美色视频免费| 好吊妞www.84com只有这里才有精品 | www.中文字幕久久久| 国产精品视频500部| 国产在线一区观看| 日本欧美一区二区| 国产精品一卡二卡| 在线观看欧美黄色| 天堂精品在线视频| 国产一级特黄a大片免费| 成年无码av片在线| 国产精品国产三级国产普通话99 | 日韩欧美成人一区| 男女性色大片免费观看一区二区| 欧美wwww| ww国产内射精品后入国产| 性色av一区二区三区红粉影视| 亚洲人成精品久久久久久| 97在线精品| 国产在线观看免费麻豆| 中文字幕一区二区三区有限公司| 亚洲人成电影在线播放| 久久精品一二三| 成人看的羞羞网站| 中文字幕伦理免费在线视频| 日本精品福利视频| 久久久视频在线| 91高清视频在线| 国产成人av网站| 精品国产乱码| 久草在线视频福利| 亚洲熟妇av一区二区三区| 国产精品一区二区三区久久久| 欧美人xxxx| 久久综合九色综合欧美亚洲| 91视频综合| 日本在线观看大片免费视频| 欧美污视频网站| 999热视频| 自拍偷拍亚洲在线| 亚洲成va人在线观看| 麻豆国产精品视频| 日本天堂一区| 国产精品九九九| 欧美色综合天天久久综合精品| 国产在线播放一区| 亚洲高清极品| 激情av在线| 精精国产xxxx视频在线动漫| 亚洲精品成人自拍| 欧美一区二区.| 亚洲成人1234| 亚洲第一av色| 国产成人av电影在线观看| 欧美3p视频| 国产美女精品视频免费播放软件| 成人在线观看一区| 男人搞女人网站| 亚洲精品二区| 91丝袜美腿美女视频网站| 日韩中文字幕视频在线| 欧美丝袜自拍制服另类| 欧美国产精品一区二区三区| 丝瓜av网站精品一区二区|