国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

RAE+VAE? 預訓練表征助力擴散模型Tokenizer,加速像素壓縮到語義提取

人工智能 新聞
VFM-VAE 通過直接集成凍結的基礎視覺模型作為 Tokenizer,能夠顯著加速模型收斂并提升生成質量,展示了 LDM Tokenizer 從像素壓縮邁向語義表征的演化方向。

近期,RAE(Diffusion Transformers with Representation Autoencoders)提出以「 凍結的預訓練視覺表征」直接作為潛空間,以顯著提升擴散模型的生成性能。

無獨有偶,同期西安交通大學與微軟亞洲研究院提出了「VFM-VAE」。二者均基于凍結的預訓練視覺模型構建語義潛空間,而 VFM-VAE 在結構上可視為 RAE 與 VAE 的結合:結合 VAE 的概率建模機制,將高維預訓練模型特征壓縮為低維潛空間表示,系統性地研究了在壓縮條件下預訓練視覺表征對 LDM 系統表征結構與生成性能的影響。

VFM-VAE 通過直接集成凍結的基礎視覺模型作為 Tokenizer,能夠顯著加速模型收斂并提升生成質量,展示了 LDM Tokenizer 從像素壓縮邁向語義表征的演化方向。

圖 1:左:VFM-VAE 設計示意圖。右:ImageNet 256×256 上生成性能比較。

  • 論文鏈接:https://www.arxiv.org/abs/2510.18457
  • Github 鏈接:https://github.com/tianciB/VFM-VAE 

預訓練視覺特征替代潛空間的探索

近年來,擴散模型和多模態生成系統在圖像理解與合成領域持續取得突破,但其性能上限日益受限于視覺分詞器的表達能力。

傳統的蒸餾式方法重新訓練 VAE 并對齊基礎視覺模型的特征分布,雖取得了一定成果(如 VA-VAE),但由于是在有限的數據集上的蒸餾,其在旋轉、縮放或輕噪聲等語義保持擾動下容易失穩,導致潛空間表示偏移、系統穩健性下降。

為系統分析這一現象,研究團隊提出了 SE-CKNNA 指標,用于量化潛空間與基礎視覺模型特征之間的一致性,并評估這種一致性對后續生成性能的影響。

實驗表明,蒸餾式分詞器在擾動下的語義對齊易退化,而保持潛空間與基礎視覺模型特征的高度一致,對生成模型的穩健性和收斂效率至關重要。

圖 2:不同 Tokenizer 在語義保持擾動下與各自視覺基礎模型對齊的情況。

表 1:不同 Tokenizer 與視覺基礎模型的對齊質量,以及對應的重建、生成能力對比。CKNNA* 是與 DINOv2-Giant 統一計算;其余 CKNNA 是與各自的視覺基礎模型計算,SD-VAE 默認與 DINOv2-Large 計算。

如何從凍結的基礎視覺模型特征中壓縮語義,并進行像素重建?

「直連」雖然避免了蒸餾帶來的信息損失,但基礎視覺模型的高層特征雖具強語義表達,卻缺乏精確的空間結構信息,直接用于重建往往導致細節模糊。為此,研究團隊設計了一個兼顧語義壓縮與像素還原的兩階段解碼框架。

首先,編碼側通過凍結的基礎視覺模型提取多層語義特征,并利用輕量的投影模塊將不同層級的特征映射到潛空間 z。

接著,解碼器部分采用「多尺度潛特征融合」結構:將 z 分為語義分支和空間分支,前者在各層提供全局風格與語義控制,后者在低分辨率階段注入以確定布局與主體形狀。

在具體實現上,VFM-VAE 使用調制式卷積塊(modulated convolution block)與層級式 ToRGB 輸出,使模型能夠在 8×8 → 256×256 的金字塔結構中逐級恢復細節。訓練目標聯合 L1、LPIPS、KL 與對抗性損失,并引入基于視覺基礎模型特征的表征正則,在有效防止模糊重建的同時,確保潛空間特征可被下游生成模型穩定利用。

圖 3:VFM-VAE 的總體框架。

潛空間與預訓練視覺表征的一致性如何影響生成性能?

研究團隊進一步分析了潛空間表征在擴散模型內部的層間一致性,發現 VFM-VAE 在層間平均和峰值 CKNNA 得分均高于蒸餾式分詞器,表明其潛空間能更穩定地對齊基礎視覺模型特征。然而,淺層語義對齊相對較弱。

為此,團隊在生成模型的淺層引入與基礎視覺模型特征的顯式對齊機制,使 LDM 的潛空間在生成過程中始終保持與基礎視覺模型特征的高度一致,從而進一步提升了語義傳遞的穩定性與生成質量。

圖 4:左側展示了不同分詞器結合生成模型時,在未引入顯式對齊機制下各層特征與基礎視覺模型特征的對齊情況;右側對比了結合顯式對齊的 VFM-VAE 與僅采用顯式對齊的生成模型在層間特征與基礎視覺模型特征對齊上的差異。

更高質量與更快收斂:VFM-VAE 邁向可穩健對齊的生成系統

在實驗中,VFM-VAE 展現出顯著的性能優勢與訓練效率。在 ImageNet 256×256 上,該方法在相同訓練階段實現 gFID 3.80 (without CFG),優于蒸餾路線的 5.14。當與顯式對齊機制結合后,僅用 80 epochs 即可達到 gFID 2.22 (without CFG),訓練效率較蒸餾式 Tokenizer 系統提升約 10 倍。

研究團隊還將 VFM-VAE 與多模態語言模型 BLIP3-o 結合,驗證其在文生圖任務中的語義一致性與生成潛力。經過 1 epoch 預訓練,VFM-VAE + BLIP3-o 在 DPG-Bench 上得分 59.1,較 VA-VAE 提升明顯;在 MJHQ-30K 上 gFID 降至 16.98(蒸餾路線為 23.00)。

這些結果表明,VFM-VAE 不僅在潛空間擴散階段表現出穩健語義對齊,也能在跨模態生成中有效傳遞這種一致性,形成從「視覺理解」到「圖像生成」的閉環。

圖 5:ImageNet 256x256 上各 LDM 系統的生成性能對比。

表 2:不同 Tokenizer 與 BLIP3-o 的文本生成圖像結果(DPG-Bench),數值越高,代表長文本下文生圖一致性越好。 

表 3:不同 Tokenizer 與 BLIP3-o 的文本生成圖像結果(MJHQ-30K),數值越低,代表對應類別下生成真實性越高。

從壓縮到理解:VFM-VAE 重新定義潛空間的意義

長期以來,潛空間擴散模型中的 VAE 更多被視為壓縮與還原的工具,而 VFM-VAE 將其轉化為理解與生成的統一橋梁,使語義在潛空間中得到顯式建模與傳遞。

未來,微軟亞洲研究院的研究員們將繼續探索潛空間在多模態生成與復雜視覺理解中的潛力,推動其從像素壓縮邁向語義表征。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-23 16:56:40

AI模型訓練

2025-10-15 08:50:01

2025-10-29 16:06:10

AI模型訓練

2025-08-13 01:00:00

2025-06-19 10:09:55

2025-10-29 09:05:04

2025-04-25 00:20:00

大模型tokenizer

2025-06-30 08:42:00

模型訓練AI

2023-10-11 12:32:26

模型訓練

2025-07-09 09:25:10

2023-11-19 23:36:50

2025-06-13 09:29:51

2023-07-18 15:05:00

開源大模型

2022-05-25 10:28:35

模型AI

2024-11-13 09:39:13

2024-11-07 15:10:00

2023-01-05 09:33:37

視覺模型訓練

2024-11-04 00:24:56

2025-08-24 09:24:07

2025-07-14 08:51:00

點贊
收藏

51CTO技術棧公眾號

欧美性爽视频| 日本免费高清一区| 色婷婷精品久久二区二区蜜臂av | 欧美成人在线网站| 日韩黄色片在线| 超碰一区二区| 国产美女久久久久| 中文字幕在线观看亚洲| 综合视频免费看| 咪咪网在线视频| 福利一区二区在线观看| 色999日韩欧美国产| 成人一区二区免费视频| 一区二区三区国产好| 国产精品国产三级国产aⅴ原创| 97av在线视频免费播放| 在线影院自拍| 亚洲全部视频| 亚洲乱码国产乱码精品精天堂| 乱熟女高潮一区二区在线| 日韩中文字幕在线一区| 久久久久国产成人精品亚洲午夜| 欧美成人精品在线| av成人在线播放| 亚洲精品国产精华液| 国产精品精品国产| 麻豆视频网站在线观看| 国产精品1区二区.| 午夜剧场成人观在线视频免费观看| 国产一级特黄a大片免费| 欧美日韩一本| 色婷婷综合久久久久中文| 国产黄色免费网| 欧美亚洲三区| 日韩网站在线观看| 一级网站免费观看| 香蕉国产精品偷在线观看不卡| 国产精品第8页| re久久精品视频| 欧美成人r级一区二区三区| 高清无码视频直接看| 天堂久久av| 欧美激情在线视频二区| 免费看a级黄色片| 麻豆影院在线| 成人va在线观看| 久久99国产精品二区高清软件| 8888四色奇米在线观看| 亚洲尤物在线| 欧美精品日日操| 成人h动漫免费观看网站| yiren22亚洲综合| 社区色欧美激情 | 亚洲午夜精品| 国产精品免费看久久久香蕉| 超碰国产在线| 久久综合色8888| 亚洲直播在线一区| 精品免费av在线| 欧美亚洲国产一区二区三区va| 青草青青在线视频| 中文成人综合网| 日本一区高清不卡| 在线日韩一区| 视频在线观看一区二区| 精品国产18久久久久久洗澡| 精品日韩欧美在线| 经典三级久久| 日韩三级av在线播放| 好吊的妞视频这里都有| 欧美日韩一区三区| 成色在线视频| 国产精品一二三在| 日本成人中文字幕在线| 亚洲成a天堂v人片| 波多野结衣乳巨码无在线| 亚洲欧美在线精品| 午夜精品偷拍| 欧美一级大片在线观看| 在线中文字幕播放| 欧美亚洲一区二区在线观看| 午夜欧美激情| 国产精品日韩在线| 老司机免费视频一区二区| 91香蕉嫩草影院入口| 老司机精品视频在线播放| 国产高清自拍一区| 99热国内精品| 2019av中文字幕| 视频一区在线视频| 国产精品午夜av在线| 成人午夜国产| 奇米影视亚洲狠狠色| 麻豆精品一区| 蜜桃麻豆www久久国产精品| 国产韩日影视精品| 丰满的少妇愉情hd高清果冻传媒 | 超级污的网站| 亚洲国产成人午夜在线一区| 在线免费看a| 久久久久久这里只有精品| av片在线观看免费| 在线视频欧美精品| 中文字幕在线免费观看| 一区二区三区在线观看国产 | av日韩一区| 国产亚洲精品91在线| 18aaaa精品欧美大片h| 久久久久88色偷偷免费| 女子免费在线观看视频www| 国产精品久久国产精品| 99久久精品免费| 日韩精品一区二区在线视频| 亚洲色图19p| 九色中文视频| 国产伦精品一区二区三区视频黑人 | 日本免费新一区视频| 日韩av黄色在线观看| 精品日本12videosex| 超碰97在线看| aaa亚洲精品| 婷婷免费在线观看| 伊人开心综合网| 国产激情欧美| 亚洲人体一区| 国产999精品久久| 影院在线观看全集免费观看| 91网站免费看| 午夜精品久久久| 精品视频亚洲| 91久久影院| 国产精品久久久久影院日本| 成人免费在线视频| 色网站在线免费观看| 欧美性受xxxx黑人xyx| 国产欧美日韩影院| 99在线视频播放| 日韩精品91亚洲二区在线观看| 日本丰满大乳奶| 91看片淫黄大片一级| 99reav| 国语自产偷拍精品视频偷| 国产在线精品一区二区| 国产理论在线播放| 久久精品成人动漫| 欧美电影《轻佻寡妇》| 日韩偷拍一区二区| 日韩一区二区三区视频| 亚洲视频成人| 国精产品一区一区三区视频| 亚洲影视在线播放| 成人精品一区二区三区免费 | 在线中文字幕视频观看| 久久免费99精品久久久久久| 国产成人丝袜美腿| 三级在线看中文字幕完整版| 精品一区二区成人免费视频| 国产区在线观看成人精品| 亚洲人性生活视频| 亚洲欧美中文日韩v在线观看| 麻豆一区二区| 日本二区视频| 亚洲加勒比久久88色综合 | 91国产福利在线| 精品国产免费人成网站| 水蜜桃在线免费观看| 在线激情影院一区| 一区二区三区毛片免费| 欧美 日韩 国产精品| 日韩av在线看| 成人动漫在线一区| 狠狠88综合久久久久综合网| 久久综合九色99| 99在线视频播放| 久久久美女艺术照精彩视频福利播放| 玖玖玖电影综合影院| 大陆一级毛片| 国内成人精品2018免费看| 免费日韩视频在线观看| 欧美在线观看视频一区二区三区| 一区二区三区日本久久久| 满满都是荷尔蒙韩剧在线观看| 91黄色激情网站| 精品国内片67194| 欧美日韩国产成人在线| 欧美高清一区| brazzers在线观看| 无罩大乳的熟妇正在播放| 国产精品久久一区主播| 日韩你懂的在线播放| 中文字幕av一区二区三区人| 午夜视频在线免费| 久久久亚洲影院你懂的| 日韩欧美在线免费| 欧美影院天天5g天天爽| 二区三区在线播放| 成人福利在线观看| 国产精品国产a级| 国产情侣一区| 人猿泰山h版在线观看|