国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

RAE+VAE? 預訓練表征助力擴散模型Tokenizer,加速像素壓縮到語義提取

人工智能 新聞
VFM-VAE 通過直接集成凍結的基礎視覺模型作為 Tokenizer,能夠顯著加速模型收斂并提升生成質量,展示了 LDM Tokenizer 從像素壓縮邁向語義表征的演化方向。

近期,RAE(Diffusion Transformers with Representation Autoencoders)提出以「 凍結的預訓練視覺表征」直接作為潛空間,以顯著提升擴散模型的生成性能。

無獨有偶,同期西安交通大學與微軟亞洲研究院提出了「VFM-VAE」。二者均基于凍結的預訓練視覺模型構建語義潛空間,而 VFM-VAE 在結構上可視為 RAE 與 VAE 的結合:結合 VAE 的概率建模機制,將高維預訓練模型特征壓縮為低維潛空間表示,系統性地研究了在壓縮條件下預訓練視覺表征對 LDM 系統表征結構與生成性能的影響。

VFM-VAE 通過直接集成凍結的基礎視覺模型作為 Tokenizer,能夠顯著加速模型收斂并提升生成質量,展示了 LDM Tokenizer 從像素壓縮邁向語義表征的演化方向。

圖 1:左:VFM-VAE 設計示意圖。右:ImageNet 256×256 上生成性能比較。

  • 論文鏈接:https://www.arxiv.org/abs/2510.18457
  • Github 鏈接:https://github.com/tianciB/VFM-VAE 

預訓練視覺特征替代潛空間的探索

近年來,擴散模型和多模態生成系統在圖像理解與合成領域持續取得突破,但其性能上限日益受限于視覺分詞器的表達能力。

傳統的蒸餾式方法重新訓練 VAE 并對齊基礎視覺模型的特征分布,雖取得了一定成果(如 VA-VAE),但由于是在有限的數據集上的蒸餾,其在旋轉、縮放或輕噪聲等語義保持擾動下容易失穩,導致潛空間表示偏移、系統穩健性下降。

為系統分析這一現象,研究團隊提出了 SE-CKNNA 指標,用于量化潛空間與基礎視覺模型特征之間的一致性,并評估這種一致性對后續生成性能的影響。

實驗表明,蒸餾式分詞器在擾動下的語義對齊易退化,而保持潛空間與基礎視覺模型特征的高度一致,對生成模型的穩健性和收斂效率至關重要。

圖 2:不同 Tokenizer 在語義保持擾動下與各自視覺基礎模型對齊的情況。

表 1:不同 Tokenizer 與視覺基礎模型的對齊質量,以及對應的重建、生成能力對比。CKNNA* 是與 DINOv2-Giant 統一計算;其余 CKNNA 是與各自的視覺基礎模型計算,SD-VAE 默認與 DINOv2-Large 計算。

如何從凍結的基礎視覺模型特征中壓縮語義,并進行像素重建?

「直連」雖然避免了蒸餾帶來的信息損失,但基礎視覺模型的高層特征雖具強語義表達,卻缺乏精確的空間結構信息,直接用于重建往往導致細節模糊。為此,研究團隊設計了一個兼顧語義壓縮與像素還原的兩階段解碼框架。

首先,編碼側通過凍結的基礎視覺模型提取多層語義特征,并利用輕量的投影模塊將不同層級的特征映射到潛空間 z。

接著,解碼器部分采用「多尺度潛特征融合」結構:將 z 分為語義分支和空間分支,前者在各層提供全局風格與語義控制,后者在低分辨率階段注入以確定布局與主體形狀。

在具體實現上,VFM-VAE 使用調制式卷積塊(modulated convolution block)與層級式 ToRGB 輸出,使模型能夠在 8×8 → 256×256 的金字塔結構中逐級恢復細節。訓練目標聯合 L1、LPIPS、KL 與對抗性損失,并引入基于視覺基礎模型特征的表征正則,在有效防止模糊重建的同時,確保潛空間特征可被下游生成模型穩定利用。

圖 3:VFM-VAE 的總體框架。

潛空間與預訓練視覺表征的一致性如何影響生成性能?

研究團隊進一步分析了潛空間表征在擴散模型內部的層間一致性,發現 VFM-VAE 在層間平均和峰值 CKNNA 得分均高于蒸餾式分詞器,表明其潛空間能更穩定地對齊基礎視覺模型特征。然而,淺層語義對齊相對較弱。

為此,團隊在生成模型的淺層引入與基礎視覺模型特征的顯式對齊機制,使 LDM 的潛空間在生成過程中始終保持與基礎視覺模型特征的高度一致,從而進一步提升了語義傳遞的穩定性與生成質量。

圖 4:左側展示了不同分詞器結合生成模型時,在未引入顯式對齊機制下各層特征與基礎視覺模型特征的對齊情況;右側對比了結合顯式對齊的 VFM-VAE 與僅采用顯式對齊的生成模型在層間特征與基礎視覺模型特征對齊上的差異。

更高質量與更快收斂:VFM-VAE 邁向可穩健對齊的生成系統

在實驗中,VFM-VAE 展現出顯著的性能優勢與訓練效率。在 ImageNet 256×256 上,該方法在相同訓練階段實現 gFID 3.80 (without CFG),優于蒸餾路線的 5.14。當與顯式對齊機制結合后,僅用 80 epochs 即可達到 gFID 2.22 (without CFG),訓練效率較蒸餾式 Tokenizer 系統提升約 10 倍。

研究團隊還將 VFM-VAE 與多模態語言模型 BLIP3-o 結合,驗證其在文生圖任務中的語義一致性與生成潛力。經過 1 epoch 預訓練,VFM-VAE + BLIP3-o 在 DPG-Bench 上得分 59.1,較 VA-VAE 提升明顯;在 MJHQ-30K 上 gFID 降至 16.98(蒸餾路線為 23.00)。

這些結果表明,VFM-VAE 不僅在潛空間擴散階段表現出穩健語義對齊,也能在跨模態生成中有效傳遞這種一致性,形成從「視覺理解」到「圖像生成」的閉環。

圖 5:ImageNet 256x256 上各 LDM 系統的生成性能對比。

表 2:不同 Tokenizer 與 BLIP3-o 的文本生成圖像結果(DPG-Bench),數值越高,代表長文本下文生圖一致性越好。 

表 3:不同 Tokenizer 與 BLIP3-o 的文本生成圖像結果(MJHQ-30K),數值越低,代表對應類別下生成真實性越高。

從壓縮到理解:VFM-VAE 重新定義潛空間的意義

長期以來,潛空間擴散模型中的 VAE 更多被視為壓縮與還原的工具,而 VFM-VAE 將其轉化為理解與生成的統一橋梁,使語義在潛空間中得到顯式建模與傳遞。

未來,微軟亞洲研究院的研究員們將繼續探索潛空間在多模態生成與復雜視覺理解中的潛力,推動其從像素壓縮邁向語義表征。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-10-23 16:56:40

AI模型訓練

2025-10-15 08:50:01

2025-10-29 16:06:10

AI模型訓練

2025-08-13 01:00:00

2025-06-19 10:09:55

2025-10-29 09:05:04

2025-04-25 00:20:00

大模型tokenizer

2025-06-30 08:42:00

模型訓練AI

2023-10-11 12:32:26

模型訓練

2025-07-09 09:25:10

2023-11-19 23:36:50

2025-06-13 09:29:51

2023-07-18 15:05:00

開源大模型

2022-05-25 10:28:35

模型AI

2024-11-13 09:39:13

2024-11-07 15:10:00

2023-01-05 09:33:37

視覺模型訓練

2024-11-04 00:24:56

2025-08-24 09:24:07

2025-07-14 08:51:00

點贊
收藏

51CTO技術棧公眾號

欧美中文字幕一二三区视频| 日韩欧美在线视频日韩欧美在线视频 | 亚洲乱码精品一二三四区日韩在线| 欧美中文字幕在线观看视频| 免费视频一区| 日本在线成人一区二区| 丝袜国产日韩另类美女| japanese在线播放| 欧美国产丝袜视频| 在线播放网站| 偷窥少妇高潮呻吟av久久免费| 男人久久精品| 亚洲第一网站免费视频| 日韩电影大全网站| 久久人人爽人人爽人人av| 中文字幕日韩欧美精品高清在线 | 国产3p露脸普通话对白| 国产午夜精品久久| 久草在线看片| 性伦欧美刺激片在线观看| 国产特级淫片高清视频| 亚洲一区二三区| 韩国美女久久| 亚洲一区二区三区777| 国产精品普通话对白| 国内自拍中文字幕| 亚洲欧美在线视频观看| 在线观看免费视频你懂的| 97在线观看免费| 美女视频一区免费观看| 丁香婷婷自拍| 在线看福利67194| 欧美.www| 动漫黄在线观看| 正在播放国产一区| 免费看亚洲片| 在线成人福利| 日产日韩在线亚洲欧美| 中文文精品字幕一区二区| 日本中文字幕视频在线| 91精品国产高清| 91视频免费播放| 免费观看成人性生生活片 | 精品在线观看入口| 国产黄页在线观看| 精品国产91久久久久久久妲己| 国产三级三级三级精品8ⅰ区| 欧美a免费在线| 色94色欧美sute亚洲线路一ni | 一区二区三区美女| 视频精品国内| 久久久久久久久久伊人| 日韩精品在线观看一区二区| 久久字幕精品一区| 国产精品蜜臀| 正在播放精油久久| 亚洲美女免费精品视频在线观看| 久久精品国产精品亚洲红杏| 国产在线xxx| 九一免费在线观看| 日本三级中国三级99人妇网站| 97久久精品人人澡人人爽| 成人免费在线视频网| 中文字幕精品在线不卡| 日韩在线电影| 成人永久免费| 性做久久久久久免费观看| 九九热线有精品视频99| 又黄又爽的视频在线观看| 91亚洲精品一区二区| 欧美视频你懂的| 激情综合网激情| 欧美禁忌电影| 性xxxfreexxxx性欧美| 人人妻人人添人人爽欧美一区| 久久青草福利网站| 欧美三级中文字幕| 国产高清视频一区| 成人直播大秀| 日韩精品极品| 性视频在线播放| 日韩欧美精品在线不卡| 欧美精品在线免费观看| 亚洲成人精品一区| 国产精品99久久久久久宅男| 亚洲第一二三区| 欧美性xxx| 欧美写真视频一区| 99精品免费在线观看| 国产精品v欧美精品∨日韩| 中文字幕精品—区二区| 欧美偷拍一区二区| 欧美韩日一区二区三区四区| 日韩精品五月天| 中文字幕亚洲精品乱码| 97久久综合区小说区图片区 | 日韩欧美区一区二| 国产麻豆精品在线观看| 99精品美女| 成人深夜福利| 好看的中文字幕在线播放| 在线看小视频| 成人黄色电影在线| 人妻有码中文字幕| 成人免费黄色网| 午夜精品三级视频福利| 亚洲人精品午夜在线观看| 日韩精品一区二| 欧美美女喷水视频| 欧美日韩亚洲综合| 色综合久久久久综合| 亚洲成人av电影在线| 亚洲人成网站精品片在线观看| 91久色porny| 不卡的av在线| 99久久99久久精品免费看蜜桃| 日本在线不卡视频| 精品亚洲成a人在线观看| 另类欧美日韩国产在线| 国产精品香蕉一区二区三区| 欧美日韩在线观看视频| 国产精品久久久久久久久搜平片| 色资源二区在线视频| 日本美女高清在线观看免费| аⅴ资源新版在线天堂| 亚洲成人三级| 韩国精品一区| 视频欧美精品| 色老板在线视频一区二区| 国产在线观看91一区二区三区| 亚洲人成网站77777在线观看| 桃色av一区二区| 成人激情综合| 中文在线资源| a级片免费在线观看| 中文字幕av一区二区三区佐山爱| 成人三级小说| 国产91欧美| 国产区精品区| 亚洲一区二区三区四区五区午夜| 久久99国产精品免费| 欧美激情资源网| 欧美日韩一级片网站| 亚洲丝袜在线视频| 日韩在线视频在线| 日韩av视屏| 强开小嫩苞一区二区三区网站| 日韩av电影在线观看| 精品国产av无码一区二区三区| 国产午夜电影| 欧美人动性xxxxz0oz| 国产一区二区三区亚洲综合| 欧美久久99| 中文字幕欧美国产| 91精品国产品国语在线不卡| 欧美成人午夜免费视在线看片| 国产精品二区三区| 一区二区xxx| 中文字幕在线免费观看视频| 国产精品久久久久无码av| 91视视频在线直接观看在线看网页在线看 | 日韩精品极品在线观看播放免费视频 | 麻豆免费网站| 欧美日韩尤物久久| 亚洲三级免费| 欧美激情中文字幕一区二区| 国产亚洲一区二区三区四区| 91精品国产综合久久久久久久 | 激情综合色综合久久| 欧美经典一区二区| 欧美亚一区二区| 中文字幕日韩欧美| 成人三级在线| 嫩草懂你的影院| 成人51免费| 成人高清在线视频| 亚洲黄色av女优在线观看| 国产精品国产精品| 日本最新在线视频| 日韩一区二区三区高清在线观看| 欧美日韩一二三四| 精品国产不卡一区二区| 99久久精品费精品国产风间由美| 香港成人在线视频| 欧美日本中文字幕| 国产精品一区二区三区在线观| 成人一级片网站| 超碰在线图片| 少妇精品久久久一区二区三区| aⅴ色国产欧美| 日韩欧美国产wwwww| 97伦理在线四区| 免费黄网站在线观看| 在线观看免费一区二区| 欧美午夜在线观看| 亚洲欧洲在线一区| 欧美黄色三级| 国产美女视频91| 亚洲成人久久久| 99久久激情视频|