国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸

發布于 2025-6-10 09:36
瀏覽
0收藏

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

論文鏈接:???https://openaccess.thecvf.com/content/CVPR2025/papers/Hu_Improving_Autoregressive_Visual_Generation_with_Cluster-Oriented_Token_Prediction_CVPR_2025_paper.pdf??? 
項目鏈接:https://sjtuplayer.github.io/projects/IAR/ 
Git鏈接:https://github.com/sjtuplayer/IAR 
單位:上海交通大學、騰訊優圖、浙江大學

1.引言

使用自回歸進行視覺生成最近已成為一個研究重點。然而,現有的方法主要是將自回歸架構轉移到視覺生成中,但很少研究語言和視覺之間的根本差異。這種疏忽可能導致自回歸框架內視覺生成能力的次優利用。在本文中,作者探討了自回歸框架下視覺特征空間的特點,發現視覺編碼之間的相關性可以幫助實現更穩定和更魯棒的生成結果。為此,上海交通大學數字媒體與計算機視覺實驗室,聯合騰訊優圖和浙江大學,提出了IAR,一種改進的自回歸視覺生成方法,提高了基于自回歸的視覺生成模型的訓練效率和生成質量。


(1) Codebook重排策略,該策略使用平衡的k-means聚類算法將視覺碼本重新排列成簇,確保每個簇內視覺特征之間的高度相似性。


(2) 面向簇的交叉熵損失,引導模型正確預測目標Token所在的簇。結合Codebook重排列,可以確保即使模型預測錯誤的Token索引,預測的錯誤Token位于正確的簇中的概率也很高,從而保證生成圖像與目標圖像的相似性。


IAR顯著提高了生成質量和穩健性。IAR可以直接應用到現有的自回歸視覺生成框架中,在LLamaGen和VAR上,能夠穩定提升訓練效率和效果,最大提升42%的訓練效率。

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖1:IAR能夠使得AR模型預測錯誤Token時,最大概率保證其落在正確的簇中,使得解碼后與目標圖像仍然是相似的

2.圖像與自然語言之間的連續性差異

近年來,生成模型在圖像和視頻生成領域取得了顯著突破,隨著多模態研究的興起,圖像與文本的融合成為了一個重要方向。研究人員希望開發一種統一的多模態模型,能夠同時理解和生成圖像與文本內容。基于此,將圖像生成技術與大型語言模型(LLM)結合逐漸成為熱點。


傳統圖像生成方法如 GAN 和擴散模型,主要在連續空間中建模圖像分布,而自回歸方法則選擇先將圖像離散化為Token,再通過語言模型的方式進行預測。這些方法借鑒了自然語言處理中的經驗,比如自回歸模型采用 GPT 的“Next-Token預測”策略。


然而,圖像與文本在本質上存在重要區別:文本是離散的,可以直接通過查找表將詞語映射到索引;而圖像是連續的,需要通過編碼器將其轉化為離散的Token,再通過碼本(codebook)檢索對應的編碼,最終解碼為圖像。這種差異啟發了圖像生成可以考慮利用視覺特征空間中的連續性和相關性,而不僅僅是預測單一的Token索引。


由于圖像編碼位于連續的特征空間中,相似的編碼通常對應于內容相近的圖像。這是否意味著,即使模型預測的Token略有偏差,只要其對應的編碼足夠相似,生成的圖像質量也不會受到太大影響。

3.圖像編碼的相似性

作者發現,在碼本(codebook)中相近距離的編碼表示相似的圖像信息。當距離(code distance)較小時,解碼出的圖像與目標圖像在感知質量上幾乎一致。作者在VQGAN上驗證了這一想法。

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖2:Code Distance與圖像相似性的關聯


同時,作者進一步可視化了不同Code Distance解碼出的圖像,當Code Distance較低(例如,小于 12)時,解碼出的圖像與源圖像幾乎相同,且具有良好的視覺質量。這表明,即使預測的 token 索引不是準確的目標索引,只要相應編碼之間的Code Distance處于一定范圍內,解碼出的圖像仍然與目標圖像相似,且具有良好的視覺質量。

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖3:Code Distance在一定范圍內,能夠保證相似且高質量的圖像生成

4.方法

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖4:框架圖

4.1 Codebook重排

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖5:均衡K-means聚類

4.2 面向簇的視覺生成:

在現有的自回歸模型中,都是面向Token設計交叉熵損失:

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

由于簇的數量少,預測簇比直接預測token更簡單,同時,只要預測正確了簇的索引,即可保證生成圖像不會偏離目標圖像,從而極大地促進模型的魯棒性與生成質量的穩定性。

5.實驗結果

5.1 生成質量比較

為了評估圖片質量,IAR選擇 LlamaGen作為基模型,并保持超參數與LlamaGe一致。實驗在 ImageNet數據集上進行。實驗生成了 50,000 張隨機標簽的圖像,并計算生成數據的FID、IS、精度(Precision)和召回率(Recall)。作者首先比較了不同類型圖像生成模型在這些參數上的表現:

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖6:實驗結果

實驗結果表明,與 GAN、擴散模型、掩碼預測方法和自回歸方法等相比,IAR達到了最優的 FID(2.19)和 IS(362.0),并且在不同的參數量下(100M到1.4B),IAR都取得了優于LLamaGen的表現。

5.2 與 LlamaGen 的更多比較:

效果對比:在不同模型參數規模(111M 至 1.4B),圖像分辨率(16×16 和 24×24 圖像塊),訓練輪次(50 和 300 輪)條件下,IAR均有著更好的FID和IS,優于基線模型 LLamaGen;

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖7:不同setting下與LLaMaGen的詳細比較

訓練效率:在175個epoch時,IAR 模型的FID與 LlamaGen 300個epoch的相當,訓練速度提升約 42%。此外,在 300 個 epoch 的訓練下,IAR 模型進一步提升了生成質量。

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖8:訓練效率比較

5.3 VAR+IAR

IAR可以用于現有任意的自回歸模型中,為了驗證在不同自回歸模型上的有效性,實驗選取了VAR作為基礎模型,并進一步將IAR應用于VAR中,實驗表明,IAR同樣能夠有效促進VAR的效果,驗證了IAR在不同自回歸模型中的有效性。

CVPR 2025 | 訓練效率提升42%!上交&騰訊優圖&浙大發布IAR:打破LLM視覺生成瓶頸-AI.x社區

圖9:VAR+IAR的效果提升

6.總結

IAR分析了基于 LLM 的視覺生成中自然語言與圖像的差異,發現碼本中相似的圖像編碼可生成相似圖像。據此提出 IAR,有效提升了訓練效率和生成質量。本文通過平衡 K-means 聚類對碼本重排,使簇內的編碼相似,并引入面向簇的交叉熵損失,引導模型學習目標簇的擬合,從而保證即使預測錯誤圖像 Token ,也能生成高質量圖像。實驗證明 IAR 可穩定提升 LlamaGen的性能,并適配多種 LLM 視覺生成模型(如VAR等),為該自回歸視覺生成提供新方向。


本文轉自AI生成未來 ,作者:AI生成未來

原文鏈接:???https://mp.weixin.qq.com/s/VP85WGtFHq2Sfj2gbevQAw?????

收藏
回復
舉報
回復
相關推薦
国产 欧美在线| av在线免费播放| 亚洲色图网站| 5566成人精品视频免费| 国产不卡人人| 精品日韩一区二区| 亚洲免费视频一区二区三区| 岛国精品视频在线播放| 3d黄动漫网站| 中国色在线观看另类| 日本福利视频在线| 国产盗摄一区二区三区| 日韩最新中文字幕| 国产精品1024久久| 久久久久福利视频| 国产精品性做久久久久久| 中文字幕久久一区| 国产成人在线影院| 国产视频九色蝌蚪| 亚洲国产精品成人综合 | 中文在线免费二区三区| 欧美日韩在线电影| 黄av在线播放| 精品美女一区二区三区| av手机免费在线观看| 亚洲第一av网站| 三妻四妾完整版在线观看电视剧 | 全部孕妇毛片丰满孕妇孕交| 国产精品久久久久aaaa| 97视频免费| 午夜精品成人在线视频| 你懂得在线网址| 91麻豆精品国产91久久久资源速度| 中文在线观看免费| 国产一区二区三区四区福利| 国产精品白丝久久av网站| 午夜欧美不卡精品aaaaa| 九九视频免费观看视频精品| 国产欧洲精品视频| 在线亚洲观看| 久久久天堂国产精品| 国产嫩草影院久久久久| 在线影视一区| 欧美精品一区二区三区一线天视频| av免费在线一区| 午夜精品视频在线| 欧美色综合网| 日本a级片在线观看| 国产欧美日韩激情| 日本不卡视频一区二区| 日韩美女在线视频 | 亚洲韩国日本中文字幕| 欧美暴力调教| 日本国产一区二区三区| 我不卡神马影院| 日韩欧美一区二区三区四区五区| 成人avav影音| 中文在线а天堂av| 精品亚洲一区二区三区| 亚洲国产精品嫩草影院久久av| 丁香五月网久久综合| 精品午夜久久福利影院 | 国产精品白丝jk黑袜喷水| 特级丰满少妇一级| 91成人国产精品| 日韩影片中文字幕| 国产精品亚洲视频在线观看| 日韩精品电影一区亚洲| 亚洲人辣妹窥探嘘嘘| 欧美精品色一区二区三区| 97久久中文字幕| 91精品国产高清久久久久久91裸体| 国产一区二区成人久久免费影院 | 2022国产精品视频| 国产一级在线| 日韩视频亚洲视频| 欧美aⅴ99久久黑人专区| 97超碰国产精品| 精品欧美国产一区二区三区| 国产成人精品123区免费视频| 国产精品美女在线| 成人激情黄色小说| 日本视频在线| 日韩美女视频免费在线观看| 国产综合色精品一区二区三区| 中国在线观看免费国语版电影 | 国产精品18久久久久久首页狼 | 91欧美激情另类亚洲| 成人免费av网站| 国产高清视频在线播放| 免费91在线视频| 视频一区免费在线观看| 国内外成人免费在线视频| 亚洲精品www久久久久久广东| jizzjizz欧美69巨大| 青春草国产视频| 日韩一卡二卡三卡国产欧美| 国产伦精品一区二区三区千人斩| 97中文字幕在线| 欧美成人女星排名| 欧美视频导航| 满满都是荷尔蒙韩剧在线观看| 日韩中文字幕在线免费观看| 亚洲免费播放| 久草在线资源视频| 污网站免费在线观看| 亚洲国产私拍精品国模在线观看| 国产一区二区三区四区五区传媒| 一区二区三区电影| 在线精品视频免费播放| 日本午夜精品久久久| 成年人网站国产| 亚洲精品xxxx| 肉丝袜脚交视频一区二区| 欧美巨乳在线| 国产精品一区二区三区在线播放| 久久视频一区二区| 国内精品伊人| 久久久国内精品| 亚洲电影天堂av | 久久久精品一区二区| 国产美女主播视频一区| 成人国产免费电影| 国产伦精品一区二区三区在线 | 亚洲九九在线| 日本1区2区3区中文字幕| 欧美国产日韩免费| 久久免费偷拍视频| 国产电影一区| 久久久999视频| 综合久久五月天| 97se狠狠狠综合亚洲狠狠| 日本美女久久| 日韩av中文字幕第一页| 亚洲人成网在线播放| 国产精品夜夜爽| 新片速递亚洲合集欧美合集| 一区二区三区偷拍| 亚洲久久久久久久久久| 成人激情午夜影院| 97成人在线| 91免费版在线观看| 97人人模人人爽人人少妇| 在线视频亚洲一区| 久久国产日韩| 玛雅亚洲电影| 精品久久久久av| 欧美一区二区.| 亚洲精品自在久久| 视频一区国产精品| 欧美一级淫片007| 首页欧美精品中文字幕| 污视频在线免费观看网站| 日本在线成人一区二区| 精品久久久久一区| 成人性生交大片免费看中文视频 | 久久精品国产美女| 欧美日韩精品一区二区三区| 亚洲国产高清一区| 日本片在线看| www插插插无码免费视频网站| yellow中文字幕久久| kk眼镜猥琐国模调教系列一区二区 | 97久久精品国产| 亚洲国产乱码最新视频| 欧美日本亚洲韩国国产| 超黄网站在线观看| 99精品视频播放| 国产精品三级美女白浆呻吟| 欧美四级电影在线观看| 激情深爱一区二区| 狼人精品一区二区三区在线| 青梅竹马是消防员在线| 亚洲一区二区三区免费看| 欧美成人精品一区二区| 黑人巨大精品欧美一区免费视频| 久久久久99| 亚洲码欧美码一区二区三区| 在线观看免费国产小视频| 亚洲春色在线视频| 97avcom| 亚洲精品在线三区| 国产精品视频第一区| 国产午夜精品一区二区三区欧美| 成人免费黄色| 亚州av中文字幕在线免费观看| 久久久久资源| 欧美国产在线视频| 欧美日韩欧美一区二区| 成人黄色大片在线观看 | 人妻有码中文字幕| 91视频国产一区| 亚洲丝袜在线视频| 精品久久久国产| 粉嫩aⅴ一区二区三区四区| 精品国产精品国产偷麻豆| av在线最新| 在线播放av片| 免费看黄色一级大片| 久久国产精品精品国产色婷婷|