国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

純自回歸圖像生成模型開源來了,復旦聯手字節seed共同捍衛自回歸

人工智能 新聞
來自復旦視覺與學習實驗室和字節Seed的研究者們希望“驗一驗”自回歸視覺生成模型的能力,他們保持“Next-token prediction”這樣簡潔優美的形式,而通過優化訓練和推理過程來探究自回歸視覺生成是否可以像擴散模型一樣取得不錯的文生圖效果。

基于Transformer的自回歸架構在語言建模上取得了顯著成功,但在圖像生成領域,擴散模型憑借強大的生成質量和可控性占據了主導地位。

圖片

雖然一些早期工作如Parti、LlamaGen,嘗試用更強的視覺tokenizer和Transformer架構來提升自回歸生成的效果,但他們論文中的結果表明,只有更多的參數量才能讓自回歸模型勉強和擴散模型“掰掰手腕”。

這也讓越來越多的研究者質疑自回歸視覺生成是否是一條可行、值得探索的路徑。通常來說,大家認為自回歸視覺生成模型的不足集中:

1. 離散的token必然帶來更多的信息損失:當下改進視覺tokenizer也是一個備受關注的方向,最新的方法無論是離散或連續都可以取得非常好的重建效果(至少不會制約生成模型),因此相信這一點不會是制約兩條路線的核心原因;

2。 視覺token序列往往較長、因此很難建模token間的關系:對于一個512分辨率的圖像來說,16倍壓縮比的tokenizer意味著視覺token序列的長度是1024。對于采用因果掩碼(causal mask)的自回歸模型來說,建模這么長的序列無疑是很有挑戰性的;

3. 下一個token預測的效率太低:相比于擴散模型或MaskGIT那樣一步出整圖或多個token,自回歸模型串行預測token的方式在生成速度方面存在明顯劣勢。

近些時間,也有一些工作如VAR和MAR嘗試重新定義視覺里自回歸的形式,比如下一個尺度預測、或用連續token做自回歸。這些方法在ImageNet這樣的學術數據集上取得了不錯的效果,但是也潛在地破壞了視覺模態和語言模型的對齊性。

帶著好奇的心態,來自復旦視覺與學習實驗室和字節Seed的研究者們希望“驗一驗”自回歸視覺生成模型的能力,他們保持“Next-token prediction”這樣簡潔優美的形式,而通過優化訓練和推理過程來探究自回歸視覺生成是否可以像擴散模型一樣取得不錯的文生圖效果。

不依賴外掛文本編碼器的自回歸模型

先說結論!這篇工作有三點驚艷的發現:

0.5B的參數規模下,純自回歸模型可以生成1024分辨率的高質量圖像,且在常用文生圖基準上取得了非常有競爭力的結果,例如在GenEval上取得了0.59, 是1B以內模型的SOTA;

通過“預訓練-有監督微調-強化學習”這樣的三階段訓練,模型可以生成出具有很高美學性的圖像,且有監督微調(SFT)和基于GRPO的強化學習可以持續提升模型的指令跟隨能力以及生成效果;

當用vLLM進行部署時,0.5B的模型可以在14秒以內生成1024分辨率的圖像。

性能比較

本文提出的SimpleAR在GenEval和DPG上都取得了不錯的結果,其中0.5B模型顯著超越了SDv2.1和LlamaGen。

值得一提的是,擴散模型和Infinity這類方法都依賴于外掛的文本編碼器,如Infinity使用了3B的FlanT5-XL,而本文提出的自回歸模型則將文本(prompt)編碼和視覺生成集成在了一個decoder-only的Transformer里,不僅可以更好地學習跨模態對齊,也能更加高效地利用參數。

圖片

1.5B模型的性能距離Infinity還有差距,但本文相信這主要是由數據規模導致的,當用更多的高質量數據訓練時,模型的性能還可以被進一步提升。此外,本文選擇了Cosmos作為視覺tokenizer,其在重建低分辨率圖像和人臉等細節上十分有限,因此生成能力還有充分被改進的空間。

本文還首次在文生圖上成功應用了GRPO進行后訓練,結果表明:利用CLIP這樣非常簡單的reward函數,也依然可以觀察到非常有潛力的reward曲線、并在GenEval上了取得了顯著的性能提升:

圖片

最后是關于效率問題。本文首先嘗試了用vLLM將模型部署到A100上,結果表明其可以顯著地提升模型的推理速度:僅需13.55秒就能生成1024分辨率的高質量圖像,這顯著縮小了和擴散模型的差距,并由于可以使用KV Cache技術而相比于MaskGIT更有優勢。本文也實現了推斷采樣,其可以有效降低2倍的自回歸推理步數。盡管由于不能使用KV Cache,單純的步數減少不能直接帶來推理時間的降低,但這為高效自回歸視覺生成提供了一些嶄新的思路。

圖片

可視化結果

圖片

幾點思考

顧名思義,SimpleAR只是團隊關于自回歸視覺生成的一次簡單嘗試,但從中可以看到自回歸模型相較于擴散模型的幾點優勢:

1. 將文本和視覺token擺上平等的地位,更好地支持不同模態之間的聯合建模學習,從而有利于構建原生的多模態理解和生成模型;

2. 與現有支持語言模型后訓練和推理加速的技術兼容性高:通過強化學習可以顯著提升模型的文本跟隨能力和生成效果、通過vLLM可以有效降低模型的推理時間;

本文訓練及測試代碼以及模型權重均已開源,希望鼓勵更多的人參與到自回歸視覺生成的探索中。

論文鏈接:
https://arxiv.org/abs/2504.11455
代碼地址:
https://github.com/wdrink/SimpleAR

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-07-04 09:07:00

2024-11-12 13:10:49

2025-08-04 08:23:00

2024-04-17 13:22:55

人工智能

2024-01-29 00:24:07

圖像模型預訓練

2024-04-26 12:51:48

2022-03-14 10:53:12

谷歌模型研究

2024-05-23 16:56:58

2025-04-22 15:34:08

視頻生成AI

2024-01-18 10:57:35

AIM模型NLP

2025-07-30 01:00:00

2022-11-24 17:00:01

模型ARDL開發

2025-07-14 08:42:00

開發模型圖像生成

2022-08-03 11:50:29

DeepMindAI瘦身

2025-10-20 08:51:00

2025-08-12 09:08:00

2024-07-03 12:05:06

Llama模型架構

2025-02-27 13:45:00

2024-02-27 09:43:48

視頻模型

2025-07-10 14:54:13

AI模型圖像生成
點贊
收藏

51CTO技術棧公眾號

免费看av大片| 亚洲一区二区在线看| 亚洲欧美国产77777| 亚洲激情视频| 夜夜操天天操亚洲| 欧美激情按摩在线| www.欧美黄色| 国精产品一区一区三区四川| 国产拍在线视频| 久久亚洲风情| 欧美日韩一区二区在线播放| 国产精品电影久久久久电影网| 久久国产成人精品国产成人亚洲 | 欧美日韩黄网站| 国产乱淫av一区二区三区| 91精品国产色综合久久不卡蜜臀| 91香蕉亚洲精品| 国产午夜视频在线观看| 欧美成人一品| 欧美午夜在线观看| 女同一区二区| av电影免费在线观看| 日韩一区精品视频| 精品视频在线播放| 丁香六月激情网| 亚洲女优在线| 亚洲欧洲偷拍精品| 日韩免费一级视频| 久久精品凹凸全集| 亚洲精品ww久久久久久p站| 欧美在线欧美在线| 91短视频在线观看| 国产一区二区三区四区三区四| 欧美午夜性色大片在线观看| 国产乱码精品一区二区三区日韩精品 | 成人黄色影片在线| 日本一区二区三区视频免费看| av电影在线播放高清免费观看| 亚洲激情视频| 国产日韩在线看| 国产乱妇乱子在线播视频播放网站| 精品在线视频一区| 久久99热精品这里久久精品| 交换国产精品视频一区| 国产在视频线精品视频www666| 色哟哟国产精品免费观看| 美乳视频一区二区| 国产日韩欧美高清免费| 日韩中文在线中文网在线观看| 偷窥自拍亚洲色图| 午夜久久影院| av电影成人| 91欧美精品| 亚洲另类一区二区| 毛片视频免费| 日韩欧中文字幕| 国产欧美久久久久久久久| 久久久精品日韩欧美| 91九色对白| 波多野结衣久久精品| 亚洲第一久久影院| 一本色道久久综合亚洲二区三区 | 日日摸天天爽天天爽视频| 波多野结衣的一区二区三区 | 国产伦精品一区二区三区四区视频 | 久久婷婷久久一区二区三区| 国产欧美精品在线| 素人啪啪色综合| 欧美性生交xxxxxdddd| 成全电影播放在线观看国语| 不卡欧美aaaaa| 国产亚洲第一区| 国产精品zjzjzj在线观看| 91精品国产色综合久久久蜜香臀| 麻豆蜜桃在线| 日本久久电影网| 亚洲人成无码www久久久| 国产精品色呦呦| 中文字幕av久久| 手机亚洲手机国产手机日韩| 一区二区三区无码高清视频| 蜜桃视频在线免费| 中文字幕精品一区二区精品绿巨人| 国内精品久久国产| 国产一区二区成人久久免费影院| 91免费在线视频| 美国欧美日韩国产在线播放| 91中文在线视频| 国产一区二区三区亚洲| 国产精品精品一区二区三区午夜版| 在线日韩欧美| 丰满爆乳一区二区三区| 欧美日韩亚洲精品内裤| 亚洲啊v在线| 日韩欧美一级二级| 手机看片福利在线观看| 欧美国产精品一区二区| 日本一区高清| 亚洲激情自拍视频| 美女隐私在线观看| 色综合久久综合网97色综合| 丁香花在线观看完整版电影| 97视频在线观看视频免费视频 | 任你躁在线精品免费| 亚洲性猛交xxxxwww| 18+激情视频在线| 欧美精品国产精品日韩精品| 澳门av一区二区三区| 国产一区二区香蕉| av在线一区二区| 男人添女人下面高潮视频| 亚洲成人免费av| 韩国成人在线| 精品不卡在线| 久久九九电影| 日韩精品久久久免费观看| 乱人伦精品视频在线观看| 天天影视综合色| 国产亚洲欧美在线| 国产人妻777人伦精品hd| 国产在线国偷精品产拍免费yy| 有色激情视频免费在线| 一区二区三区在线免费视频| 中文字幕 在线观看| 国产麻豆日韩| 亚洲国产日韩a在线播放性色| 国产黄色在线观看| 日韩电影免费一区| 波多野结衣xxxx| 99久久精品国产一区二区三区| 久久免费看毛片| 亚洲h在线观看| 在线国产1区| 欧美日韩国产色| 欧美一级在线| 国语自产在线不卡| 国产呦精品一区二区三区网站| 欧美日韩国产综合视频| 久久久久久久久亚洲| 不卡一区中文字幕| 电影一区二区三区| 亚洲一区二区三区精品在线观看| 欧美日韩一区二区在线视频| 婷婷视频在线| 日韩午夜激情av| 日韩电影大全网站| 免费99精品国产自在在线| 麻豆精品一区| 丰满女人性猛交| 日韩欧美高清在线| 欧美专区在线| 精品美女在线观看视频在线观看| 91久久国产综合久久91精品网站 | 亚洲高清乱码| 国产美女视频91| 七七成人影院| 欧美日韩三区四区| 91亚洲午夜精品久久久久久| 丰满的护士2在线观看高清| 欧美日本国产精品| 欧美老肥妇做.爰bbww| 一区不卡字幕| 国产综合免费视频| 性欧美视频videos6一9| 欧美日韩一二| 欧美精品七区| 在线成人av网站| 在线亚洲自拍| caoporn超碰97| 婷婷激情综合网| 国产高清视频色在线www| 亚洲bbw性色大片| 国产精品福利影院| 日本亚洲精品| 亚洲国产精品综合| 日韩激情在线视频| 亚洲女娇小黑人粗硬| 精品国产一区二区三区日日嗨| 欧美性生交大片免网| 日韩一级精品| 涩涩涩在线视频| 91久久精品美女高潮| 色婷婷综合久久久| 老司机免费视频久久| 亚洲成人短视频| 国产又黄又猛又粗又爽的视频| 4438成人网| 精品成人自拍视频| 久草在线新资源| 久久中文字幕视频| 首页国产欧美日韩丝袜| 搞黄网站在线看| 无码精品a∨在线观看中文| 日韩av不卡在线| av综合在线播放| 免费视频亚洲| 日本成人中文字幕在线| 国产精品久久一| 久久精品欧美日韩| 色呦哟—国产精品|