国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

何必DiT!字節首次拿著自回歸,單GPU一分鐘生成5秒720p視頻 | NeurIPS'25 Oral

人工智能 新聞
這篇來自字節跳動商業化技術團隊的論文,則是提出了一個名叫InfinityStar的方法,一舉兼得了視頻生成的質量和效率,為視頻生成方法探索更多可能的路徑。

啪!~~~

一篇入圍頂會NeurIPS’25 Oral的論文,狠狠反擊了一把DiT(Diffusion Transformer)。

畢竟自打DiT問世以來,視頻生成這塊,算是被它給穩穩拿捏住了。

但站穩了腳跟,并不意味著沒有問題,因為它的計算復雜度高,在資源消耗和速度上有著諸多挑戰。

而這篇來自字節跳動商業化技術團隊的論文,則是提出了一個名叫InfinityStar的方法,一舉兼得了視頻生成的質量和效率,為視頻生成方法探索更多可能的路徑。

像下面這些有趣的動畫片片段,便是由InfinityStar親手打造:

整體來看InfinityStar的亮點,我們可以總結為如下三點:

  1. 是首個在VBench上超越擴散模型的離散自回歸視頻生成器;
  2. 視頻生成不用再“慢慢熬”:從百步去噪到自回歸,告別延遲;
  3. 任務通吃:文生圖、文生視頻、圖生視頻、交互式長視頻生成等。

值得一提的是,InfinityStar目前的論文、代碼、體驗地址均已經發布(鏈接見文末),接下來我們就進一步實測一波~

實測給DiT上了一課的AI視頻生成

首先我們來簡單了解一下InfinityStar的體驗方法。

它的入口就在Discord社區里面,大家登錄賬號之后,點擊下面這個鏈接即可跳轉。http://opensource.bytedance.com/discord/invite

在左側導航欄的下方面,便有InfinityStar文生視頻、圖生視頻等各種功能的選項。像剛才展示的視頻,便是在“i2v-generate-horizontal-1”中實現:

接下來,我們來一個InfinityStar的文生圖和圖生視頻的聯動玩法。

首先來到“infinity-8b-generate”,輸入下圖中的提示詞來生成幾張圖片:

A hyper-detailed, ultra-realistic, cinematic portrait of a fluffy white Ragdoll cat with striking sapphire-blue eyes and long black eyelashes. The cat’s expression is calm, poised, and intensely self-assured — its gaze direct, steady, and dignified, conveying quiet confidence and elegant composure……

挑選一張比較滿意的圖像之后,我們再把圖片“喂”到“i2v-generate-horizontal-1”中,配上下面的提示詞來生成一段視頻:

The cat opened its mouth and made a sound, then licked its nose with its tongue.

通過類似的方法,你也可以快速生成各種風格、影視級的鏡頭:

包括各種運動場景中,人物的復雜動作也是能hold住:

另外,正如我們剛才提到的,作為原生自回歸模型,InfinityStar還支持交互式長視頻生成。

我們只需要先給一段5s的視頻,然后InfinityStar能夠接受新的提示詞,根據參考視頻和新的提示詞繼續往下生成:

為什么能比DiT快這么多?

InfinityStar的核心架構,是一個名叫時空金字塔建模的方法,這正是它能把圖像、視頻任務統一起來,并且比主流擴散模型快一個數量級的關鍵所在。

整體來看,InfinityStar借鑒了其前作(如VAR和Infinity)在空間維度上的下一尺度預測思想,并將其巧妙地擴展到時空維度;如此一來便彌補了傳統方法往往難以在單一模型中同時處理靜態圖像和動態視頻的問題。

其核心設計是將一個視頻分解為兩個部分。

1、首幀(外觀信息):

視頻的第一幀被視為一個獨立的圖像,采用與Infinity模型一致的圖像金字塔進行由粗到精的建模。這一步專門負責捕捉視頻的靜態外觀信息,如場景、物體和風格。

2、后續片段(動態信息):

首幀之后的視頻內容被切分為若干個連續的視頻片段(Clips)。這些片段金字塔在空間維度之外,額外引入了時間維度,專門負責捕捉視頻的動態變化,如運動軌跡和鏡頭變換。

通過這種“首幀 + 視頻片段”的分解策略,InfinityStar成功地將靜態外觀和動態信息解耦。所有這些金字塔內部(尺度之間)和金字塔之間(片段之間)的依賴關系,都由一個強大的時空自回歸Transformer進行建模。

最終,無論是生成圖像、生成視頻還是圖生視頻,所有任務都被統一為“預測下一個尺度/下一個片段”的自回歸問題,實現了架構的高度統一。

除了整體框架之外,InfinityStar還有兩個關鍵技術。

首先是高效的視覺分詞器。

為了讓Transformer能夠處理視覺信息,首先需要將圖像和視頻翻譯成離散的Token。InfinityStar為此訓練了一個基于多尺度殘差量化的視覺分詞器,并提出了兩項關鍵技術來克服訓練難題:

  1. 知識繼承 (Knowledge Inheritance)

訓練一個離散的視覺分詞器(Tokenizer)通常非常耗時。研究人員發現,相比于從零開始訓練,繼承一個已預訓練的連續視覺分詞器(如Video VAE)的結構和權重,能顯著加快離散分詞器的收斂速度,使其更快達到高保真度的重建水平。

 2. 隨機量化器深度 (Stochastic Quantizer Depth)

在視頻金字塔中,信息分布存在嚴重的“不均衡”問題:大部分細節信息集中在最后幾個精細尺度上,導致token數量相差幾十甚至上百倍。這會妨礙Transformer的學習,使其過度依賴后續尺度,而忽略了決定全局語義的早期尺度。

為此,InfinityStar引入了一種名為隨機量化器深度的正則化技術。在訓練時,隨機丟棄(Discard)后面精細尺度的Token,迫使模型在僅有前面粗糙尺度Token的情況下也能重建出有意義的信息。這使得信息在不同尺度上分布更均衡,顯著提升了模型的學習效率和最終的生成質量。

其次是優化的時空自回歸Transformer。

為了應對視頻生成帶來的新挑戰(如長上下文、時空依賴),InfinityStar對自回歸Transformer本身也進行了三項關鍵改進:

  1. 語義尺度重復 (Semantic Scale Repetition) 研究人員觀察到,金字塔中靠前的幾個尺度(語義尺度)控制著視頻的全局信息,如整體布局和運動趨勢。為了強化這一點,InfinityStar在預測時將這些語義尺度重復預測N次,允許模型對視頻的全局語義信息進行“反復修正”。這一簡單而有效的技巧,極大地增強了生成視頻在結構上的一致性和運動的流暢性。
  2. 時空稀疏注意力 (Spacetime Sparse Attention) 視頻生成,特別是長視頻,意味著極長的Token序列,這對注意力機制的計算和顯存是巨大的考驗。InfinityStar設計了一種高效的時空稀疏注意力,它只關注必要的上下文信息(如前一片段的最后一個尺度),從而在保持時間一致性的同時,大大降低了注意力的計算復雜度,使得高質量、長上下文的視頻生成成為可能。
  3. 時空RoPE位置編碼 (Spacetime RoPE) 為了讓模型精確感知Token在復雜時空金字塔中的位置,InfinityStar引入了增強版的RoPE位置編碼,它同時編碼尺度、時間、高度和寬度信息,為Transformer提供了精確的時空坐標感。

總結來看,InfinityStar之所以能做到比DiT快上一個數量級,關鍵在于DiT需要20–100步去噪迭代,而InfinityStar是純自回歸“一條過”生成;并且離散token+粗到精預測機制,大幅減少inference step數。

在如此方法之下,實驗結果顯示,在文生圖(T2I)任務上,InfinityStar在GenEval和DPG兩項基準上取得了優異的表現,尤其在位置、物體關系上展現出了明顯的優勢。

在文生視頻(T2V)任務上,InfinityStar在VBench基準上表現優秀,不僅顯著超越了先前所有的自回歸模型,甚至取得了比CogVideoX、HunyuanVideo等基于DiT的方法更好的成績。

在和HunyuanVideo的人類偏好評估中,InfinityStar-8B也取得了比HunyuanVideo-13B更好的效果,尤其是在指令遵循方面展現出了顯著的優勢。

在視頻生成的效率方面,InfinityStar的生成速度比同尺寸的基于DiT的方法(如HunyuanVideo、Wan-Video)快一個數量級,在單張GPU上生成一個5s 720p的視頻僅需不到1分鐘。

總而言之,字節的這篇論文證明了離散自回歸模型不僅能快,還能做到好,更是打破了只有擴散才能高清的迷思。

論文鏈接:
https://arxiv.org/pdf/2511.04675

代碼鏈接:https://github.com/FoundationVision/InfinityStar

申請體驗:http://opensource.bytedance.com/discord/invite

責任編輯:張燕妮 來源: 量子位
相關推薦

2025-11-12 08:49:00

AI視頻生成模型

2025-04-18 08:47:22

2017-03-30 19:28:26

HBase分布式數據

2020-05-21 19:46:19

區塊鏈數字貨幣比特幣

2018-06-26 05:23:19

線程安全函數代碼

2017-07-06 08:12:02

索引查詢SQL

2022-07-18 06:16:07

單點登錄系統

2018-07-31 16:10:51

Redo Undo數據庫數據

2017-02-21 13:00:27

LoadAverage負載Load

2017-07-25 08:05:04

公有云私有云混合云

2011-02-21 17:48:35

vsFTPd

2020-07-17 07:44:25

云計算邊緣計算IT

2020-07-09 07:37:06

數據庫Redis工具

2018-12-12 22:51:24

Java包裝語言

2016-09-12 17:28:45

云存儲應用軟件存儲設備

2024-06-18 12:31:34

模型生成

2020-06-11 08:04:12

WDMDWDMMWDM

2013-11-15 07:24:50

4G LTE圖解

2015-11-12 10:32:40

GitHub控制系統分布式

2018-03-27 09:28:33

緩存策略系統
點贊
收藏

51CTO技術棧公眾號

国产一区二区中文字幕| 国产视频久久久久| 麻豆免费网站| 国产日韩欧美激情| 精品国产麻豆免费人成网站| 色噜噜狠狠狠综合欧洲色8| 正在播放亚洲一区| 成人免费网站观看| 久久视频在线观看免费| 人人香蕉久久| 亚洲精品日韩av| 99热免费精品在线观看| 色乱码一区二区三区熟女| 成人美女视频在线看| 亚洲欧美久久久久| 国产精品免费99久久久| 国产成人av在线播放| 亚洲天堂一区二区三区四区| 日韩精品第一页| 91老师国产黑色丝袜在线| 国产一级粉嫩xxxx| 欧美日韩黄色影视| 日本另类视频| 国产精品羞羞答答| 日韩中文字幕不卡| 国产男女无遮挡| 国产一区二区三区四区二区| 国产精品看片资源| 日韩电影免费在线看| 日本老熟妇毛茸茸| 在线观看欧美黄色| 韩国成人在线| 91精品中文在线| 韩国女主播成人在线| www.男人的天堂| 9191久久久久久久久久久| 亚洲国产精品yw在线观看| 素人啪啪色综合| 国产精品成人一区| 老司机午夜精品| 欧美艹逼视频| 欧美mv日韩mv国产| 麻豆精品少妇| 日韩电影免费观看高清完整| 国产日本欧洲亚洲| huan性巨大欧美| 78m国产成人精品视频| 国产精品女主播一区二区三区| 日韩av一区二区在线| 久久丁香四色| 国内一区在线| 国产精品视频免费看| 黄色在线论坛| 992tv在线成人免费观看| 日韩午夜在线电影| 天天色综合社区| 亚洲成人激情在线| 国产精品传媒精东影业在线| 91视频 -- 69xx| 国产精品v一区二区三区| 亚洲午夜精品国产| 亚洲成av人片一区二区梦乃| 素人啪啪色综合| 蜜桃欧美视频| 亚洲高清不卡在线观看| 欧美美女福利视频| 欧美一区亚洲二区| 精品久久久视频| 国产视频一区二| 国产欧美日韩一区二区三区| 周于希免费高清在线观看| 成人免费网站在线观看| 久久综合久色欧美综合狠狠| 超碰97免费在线| 国产精品12| 亚洲视频在线观看一区| 免费日韩成人| 日本丰满大乳奶| 欧美成人国产一区二区| 欧美三级网页| 天堂电影在线| 久久免费视频网站| 95精品视频在线| 精品午夜一区二区| 欧洲人成人精品| 欧美电影《睫毛膏》| 韩国版免费三体| 久久人91精品久久久久久不卡| www.日本不卡| 男女啪啪999亚洲精品| 日本精品福利视频| 天天综合网久久| 欧美一级特黄a| 激情久久av一区av二区av三区| 丝袜连裤袜欧美激情日韩| 亚洲国产精品综合| 午夜影院日韩| 在线视频福利| 日本一区二区不卡| 国产精品国产三级国产| 涩爱av在线播放一区二区| 欧美在线视频导航| 国产精品久久久久aaaa| 日本一区二区在线| 7777精品伊人久久久大香线蕉最新版 | 色综合久久88| 成人深夜视频在线观看| www.日韩| 国产日本在线播放| 日韩在线观看免费av| 99精品视频在线播放观看| 91精品亚洲一区在线观看| 麻豆传传媒久久久爱| 欧美精品久久久久久久免费观看| 91精品福利观看| 最近免费观看高清韩国日本大全| 亚洲国产精品一区二区三区| 蜜乳av一区二区三区| 国产免费拔擦拔擦8x高清在线人 | 九九精品在线视频| 国产精品久久久久久久久动漫| 老汉色老汉首页av亚洲| 日本18视频网站| 精品免费在线视频| 日韩电影免费网站| 91看片在线观看| 水蜜桃一区二区三区| 亚洲欧美日韩视频一区| 久久久影视传媒| 成人在线免费小视频| 91福利在线视频| 26uuu成人| 九九久久久久99精品| 午夜不卡av在线| 日本sm残虐另类| 午夜视频在线观看精品中文| 在线观看视频你懂的| 亚洲每日更新| 91蜜臀精品国产自偷在线| 国产免费av国片精品草莓男男| 强伦女教师2:伦理在线观看| 最近免费中文字幕视频2019| 日本一区二区免费在线观看视频| 欧美女王vk| 午夜激情在线观看| 波多野结衣与黑人| 琪琪亚洲精品午夜在线| 欧美一区二区三区免费在线看 | 国产女教师bbwbbwbbw| 午夜久久资源| 91亚洲精品丁香在线观看| 日韩av电影免费播放| 91在线免费看| 综合国产在线观看| 国产又粗又大又爽的视频| 久久久影视精品| 欧美日韩1区| 国产精品天干天干在线综合| 夜夜嗨av一区二区三区网页| 亚洲线精品一区二区三区八戒| 成人h精品动漫一区二区三区| 亚洲日本欧美| 综合色中文字幕| 一区二区在线电影| 一区二区三区免费网站| 亚洲美女屁股眼交3| 亚洲欧洲av在线| 欧美三级视频在线| 丝瓜av网站精品一区二区| 国产美女精品视频免费播放软件| 欧美成人免费| 国产女大学生av| 99久热re在线精品视频| 亚洲人精选亚洲人成在线| 一本久久a久久精品亚洲| 久久九九全国免费| 久久se这里有精品| 国产精品xvideos88| 国产精品香蕉| 日韩新的三级电影| 麻豆影视国产在线观看| 三级ai视频| 国产极品粉嫩福利姬萌白酱| 日韩精品一线二线三线| 国产精品自在线| 久久免费少妇高潮久久精品99| 日韩精品在线视频美女| 欧美日韩亚洲综合一区| 亚洲永久免费视频| 亚洲国产精品成人综合| 国产九九视频一区二区三区| 性伦欧美刺激片在线观看| 日韩在线视屏| 国产精品久久久久久久久久白浆| 午夜不卡影院| 中文字幕中文字幕在线十八区 | 色播在线观看| 在线观看成人影院| 欧美午夜视频在线| 国产精品久久久久久久电影|