国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律

發布于 2024-8-5 09:13
瀏覽
0收藏

目前,擴散模型能夠生成多樣化且高質量的圖像或視頻。此前,視頻擴散模型采用 U-Net 架構 ,主要側重于合成有限時長(通常約為兩秒)的視頻,并且分辨率和縱橫比受到固定限制。


Sora 的出現打破了這一限制,其采用 Diffusion Transformer(DiT)架構,不僅擅長制作 10 到 60 秒的高質量視頻,而且還因其生成不同分辨率、各種縱橫比、且遵守實際物理定律的能力而脫穎而出。


可以說 Sora 是 DiT 架構最有利的證明,然而,基于 Transformer 的擴散模型在有效生成可控動作視頻方面還未被充分探索。


針對這一問題,來自阿里的研究者提出了 Tora,這是第一個面向軌跡的 DiT 架構,它將文本、視覺和軌跡條件同時集成在一起以生成視頻。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


Tora 的設計與 DiT 的可擴展性無縫契合,允許精確控制具有不同持續時間、寬高比和分辨率的視頻內容。大量實驗證明,Tora 在實現高運動保真度方面表現出色,同時還能細致模擬物理世界的運動。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


  • 論文地址:https://arxiv.org/pdf/2407.21705
  • 論文主頁:https://ali-videoai.github.io/tora_video/
  • 論文標題:Tora: Trajectory-oriented Diffusion Transformer for Video Generation


一艘老式的木制帆船沿著規定好的路線在迷霧籠罩的河流上平穩地滑行,周圍是茂密的綠色森林。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


一條鯽魚優雅地游過火星的紅色巖石表面,魚的軌跡向左,火星的軌跡向右。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


熱氣球沿著不同的軌跡升入夜空,一個沿著規定的斜線,另一個沿著有彎度的軌跡。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


兩只可愛的小貓并排走在寧靜的金色沙灘上。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


氣泡沿著軌跡輕輕地漂浮在盛開的野花中。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


楓葉在清澈的湖面上顫動,映照著秋天的森林。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


山間的瀑布傾瀉而下,主題、背景的運動都可以按照不同的路線運動。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


在 Tora 與其他方法的比較中,可以看出 Tora 生成的視頻流暢度更高,更遵循軌跡,且物體不會存在變形的問題,保真度更好。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區

方法介紹

Tora 采用 OpenSora 作為其 DiT 架構的基礎模型,包含一個軌跡提取器 (TE,Trajectory Extractor)、時空 DiT(Spatial-Temporal DiT )和一個運動引導融合器 (MGF,Motion-guidance Fuser) 。TE 使用 3D 視頻壓縮網絡將任意軌跡編碼為分層時空運動 patch。MGF 將運動 patch 集成到 DiT 塊中,以生成遵循軌跡的一致視頻。圖 3 概述了 Tora 的工作流程。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區

時空 DiT(ST-DiT)

ST-DiT 架構包含兩種不同的塊類型:空間 DiT 塊 (S-DiT-B) 和時間 DiT 塊 (T-DiT-B),它們交替排列。S-DiT-B 包含兩個注意力層,每個層按順序執行空間自注意力 (SSA) 和交叉注意力,后面跟著一個逐點前饋層,用于連接相鄰的 T-DiT-B 塊。T-DiT-B 僅通過用時間自注意力 (TSA) 替換 SSA 來修改此架構,從而保持架構一致性。在每個塊中,輸入在經過規范化后,通過跳躍連接連接回塊的輸出。通過利用處理可變長度序列的能力,去噪 ST-DiT 可以處理可變持續時間的視頻。

軌跡提取器

軌跡已被證明是一種更加用戶友好的方法來控制生成視頻的運動。然而,DiT 模型采用視頻自編碼器和 patch 化過程將視頻轉換為視頻 patch。在這里,每個 patch 都是跨多個幀導出,因此直接采用幀間偏移是不合適的。為了解決這個問題,本文提出的 TE 將軌跡轉換為運動 patch,運動 patch 與視頻 patch 位于相同的潛在空間。

運動引導融合器

為了將基于 DiT 的視頻生成與軌跡結合起來,本文探索了三種融合架構變體,將運動 patch 注入每個 ST-DiT 塊。這些設計如圖 4 所示。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區

實驗結果

在實現細節上,研究者基于 OpenSora v1.2 權重來訓練 Tora。訓練視頻的分辨率由 144p 到 720p 不等。為了平衡訓練 FLOP 以及每次迭代不同分辨率和幀數所需的內存,研究者相應地將批大小從 1 調整到 25。


至于訓練基礎設施,研究者使用了 4 塊英偉達 A100 和 Adam 優化器,學習率為 2 × 10^?5。


研究者將 Tora 與流行的運動指導視頻生成方法進行了比較。評估中使用了三種設置,分別為 16、64 和 128 幀,所有設置都是 512×512 的分辨率。


結果如下表 1 所示,在 U-Net 方法常用的 16 幀設置下,MotionCtrl 和 DragNUWA 能夠更好地與所提供的軌跡實現對齊,但仍弱于 Tora。隨著幀數增加,U-Net 方法在某些幀中出現明顯偏差,并且錯位誤差傳播會導致后續序列中出現變形、運動模糊或物體消失。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區


相比之下,得益于集成了 Transformer 的縮放能力,Tora 對幀數變化表現出很高的穩健性。Tora 產生的運動更加流暢,且更符合物理世界。對于 128 幀測試設置下的評估,Tora 的軌跡精度達到其他方法的 3 到 5 倍,展現出了卓越的運動控制能力。


在下圖 5 中,研究者對不同分辨率和持續時長的軌跡誤差進行分析。結果顯示,不同于 U-Net 隨時間推移出現明顯的軌跡誤差,Tora 的軌跡誤差隨時間推移出現漸進增加。這與 DiT 模型中視頻質量隨時間增加而下降相一致。Tora 在更長的時間下保持了有效的軌跡控制。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區

下圖 6 展示了 Tora 與主流運動控制方法的比較分析,在包含兩人共同運動的場景中,所有方法都能生成相對準確的運動軌跡。不過,Tora 的視覺質量更好,這要歸功于更長序列幀的使用,有助于實現更平滑的運動軌跡和更逼真的背景渲染。


可以看到,在 Tora 生成的自行車場景中,人的雙腿表現出逼真的踩踏動作,而 DragNUWA 的雙腿幾乎水平漂浮,違反了物理真實性。此外,DragNUWA 和 MotionCtrl 在視頻結尾處都出現了嚴重的運動模糊。


在另一個生成燈籠的場景中,DragNUWA 隨著所提供軌跡的持續升降出現了嚴重的變形。MotionCtrl 的軌跡雖然相對準確,但生成的視頻與兩個燈籠的描述不相符。Tora 不僅嚴格地遵循了軌跡,而且最大程度地減少了物體變形,確保了更高保真度的動作表示。


阿里「軌跡可控版Sora」,告別「抽卡」,讓視頻生成更符合物理規律-AI.x社區

更多技術細節和實驗結果請參閱原論文。


本文轉自 機器之心,作者:機器之心


原文鏈接:??https://mp.weixin.qq.com/s/GMN9lsFsM-5uMabStLoKEQ??

收藏
回復
舉報
回復
相關推薦
国产三级一区二区三区| 91国产在线播放| 亚洲精品自在久久| wwwxxx黄色片| 国产日韩欧美激情| 五月天久久综合网| 久久久精品综合| 久久免费看毛片| 国产亚洲精彩久久| 亚洲欧美日韩国产中文专区| 曰本三级在线| jizz一区二区| 无码内射中文字幕岛国片| 日韩av中文字幕一区二区三区 | 久久a爱视频| 国产午夜久久久久| 97cao在线| 日本亚洲欧美天堂免费| 国产日韩欧美制服另类| 天天综合色天天综合色hd| 成人情趣视频网站| 欧美xxxx做受欧美| 国产精品xxx| 亚洲精品视频久久| 男女免费观看在线爽爽爽视频| 欧美视频免费在线| 一级免费视频| 国产精品久久久久久久久免费相片| 国产日韩av网站| 福利一区福利二区| 美女黄色免费看| 国产成人精品免费看| 99久久久精品视频| 大胆亚洲人体视频| 精品无码国产一区二区三区av| 麻豆精品在线观看| 亚洲精品偷拍视频| 国产黄色成人av| 国产91沈先生在线播放| 国产精品亚洲一区二区三区妖精| 在线一区日本视频| 国产精品一区二区无线| 成人免费观看在线| 2023国产精品视频| 91在线视频观看免费| 国产精品传媒入口麻豆| 黄色免费看网站| 亚洲午夜视频在线| 国内精品一区视频| 91精品福利在线一区二区三区| 在线电影福利片| 亚洲精品中文字幕有码专区| 蜜臀久久精品| 精品国产欧美一区二区五十路| 成人污污视频| 91爱爱小视频k| 精品美女久久久| 91午夜理伦私人影院| 欧美激情91| 欧美午夜精品久久久久久蜜| 美女视频一区在线观看| 霍思燕三级露全乳照| 国产日韩精品一区| 在线免费91| 精品免费视频一区二区| 成人亚洲免费| 97精品在线视频| 欧美女激情福利| 日韩午夜视频在线观看| a美女胸又www黄视频久久| 东北一级毛片| 制服丝袜一区二区三区| 欧美www.| 奇门遁甲1982国语版免费观看高清| 欧美日韩在线播放视频| 久久久久久久久久久久久久久久av| 捆绑调教一区二区三区| 性欧美极品xxxx欧美一区二区| 亚洲国产视频直播| 日本三级韩国三级欧美三级| xvideos成人免费中文版| 精品亚洲成人| 日韩aⅴ视频一区二区三区| 99久久综合国产精品| 一级日本免费的| 欧美v日韩v国产v| 97se亚洲| 国产在线精品日韩| 成人激情文学综合网| 欧美变态视频| 日韩精品视频免费专区在线播放| 国产毛片久久久| 欧美区高清在线| 欧美激情在线看| 黄网站在线免费| 91精品国产91久久久久久久久| 免费在线亚洲欧美| 亚洲天堂2018av| 精品国产污网站| 欧美理论视频| 天堂av免费看| 欧美日韩中文在线| 国内自拍亚洲| 国产精品乱子乱xxxx| 久久久www成人免费无遮挡大片| 国产在线三区| 欧美极品少妇与黑人| 国产精品毛片一区二区三区| 久热精品在线播放| 亚洲成人精品久久久| 欧美午夜精彩| 国产日产欧美视频| 欧美一区二区三区日韩| 亚洲资源网你懂的| 亚洲色欲久久久综合网东京热| 在线观看网站黄不卡| 精品国内亚洲2022精品成人| 亚洲综合欧美日韩| 色噜噜久久综合| 你懂的在线观看一区二区| 国产欧美自拍视频| 欧美三级午夜理伦三级中视频| 欧美丝袜美腿| 99热亚洲精品| 日韩欧美在线综合网| 亚洲成av人电影| 在线观看成人网| 国产亚洲视频中文字幕视频| 亚洲精品欧洲| 最新中文字幕在线观看| 九九久久久久99精品| 国内国产精品久久| 国产理论在线观看| 91日本在线视频| 亚洲不卡一区二区三区| 国内自拍欧美| 久久久久国产精品熟女影院| 亚洲欧美一区二区三区久久| 久久狠狠一本精品综合网| 国产一级免费在线观看| 成人精品一区二区三区| 亚洲精品日日夜夜| 亚洲激情77| 捆绑紧缚一区二区三区在线观看| 久久资源免费视频| 91麻豆蜜桃一区二区三区| 欧美中文字幕精在线不卡| 400部精品国偷自产在线观看 | 日本在线观看高清完整版| 成人在线激情视频| 亚洲欧美激情插| ccyy激情综合| 日韩肉感妇bbwbbwbbw| 欧美理论电影在线观看| 91在线观看高清| 日本亚洲欧洲无免费码在线| 无罩大乳的熟妇正在播放| x99av成人免费| 日本一区二区综合亚洲| 久久91在线| 992tv成人国产福利在线| 国产精品综合网站| 狠狠躁夜夜躁人人爽超碰91| 欧美成人嫩草网站| www 日韩| 欧美日韩亚洲一区二区三区四区| 777午夜精品视频在线播放| 久久av最新网址| 欧美无毛视频| 国产精品久久久久9999小说| 国产91精品不卡视频| 精品久久中文字幕久久av| 亚洲三级网站| 日韩伦理在线| 久久久免费视频网站| 高清欧美性猛交xxxx| 亚洲成人你懂的| 一本久道综合久久精品| 欧美巨大丰满猛性社交| 精品人妻一区二区三区四区在线 | 午夜综合激情| 波多野结衣在线播放| 国产免费内射又粗又爽密桃视频| 色老头一区二区三区| 国产精品入口麻豆原神| 首页国产精品| fc2ppv国产精品久久| 成人一级生活片| 欧洲亚洲女同hd| 91精品国产福利在线观看 | 国产精品久久久久久超碰| 91国内精品野花午夜精品| 日韩制服丝袜先锋影音| 欧美亚洲黄色| 噼里啪啦在线中文观看| 欧美日韩精品免费看| 久久手机免费视频| 色综合欧美在线视频区| 国产精品一二三四| 欧美亚洲激情|