国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

理想汽車最新!DiVE:擴散模型+Vit的高保真、時間一致的視頻生成

人工智能 智能汽車
今天為大家分享一篇哈工大、理想汽車與清華大學等團隊出品的工作:基于DiT的視頻生成與增強控制!

本文經自動駕駛之心公眾號授權轉載,轉載請聯系出處。

原標題:DiVE: DiT-based Video Generation with Enhanced Control

論文鏈接:https://arxiv.org/pdf/2409.01595

項目鏈接:https://liautoad.github.io/DIVE/

代碼鏈接:https://github.com/LiAutoAD/DIVE

作者單位:哈爾濱工業大學(深圳) 理想汽車 清華大學 Westlake University 新加坡國立大學

圖片圖片

論文思路:

在自動駕駛場景中生成高保真、時間一致性的視頻面臨著顯著的挑戰,例如在極端情況(corner cases)下的問題操作(problematic maneuvers)。盡管最近提出了一些視頻生成工作來解決上述問題,例如基于 Diffusion Transformers(DiT)的模型,但仍然缺乏專門探索多視角視頻生成潛力的研究。值得注意的是,本文提出了首個基于DiT的框架,專門設計用于生成與給定鳥瞰圖布局控制精確匹配的時間和多視角一致性視頻。具體而言,所提出的框架利用無參數的 spatial view-inflated attention 來保證跨視角一致性,其中集成了 joint cross-attention modules 和ControlNet-Transformer 以進一步提高控制的精度。為了展示本文的優勢,本文在nuScenes數據集上進行了廣泛的定性比較,特別是在一些最具挑戰性的極端情況下。總的來說,本文提出的方法在困難條件下生成長時間、可控且高度一致性視頻方面被證明是有效的。

論文設計:

鳥瞰視角(Bird’s-Eye-View, BEV)感知在自動駕駛中引起了極大的關注,突顯了其在3D目標檢測等任務中的巨大潛力。最近的方法如StreamPETR 利用多視角視頻進行訓練,強調了廣泛且良好標注的數據集的必要性。然而,在各種條件下收集和標注此類數據具有挑戰性且成本高昂。為了解決上述挑戰,生成模型的最新進展表明,合成數據可以有效地提高目標檢測和語義分割等各種任務的性能。

由于時序數據在視頻中的參與在相關感知任務中起著至關重要的作用,本文的重點轉向生成高質量的真實感視頻。實現現實世界的逼真度需要高視覺質量、跨視角和時間一致性以及精確的可控性。值得注意的是,最近方法的潛力受到限制,原因包括低分辨率、固定縱橫比以及物體形狀和顏色的不一致性。受Sora在生成高質量、時間一致性視頻任務中成功表現的啟發,本文在工作中采用 Diffusion Transformer (DiT) 進行可控的多視角視頻生成。

本文提出的框架是首批在駕駛場景中使用 DiT 進行視頻生成的工作之一,通過整合 BEV 布局和場景文本,實現了精確的內容控制。基于OpenSora架構,本文的方法嵌入了 joint cross-attention modules ,以管理來自鳥瞰視角的場景文本和實例布局。擴展ControlNet-Transformer方法以適應道路草圖,本文通過無參數的 spatial view-inflated attention 確保多視角一致性。為了支持多分辨率生成、更快的推理以及不同的視頻長度,本文采用了OpenSora的訓練策略,并引入了一種新穎的無分類器指導技術,以增強控制和視頻質量。

圖片圖1. 本文提出的方法中每個獨立組件的結構實現。

本文的模型總體架構如圖1所示。采用OpenSora 1.1提出的參數模型作為基線模型。為了實現對前景和背景信息的精確控制,本文將通過投影從3D幾何數據中提取的布局條目和道路草圖整合到布局條件視頻生成過程中。本文提出的新模塊和訓練策略將在接下來的部分中分別介紹。

多條件時空DiT

Caption-Layout Joint Cross-Atttention. 按照MagicDrive的方法,本文使用交叉注意力機制來整合場景描述(scene captions)和布局條目(layout entries)。布局條目(即實例的詳細信息,如2D坐標、朝向和ID)經過傅里葉編碼后合并為一個統一的嵌入。實例標題則使用預訓練的CLIP模型進行編碼。這些嵌入被連接并通過一個多層感知器(MLP)處理,生成最終的布局嵌入,該嵌入與場景描述嵌入一起作為交叉注意力機制的條件。

ControlNet-Transformer。深入細節,本文引入了ControlNet-Transformer,以確保對道路草圖控制的精確性,靈感來自PixArt-δ。實際上,一個預訓練的變分自編碼器(VAE)從道路草圖中提取潛在特征,這些特征然后通過 3D patch embedder 處理,以確保與本文主網絡的一致性。為了參數化本文提到的設計,本文將13個重復塊(duplicated block)與DiT架構的前13個基礎塊集成。每個重復塊結合了道路草圖特征和基礎塊輸出,使用空間自注意力來減少計算開銷。

訓練

可變分辨率和幀長度。遵循OpenSora的做法,本文采用了Bucket策略,以確保每個批次中的視頻具有一致的分辨率和幀長度。

Rectified Flow。受OpenSora 1.2的啟發,本文在后期訓練階段用校正流替代了IDDPM,以提高穩定性并減少推理步驟。校正流是一種基于 ODE 的生成模型,其定義了數據和正態分布之間的前向過程如下:

圖片

圖片

損失僅在未掩碼的幀上計算。在推理過程中,視頻以自回歸方式生成,前一個片段的最后k幀作為下一個片段的條件。

圖片

實驗結果:

圖片圖2. 本文的模型與MagicDrive生成的多視角視頻的定性比較。圖片

圖3. 場景編輯的使用案例。圖片表1. 與MagicDrive的定量比較。DTC、CTC和IQ分別代表DINO時間一致性、CLIP時間一致性和圖像質量。最佳表現以粗體顯示。

總結:

本文提出了首個針對駕駛場景的基于DiT的可控多視角視頻生成模型。通過整合 ControlNet-Transformer 和 joint cross-attention ,實現對 BEV 布局的精確控制。Spatial view-inflated attention 結合全面的訓練和推理策略,確保了高質量和一致性的視頻生成。與MagicDrive的比較和各種可視化進一步展示了該模型在生成視頻中的卓越控制和一致性。

責任編輯:張燕妮 來源: 自動駕駛之心
相關推薦

2025-01-22 10:30:00

圖像生成模型AI

2024-06-07 09:15:48

2025-03-20 09:20:00

2025-05-06 09:41:06

2025-06-13 14:13:26

3D場景生成模型

2025-04-02 08:50:00

AI視頻生成

2025-07-14 08:51:00

2025-05-16 13:18:37

2025-07-21 09:03:00

模型AI訓練

2023-10-11 12:32:26

模型訓練

2024-04-03 14:11:49

模型訓練

2025-03-03 08:32:00

模型AI訓練

2024-11-26 09:43:37

2024-06-04 09:52:25

2023-01-09 13:18:59

AI

2025-08-20 07:06:23

2023-04-03 10:04:44

開源模型

2023-06-13 09:33:37

視頻阿里巴巴

2024-01-22 08:59:00

AI
點贊
收藏

51CTO技術棧公眾號

成人中文字幕+乱码+中文字幕| 久久久久久美女精品| 国产成人精品影视| 国产亚洲精品一区二区| 最近中文字幕在线| 国产剧情一区在线| 欧美少妇一区| 99视频精品| 超碰97在线播放| 欧美日本一区| 97在线中文字幕| 久久综合福利| 欧美日韩ab| 91在线精品播放| 91精品一区二区三区综合| 国产精品观看在线亚洲人成网| 欧美激情影院| 国内自拍欧美激情| 成人h动漫免费观看网站| 久青草国产97香蕉在线视频| 99久久婷婷国产综合精品首页| 亚洲激情视频在线播放| 色戒汤唯在线观看| 亚洲欧美日本精品| 91av亚洲| 一区二区三欧美| 欧美特黄色片| 久久91亚洲精品中文字幕| 亚洲小说春色综合另类电影| 色在人av网站天堂精品| 网红女主播少妇精品视频| 日本高清+成人网在线观看| 欧美美女一区| 亚洲一区中文字幕| 久久精品一区二区国产| 亚洲国产精品影视| 99久久国产综合精品麻豆| 天天色综合社区| 亚洲线精品一区二区三区| 可以在线观看的av网站| 日韩欧美国产不卡| 国产精品久久久久久久久久齐齐| 欧美成人在线免费视频| 国产欧美日韩一区二区三区四区| 成人黄色免费网站在线观看| 欧美视频亚洲视频| 亚洲第一综合| 国产午夜精品美女毛片视频| 黄色av免费| 欧美精品久久99| 69堂精品视频在线播放| 欧美精品性视频| 伊人电影在线观看| 91精品国产综合久久精品| 91麻豆天美传媒在线| 97精品久久久久中文字幕| а√最新版在线天堂| 91精品福利在线| 欧美伦理免费在线| 美女精品久久久| 四季av一区二区三区免费观看 | 久久国产精品成人免费观看的软件| 亚洲综合中文字幕在线观看| 麻豆成人91精品二区三区| 久久国产精品国产精品| 精品视频91| 91在线免费看片| 高清不卡一二三区| 免费看成年人视频在线观看| 日韩精品一区二区在线| 国产欧美日韩电影| 国产精品久久久久久久久婷婷| 国产精品主播直播| 在线国产视频| 波霸ol色综合久久| 欧美精品日本| 无限资源日本好片| 精品国产成人系列| 国产一区二区观看| 国产一线二线三线女| 日韩欧美999| 香蕉免费一区二区三区在线观看| 国产三区二区一区久久| 国产欧美日韩卡一| 青青草原av在线| 国产精品露脸av在线| jizz一区二区| av网站大全在线| 成人久久久久久| 国产精品日韩成人| 国产韩日精品| 午夜精品一区二区三区四区 | 国产四区在线观看| 欧美视频国产精品| 永久免费精品视频| 亚洲综合av一区| 91福利资源站| 日韩在线黄色| 欧美成人一区二区在线观看| 欧美日本一区二区| 欧美日韩大片免费观看| 国产精品无码免费专区午夜| 欧美在线三级电影| 蜜桃一区av| 国产精品又粗又长| 日韩欧美中文字幕制服| 婷婷综合视频| www.99热.com| 久久久成人精品视频| 精品一区二区三区在线播放| 米奇777四色精品人人爽| 中文一区二区在线观看| 一区二区三区视频国产日韩| 韩国国内大量揄拍精品视频| www.av亚洲| 外国电影一区二区| 熟妇熟女乱妇乱女网站| 日韩视频免费观看高清在线视频| 一区二区三区午夜探花| h短视频大全在线观看| 欧美精品性视频| 97se亚洲国产综合自在线不卡| 日韩成人动漫| 手机成人av在线| 精品久久人人做人人爰| 久久精品免费| 色影视在线观看| 国语精品免费视频| 欧美三级韩国三级日本三斤| 伊人色**天天综合婷婷| 中午字幕在线观看| 国产精品一区av| 午夜视频在线观看一区二区三区| 九色精品91| 翔田千里一区| 国产精华一区二区三区| 欧美精品丝袜久久久中文字幕| 亚洲午夜一区| 哥也色在线视频| 日本高清久久一区二区三区 | 少妇精品放荡导航| 国产精品丝袜久久久久久不卡| 亚洲精品亚洲人成人网| 国模吧精品视频| 在线免费观看黄色片| av一区观看| 精品少妇一区二区三区日产乱码| 激情伊人五月天久久综合| 国产激情欧美| 97福利电影| 91久久嫩草影院一区二区| 91福利精品第一导航| 天堂精品中文字幕在线| 神马久久资源| 在线看的黄色网址| 国产精品中文在线| 正在播放亚洲一区| 国产成人在线色| 久9re热视频这里只有精品| 91成人福利在线观看| 成人h视频在线观看| 日韩视频免费观看高清完整版在线观看 | 免费无码不卡视频在线观看| 久热在线中文字幕色999舞| 国产精品久久久久aaaa| 91精品国产调教在线观看| 影音先锋在线播放| 日韩精品一区二区三区电影| 欧美wwwxxxx| 亚洲成人动漫在线观看| 亚洲福利精品| 欧美不卡高清一区二区三区| 日韩日韩日韩日韩日韩| 五月天电影免费在线观看一区| 美女欧美视频在线观看免费 | 亚洲午夜国产成人av电影男同| 91精品国产综合久久久久久久 | 不卡中文字幕av| 国产精品久久久久久久久快鸭| 久久久久久久久丰满| 黄网站在线免费看| 久久久999视频| 91久久精品国产91久久性色| 日韩毛片在线看| 亚洲精品国产品国语在线app| 亚洲毛片在线| 麻豆一区在线| 色大18成网站www在线观看| 99re在线视频免费观看| 99se婷婷在线视频观看| 色婷婷**av毛片一区| 日韩欧美中文在线| 91在线国产观看| 国产精品毛片在线看| 精品国产导航| 中文在线中文资源| 免费在线观看污视频| 老司机午夜av| 亚洲一区在线直播| 99三级在线|