国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

相機(jī)運(yùn)動(dòng)誤差降低40%!DualCamCtrl:給視頻生成裝上「深度相機(jī)」,讓運(yùn)鏡更「聽(tīng)話」

人工智能 新聞
DualCamCtrl 提出了一種集成深度信息的雙分支視頻擴(kuò)散模型,實(shí)現(xiàn)了更精準(zhǔn)的相機(jī)控制視頻生成。

本研究的共同第一作者是來(lái)自于香港科技大學(xué)(廣州)EnVision Research 的張鴻飛(研究助理)和陳康豪(博士研究生),兩位研究者均師從陳穎聰教授。

你的生成模型真的「懂幾何」嗎?還是只是在假裝對(duì)齊相機(jī)軌跡?

當(dāng)前眾多視頻生成模型雖宣稱具備「相機(jī)運(yùn)動(dòng)控制」能力,但其控制信號(hào)通常僅依賴于相機(jī)位姿。雖近期工作通過(guò)逐像素射線方向(Ray Condition)編碼了運(yùn)動(dòng)信息,但由于模型仍需隱式推斷三維結(jié)構(gòu),本質(zhì)上仍缺乏對(duì)場(chǎng)景的顯式幾何理解。這一局限性導(dǎo)致了相機(jī)運(yùn)動(dòng)的不一致——模型受限于外觀與結(jié)構(gòu)兩種表征信息的耦合,無(wú)法充分捕捉場(chǎng)景的底層幾何特征。

鑒于上述挑戰(zhàn),來(lái)自香港科技大學(xué)、復(fù)旦大學(xué)等機(jī)構(gòu)的研究團(tuán)隊(duì)提出了一種全新的端到端幾何感知擴(kuò)散模型框架 DualCamCtrl。該研究針對(duì)現(xiàn)有方法在場(chǎng)景理解與幾何感知方面的不足,創(chuàng)新性地設(shè)計(jì)了一個(gè)「雙分支擴(kuò)散架構(gòu)」,能夠同步生成與鏡頭運(yùn)動(dòng)一致的 RGB 與深度序列。進(jìn)一步地,為實(shí)現(xiàn) RGB 與深度兩種模態(tài)的高效協(xié)同,DualCamCtrl 提出了語(yǔ)義引導(dǎo)互對(duì)齊機(jī)制(Semantic Guided Mutual Alignment),該機(jī)制以語(yǔ)義信息為指導(dǎo),在雙向的交互中實(shí)現(xiàn)了更好的模態(tài)融合。

這些設(shè)計(jì)使 DualCamCtrl 能夠更好地解耦外觀與幾何建模,從而生成更嚴(yán)格遵循指定相機(jī)軌跡的視頻。大量實(shí)驗(yàn)表明,DualCamCtrl 在相機(jī)運(yùn)動(dòng)一致性方面顯著優(yōu)于現(xiàn)有方法,相機(jī)運(yùn)動(dòng)誤差降低超過(guò) 40%。

  • 論文標(biāo)題: DualCamCtrl: Dual-Branch Diffusion Model for Geometry-Aware Camera-Controlled Video Generation
  • 項(xiàng)目主頁(yè):https://soyouthinkyoucantell.github.io/dualcamctrl-page/
  • 論文鏈接:https://www.arxiv.org/abs/2511.23127
  • Github 倉(cāng)庫(kù):https://github.com/EnVision-Research/DualCamCtrl
  • Huggingface 模型:https://huggingface.co/FayeHongfeiZhang/DualCamCtrl

雙分支幾何感知擴(kuò)散模型

總體而言,DualCamCtrl 巧妙地采用了 雙分支視頻擴(kuò)散框架(Dual Branch Video Diffusion Framework),其中一條分支負(fù)責(zé)生成 RGB 表示,另一條分支負(fù)責(zé)生成深度表示,兩種模態(tài)通過(guò)提出的 SIGMA 機(jī)制進(jìn)行融合。

該設(shè)計(jì)使得模型能夠從單張輸入圖像及其對(duì)應(yīng)深度圖中,同步推斷出視頻級(jí)別的 RGB 與深度隱空間表征(Latent Representation),不僅最大限度降低了模態(tài)間的相互干擾,更使深度信息得以貫穿整個(gè)視頻生成過(guò)程,實(shí)現(xiàn)連貫的幾何引導(dǎo)。

SIGMA 機(jī)制以及雙階段訓(xùn)練

在多模態(tài)可控視頻生成任務(wù)中,訓(xùn)練與融合策略是關(guān)鍵。DualCamCtrl 的核心設(shè)計(jì)正是基于這一認(rèn)識(shí),包含兩部分:一是提出 語(yǔ)義引導(dǎo)互對(duì)齊(SIGMA)融合機(jī)制,促進(jìn) RGB 與深度模態(tài)在生成過(guò)程中的有效協(xié)同;二是采用分階段訓(xùn)練策略——首階段學(xué)習(xí)解耦的多模態(tài)表征,次階段專(zhuān)注跨模態(tài)融合建模。

該設(shè)計(jì)使模型在復(fù)雜相機(jī)運(yùn)動(dòng)下,能同時(shí)保持外觀連貫與三維幾何準(zhǔn)確,實(shí)現(xiàn)幾何感知的可控生成。

語(yǔ)義引導(dǎo)互對(duì)齊機(jī)制

圖3. SIGMA融合策略的動(dòng)機(jī)與優(yōu)勢(shì)對(duì)比示意圖。

基于雙分支框架,RGB 分支與深度分支分別生成對(duì)應(yīng)的視頻序列和對(duì)應(yīng)深度序列。盡管兩者輸入相同,但它們獨(dú)立演化易導(dǎo)致輸出不一致,因此需要有效的融合與對(duì)齊策略(圖 3.a)。

然而該團(tuán)隊(duì)發(fā)現(xiàn):?jiǎn)蜗驅(qū)R(One-Way Alignment)易損失語(yǔ)義一致性,幾何引導(dǎo)對(duì)齊(Geometry-Guided Alignment)則過(guò)度強(qiáng)調(diào)幾何表征而破壞了運(yùn)動(dòng)的一致性。為此,該團(tuán)隊(duì)提出了 語(yǔ)義引導(dǎo)互對(duì)齊機(jī)制(SIGMA)

SIGMA 采用語(yǔ)義引導(dǎo)的雙向設(shè)計(jì):淺層以 RGB 特征錨定語(yǔ)義結(jié)構(gòu),深層則引入深度反饋優(yōu)化幾何表達(dá)。該方法基于兩個(gè) key insights(圖 3.b、3.c):

  • 語(yǔ)義優(yōu)先的重要性: 外觀特征應(yīng)在早期占主導(dǎo)地位以保持語(yǔ)義的穩(wěn)定,而深度信號(hào)作為后期補(bǔ)充來(lái)優(yōu)化幾何結(jié)構(gòu)。
  • 雙向交互的重要性: 兩分支相互反饋可避免單向?qū)R的失衡,實(shí)現(xiàn)更穩(wěn)定的隱空間表征對(duì)齊。

分階段訓(xùn)練策略

為實(shí)現(xiàn) RGB 與深度模態(tài)穩(wěn)健生成與有效協(xié)同的目標(biāo),DualCamCtrl 采用分階段訓(xùn)練策略(Two-stage training),為每個(gè)階段的學(xué)習(xí)設(shè)置不同側(cè)重點(diǎn):

  • 解耦訓(xùn)練階段(Decoupled Stage): 核心目標(biāo)是使 RGB 與深度分支分別專(zhuān)注學(xué)習(xí)外觀與幾何表征。為此,模型使用共享預(yù)訓(xùn)練權(quán)重初始化,并利用 state-of-the-art (SOTA) 視頻深度估計(jì)模型 Video Depth Anything 生成的深度特征進(jìn)行監(jiān)督。此階段禁止模態(tài)間交互,確保表征演化的獨(dú)立性。
  • 融合訓(xùn)練階段(Fusion Stage): 在兩個(gè)分支具備基礎(chǔ)能力后,核心目標(biāo)轉(zhuǎn)向?qū)崿F(xiàn)外觀與幾何信息的互補(bǔ)增強(qiáng)。為此,模型引入零初始化的融合模塊,逐步建立跨模態(tài)交互,并通過(guò)聯(lián)合優(yōu)化 RGB 與深度目標(biāo)函數(shù),實(shí)現(xiàn)多模態(tài)表征的對(duì)齊與協(xié)同。

圖2:兩階段訓(xùn)練的效果:?jiǎn)坞A段模型因無(wú)法充分收斂(上圖),導(dǎo)致其相機(jī)軌跡對(duì)齊效果欠佳(下圖)。這凸顯了先解耦學(xué)習(xí)外觀與幾何表征的兩階段策略的有效性。

實(shí)驗(yàn)結(jié)果

在定量和定性比較中,DualCamCtrl 在各項(xiàng)指標(biāo)上均顯著優(yōu)于當(dāng)前的 SOTA 方法。

定性分析:

在相同輸入條件下,DualCamCtrl 在相機(jī)運(yùn)動(dòng)的對(duì)齊效果和視頻生成的視覺(jué)效果上均顯著優(yōu)于現(xiàn)有先進(jìn)方法。圖中“+”標(biāo)記為視覺(jué)對(duì)比的定位參考點(diǎn)。

定量分析:

Image to Video 定量分析結(jié)果

Text to Video 定量分析結(jié)果

總結(jié)

DualCamCtrl 提出了一種集成深度信息的雙分支視頻擴(kuò)散模型,實(shí)現(xiàn)了更精準(zhǔn)的相機(jī)控制視頻生成。通過(guò)引入語(yǔ)義引導(dǎo)互對(duì)齊機(jī)制(SIGMA)與兩階段訓(xùn)練策略,該模型有效同步了 RGB 序列與深度序列的生成和融合,顯著增強(qiáng)了模型的幾何感知能力。實(shí)驗(yàn)表明,該方法在相機(jī)一致性誤差上比先前方法降低超過(guò) 40%,為相機(jī)控制視頻生成提供了新的技術(shù)思路,并有望推動(dòng)其他可控視頻生成任務(wù)的發(fā)展。

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2025-12-22 08:53:00

AI視頻生成模型

2025-07-24 08:30:00

2024-10-28 07:30:00

2025-03-27 09:24:16

2025-08-26 09:08:00

AI視頻生成模型

2025-01-09 12:33:52

2015-12-10 10:52:45

windows10CNTKCortana

2025-10-23 09:23:18

2025-09-26 09:12:49

AI模型視覺(jué)

2021-04-30 17:09:15

智能裝備

2025-08-21 09:02:00

2025-01-17 09:00:00

2023-11-27 08:21:49

Camera2API,

2023-04-03 10:04:44

開(kāi)源模型

2025-10-20 08:51:00

2017-03-26 16:12:21

華為智能聯(lián)網(wǎng)

2025-01-26 10:50:00

模型視頻生成

2025-08-07 07:56:52

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产剧情一区二区三区| 亚洲日本欧美日韩高观看| 亚洲一区 在线播放| 欧美69视频| 国产国产精品人在线视| 麻豆久久一区| 亚洲第一区第二区| 福利在线视频网站| 欧美日韩精品三区| 黄色网址在线播放| 亚洲你懂的在线视频| www.精品在线| 国产喂奶挤奶一区二区三区| 欧美色图另类小说| 91首页免费视频| 大肉大捧一进一出好爽视频| 国产精品1024| 丝袜人妻一区二区三区| 成人美女在线视频| 国产日韩亚洲欧美在线| 丁香激情综合国产| 99久久免费观看| av亚洲产国偷v产偷v自拍| 青青青在线视频播放| 久久人人爽爽爽人久久久| 日韩少妇内射免费播放18禁裸乳| ww亚洲ww在线观看国产| 性chinese极品按摩| 中文字幕日韩一区二区| 老鸭窝av在线| 日韩欧美aⅴ综合网站发布| 成人在线免费观看| 日韩欧美国产1| av资源亚洲| 日韩视频免费大全中文字幕| 亚洲视频一起| 国产精品免费网站| 伊人久久亚洲影院| 亚洲激情一区二区| av在线综合网| 毛片一级免费一级| 日韩人在线观看| 制服丝袜在线播放| 亚洲欧美制服另类日韩| 国产精品一区二区精品视频观看| 欧美第一页在线| 色综合久久一区二区三区| 国产亚洲欧美一区二区三区| 日韩精品高清不卡| 国产欧美在线一区| 亚洲成人av中文| caoporm免费视频在线| 揄拍成人国产精品视频| 亚洲精品aⅴ| 国产精品久久久久久久久久| 一区二区激情| 日本不卡在线观看视频| 一区二区三区波多野结衣在线观看 | 国产精品久久久久久久免费软件| 亚洲一区三区| 久久久蜜桃精品| 在线免费观看色| 精品国精品自拍自在线| 日韩精品一区国产| 3d蒂法精品啪啪一区二区免费| 日韩经典中文字幕一区| 美女黄色片视频| 在线视频欧美精品| 久久亚洲精品爱爱| 91中文在线观看| 粉嫩久久99精品久久久久久夜| 免费看成人a| 日韩av中文字幕在线播放| 在线亚洲a色| 一区二区不卡在线视频 午夜欧美不卡' | 国产黄色影视| 亚洲成人黄色网| 日韩大片在线免费观看| 欧美一区亚洲二区| 国产精品不卡在线观看| 麻豆蜜桃在线| 国产精品第三页| 岛国一区二区三区| 国产51人人成人人人人爽色哟哟| 久久精品视频网站| 一本一道久久综合狠狠老精东影业| 国产成人av影视| 精品美女在线播放| 欧美美女视频| 久久av综合网| 欧美人体做爰大胆视频| 欧美电影在线观看完整版| 亚洲精品国产一区| 亚洲午夜一区二区| 成人黄色理论片| 天天爽天天狠久久久| 五月婷婷色综合| 欧美另类中文字幕| 欧美亚洲国产免费| 亚洲一区在线视频观看| 日韩国产91| 亚洲一区二区精品在线观看| 欧美色播在线播放| 国产精品18hdxxxⅹ在线| 日韩免费av电影| 一本大道久久a久久精品综合| 99亚洲乱人伦aⅴ精品| 日韩欧美一级在线| 91精品国产综合久久精品| 日韩精品免费一区二区三区| 黄色国产小视频| 亚洲性视频网址| 视频一区中文字幕| 午夜在线小视频| 3d动漫精品啪啪一区二区三区免费| 国产精品私房写真福利视频| 国产精品成人国产| 最新中文字幕久久| 欧美成人猛片aaaaaaa| 国产精品hd| 黄色片在线免费观看| 91免费精品视频| 黄色精品在线看| 久久免费大视频| 性视频在线播放| 国产精品久久97| 一区二区久久久久| 亚洲人成网77777色在线播放 | www亚洲精品| 国产sm精品调教视频网站| 爱啪啪综合导航| 五月婷婷一区| 精品99一区二区| 免费成人在线观看| 色www永久免费视频首页在线| 国语精品中文字幕| 欧美日韩国产高清一区二区| 狠狠综合久久| 老司机福利在线视频| 国内一区在线| 欧美一区二区三区四区五区| 日韩电影在线一区二区| 69av成人| 高清欧美精品xxxxx| 欧美成年人视频| 亚洲视频一区在线| 久久国产中文字幕| chinese偷拍一区二区三区| 久久影院理伦片| 国产视频在线一区二区| 99久久免费视频.com| 国产精品白浆| 小明精品国产一区二区三区| 91亚洲精品丁香在线观看| 91精品国产色综合久久不卡电影| 日本欧美一区二区在线观看| 日韩中文视频| aaa免费看大片| 国产精品制服诱惑| 日韩黄在线观看| 91美女视频网站| 亚洲区小说区图片区qvod| 久久经典视频| 性做爰过程免费播放| 欧美高清第一页| 日韩欧美亚洲成人| 麻豆国产精品777777在线| 亚洲综合伊人| 日韩加勒比系列| 久久精品二区| 日韩中文字幕免费看| 自拍偷拍国产精品| 亚洲高清毛片| 天堂久久一区| 色久视频在线播放| 干日本少妇视频| 国产成人av在线| 91精品国产一区二区三区蜜臀| 成人av在线一区二区三区| 国产精品中文字幕亚洲欧美| av免费在线观看网址| 少妇人妻互换不带套| 国产成人精品日本亚洲11| 亚洲欧美精品在线| 亚洲一区二区三区在线看| 欧美aaa在线| 国产欧美日韩一区二区三区四区 | 欧美二区在线| 欧美久久精品一级黑人c片| 欧美丝袜第一区| 粉嫩av一区二区三区| 色天天久久综合婷婷女18| 成人av观看| 一二三区在线视频| 台湾无码一区二区| 91网站在线看| 久久视频在线播放| 91麻豆精品国产91久久久资源速度| 久久久99免费| 日韩高清不卡一区|