国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

時間、空間可控的視頻生成走進現實,阿里大模型新作VideoComposer火了

人工智能 新聞
阿里巴巴和螞蟻集團的研究團隊率先做出嘗試并提出了 VideoComposer,即通過組合式生成范式同時實現視頻在時間和空間兩個維度上的可控性。

在 AI 繪畫領域,阿里提出的 Composer 和斯坦福提出的基于 Stable diffusion 的 ControlNet 引領了可控圖像生成的理論發展。但是,業界在可控視頻生成上的探索依舊處于相對空白的狀態。

相比于圖像生成,可控的視頻更加復雜,因為除了視頻內容的空間的可控性之外,還需要滿足時間維度的可控性。基于此,阿里巴巴和螞蟻集團的研究團隊率先做出嘗試并提出了 VideoComposer,即通過組合式生成范式同時實現視頻在時間和空間兩個維度上的可控性。

圖片

  • 論文地址:https://arxiv.org/abs/2306.02018
  • 項目主頁:https://videocomposer.github.io

前段時間,阿里巴巴在魔搭社區和 Hugging Face 低調開源了文生視頻大模型,意外地受到國內外開發者的廣泛關注,該模型生成的視頻甚至得到馬斯克本尊的回應,模型在魔搭社區上連續多天獲得單日上萬次國際訪問量。

圖片


圖片

Text-to-Video 在推特

VideoComposer 作為該研究團隊的最新成果,又一次受到了國際社區的廣泛關注。


圖片


圖片


圖片

VideoComposer 在推特

事實上,可控性已經成為視覺內容創作的更高基準,其在定制化的圖像生成方面取得了顯著進步,但在視頻生成領域仍然具有三大挑戰:

  • 復雜的數據結構,生成的視頻需同時滿足時間維度上的動態變化的多樣性和時空維度的內容一致性;
  • 復雜的引導條件,已存在的可控的視頻生成需要復雜的條件是無法人為手動構建的。比如 Runway 提出的 Gen-1/2 需要依賴深度序列作條件,其能較好的實現視頻間的結構遷移,但不能很好的解決可控性問題;
  • 缺乏運動可控性,運動模式是視頻即復雜又抽象的屬性,運動可控性是解決視頻生成可控性的必要條件。

在此之前,阿里巴巴提出的 Composer 已經證明了組合性對圖像生成可控性的提升具有極大的幫助,而 VideoComposer 這項研究同樣是基于組合式生成范式,在解決以上三大挑戰的同時提高視頻生成的靈活性。具體是將視頻分解成三種引導條件,即文本條件、空間條件、和視頻特有的時序條件,然后基于此訓練 Video LDM (Video Latent Diffusion Model)。特別地,其將高效的 Motion Vector 作為重要的顯式的時序條件以學習視頻的運動模式,并設計了一個簡單有效的時空條件編碼器 STC-encoder,保證條件驅動視頻的時空連續性。在推理階段,則可以隨機組合不同的條件來控制視頻內容。

實驗結果表明,VideoComposer 能夠靈活控制視頻的時間和空間的模式,比如通過單張圖、手繪圖等生成特定的視頻,甚至可以通過簡單的手繪方向輕松控制目標的運動風格。該研究在 9 個不同的經典任務上直接測試 VideoComposer 的性能,均獲得滿意的結果,證明了 VideoComposer 通用性。

圖片

圖 (a-c)VideoComposer 能夠生成符合文本、空間和時間條件或其子集的視頻;(d)VideoComposer 可以僅僅利用兩筆畫來生成滿足梵高風格的視頻,同時滿足預期運動模式(紅色筆畫)和形狀模式(白色筆畫)

方法介紹

Video LDM

隱空間。Video LDM 首先引入預訓練的編碼器將輸入的視頻圖片圖片映射到隱空間表達,其中

圖片

。然后,在用預先訓練的解碼器 D 將隱空間映射到像素空間上去圖片。在 VideoComposer 中,參數設置

圖片


擴散模型。為了學習實際的視頻內容分布

圖片

,擴散模型學習從正態分布噪聲中逐步去噪來恢復真實的視覺內容,該過程實際上是在模擬可逆的長度為 T=1000 的馬爾可夫鏈。為了在隱空間中進行可逆過程,Video LDM 將噪聲注入到

圖片

中,得到噪聲注入的隱變量

圖片

。然后其通過用去噪函數

圖片

作用在

圖片

和輸入條件 c 上,那么其優化目標如下:

圖片

為了充分探索利用空間局部的歸納偏置和序列的時間歸納偏置進行去噪,VideoComposer 將

圖片

實例化為一個 3D UNet,同時使用時序卷積算子和交叉注意機制。

圖片

VideoComposer

組合條件。VideoComposer 將視頻分解為三種不同類型的條件,即文本條件、空間條件和關鍵的時序條件,它們可以共同確定視頻中的空間和時間模式。VideoComposer 是一個通用的組合式視頻生成框架,因此,可以根據下游應用程序將更多的定制條件納入 VideoComposer,不限于下述列出的條件:

  • 文本條件:文本 (Text) 描述以粗略的視覺內容和運動方面提供視頻的直觀指示,這也是常用的 T2V 常用的條件;


  • 空間條件:
  • 單張圖 (Single Image),選擇給定視頻的第一幀作為空間條件來進行圖像到視頻的生成,以表達該視頻的內容和結構;
  • 單張早圖 (Single Sketch),使用 PiDiNet 提取第一個視頻幀的草圖作為第二個空間條件;
  • 風格(Style),為了進一步將單張圖像的風格轉移到合成的視頻中,選擇圖像嵌入作為風格指導;


  • 時序條件:
  • 運動矢量(Motion Vector),運動矢量作為視頻特有的元素表示為二維向量,即水平和垂直方向。它明確地編碼了相鄰兩幀之間的逐像素移動。由于運動矢量的自然屬性,將此條件視為時間平滑合成的運動控制信號,其從壓縮視頻中提取標準 MPEG-4 格式的運動矢量;
  • 深度序列(Depth Sequence),為了引入視頻級別的深度信息,利用 PiDiNet 中的預訓練模型提取視頻幀的深度圖;
  • 掩膜序列(Mask Sequence),引入管狀掩膜來屏蔽局部時空內容,并強制模型根據可觀察到的信息預測被屏蔽的區域;
  • 草圖序列(Sketch Sequnce),與單個草圖相比,草圖序列可以提供更多的控制細節,從而實現精確的定制合成。

時空條件編碼器。序列條件包含豐富而復雜的時空依賴關系,對可控的指示帶來了較大挑戰。為了增強輸入條件的時序感知,該研究設計了一個時空條件編碼器(STC-encoder)來納入空時關系。具體而言,首先應用一個輕量級的空間結構,包括兩個 2D 卷積和一個 avgPooling,用于提取局部空間信息,然后將得到的條件序列被輸入到一個時序 Transformer 層進行時間建模。這樣,STC-encoder 可以促進時間提示的顯式嵌入,為多樣化的輸入提供統一的條件植入入口,從而增強幀間一致性。另外,該研究在時間維度上重復單個圖像和單個草圖的空間條件,以確保它們與時間條件的一致性,從而方便條件植入過程。

通過 STC-encoder 處理條件后,最終的條件序列具有與相同的空間形狀,然后通過元素加法融合。最后,沿通道維度將合并后的條件序列與連接起來作為控制信號。對于文本和風格條件,利用交叉注意力機制注入文本和風格指導。

訓練和推理

兩階段訓練策略。雖然 VideoComposer 可以通過圖像 LDM 的預訓練進行初始化,其能夠在一定程度上緩解訓練難度,但模型難以同時具有時序動態感知的能力和多條件生成的能力,這個會增加訓練組合視頻生成的難度。因此,該研究采用了兩階段優化策略,第一階段通過 T2V 訓練的方法,讓模型初步具有時序建模能力;第二階段在通過組合式訓練來優化 VideoComposer,以達到比較好的性能。

推理。在推理過程中,采用 DDIM 來提高推理效率。并采用無分類器指導來確保生成結果符合指定條件。生成過程可以形式化如下:

圖片

其中,ω 是指導比例;c1 和 c2 是兩組條件。這種指導機制在兩條件集合判斷,可以通過強度控制來讓模型具有更加靈活的控制。

實驗結果

在實驗探索中,該研究證明作為 VideoComposer 作為統一模型具有通用生成框架,并在 9 項經典任務上驗證 VideoComposer 的能力。

該研究的部分結果如下,在靜態圖片到視頻生成(圖 4)、視頻 Inpainting(圖 5)、靜態草圖生成生視頻(圖 6)、手繪運動控制視頻(圖 8)、運動遷移(圖 A12)均能體現可控視頻生成的優勢。

圖片

圖片

圖片


圖片

團隊介紹

公開信息顯示,阿里巴巴在視覺基礎模型上的研究主要圍繞視覺表征大模型、視覺生成式大模型及其下游應用的研究,并在相關領域已經發表 CCF-A 類論文 60 余篇以及在多項行業競賽中獲得 10 余項國際冠軍,比如可控圖像生成方法 Composer、圖文預訓練方法 RA-CLIP 和 RLEG、未裁剪長視頻自監督學習 HiCo/HiCo++、說話人臉生成方法 LipFormer 等均出自該團隊。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-28 07:30:00

2025-03-27 09:24:16

2024-02-19 08:31:10

SoraAIOpenAI

2025-04-16 09:20:00

虛擬模型數字

2025-08-07 07:56:52

2025-02-26 09:44:14

2024-10-15 14:08:06

2025-01-17 09:00:00

2023-04-03 10:04:44

開源模型

2025-10-11 09:12:46

AI代碼視頻生成

2024-03-29 13:55:22

AI訓練

2025-02-27 12:44:41

2024-03-18 00:00:03

時間序列Prompt模型

2023-12-20 15:26:13

AI谷歌

2024-09-10 11:21:30

2024-02-19 07:58:01

OpenAI模型GPT

2025-02-03 12:16:01

視頻生成AI

2025-01-14 14:02:05

2021-08-13 15:07:02

模型人工智能深度學習
點贊
收藏

51CTO技術棧公眾號

亚洲精品美女在线| 国产精品av一区| 黄色动漫在线观看| 亚洲三级电影网站| 亚洲乱码日产精品bd在线观看| 中文字幕一区二区三区在线视频| 91tv亚洲精品香蕉国产一区7ujn| 美女视频一区| 亚洲人成电影在线观看天堂色| 久操视频在线| 欧美人伦禁忌dvd放荡欲情| 亚在线播放中文视频| 亚洲丝袜精品丝袜在线| 成年人观看网站| 丁香一区二区三区| 五月天色婷婷综合| 捆绑变态av一区二区三区| 欧美成ee人免费视频| 亚洲无线一线二线三线区别av| 国产欧美日韩免费| 888久久久| 国产精品视频一区二区三区经| 欧美日韩a区| 国产精品久久一区二区三区| 一本色道88久久加勒比精品| 欧美一进一出视频| 六月丁香综合在线视频| 青青草影院在线观看| 国产精品一区在线| 欧美三级在线观看视频| 26uuu亚洲| 欧美特级aaa| 亚洲图片欧美视频| 九九热视频在线观看| 欧美麻豆精品久久久久久| h片在线免费| 亚洲女人初尝黑人巨大| 午夜不卡一区| 欧美一级淫片丝袜脚交| 999国产精品999久久久久久| 国产欧美一区二区三区不卡高清| 丝袜美腿一区二区三区| 国产一区二区三区乱码| 国产精品国模大尺度视频| 狠狠操在线视频| 欧美精品777| 巨茎人妖videos另类| 久久亚洲精品一区二区| 婷婷国产精品| 国产在线一区二区三区欧美| 精久久久久久久久久久| 男女男精品视频站| 精品欧美激情精品一区| 精品一性一色一乱农村| 日韩在线免费高清视频| 九九热精品视频在线观看| 91嫩草国产在线观看| 日韩高清中文字幕一区| 国产69精品久久久久久久| 国产精品理论在线观看| 你懂的在线视频| 欧美一二三区在线观看| 亚洲精品一区av| 91传媒在线免费观看| 国产成人av一区二区三区在线 | 亚洲综合av一区二区三区| 欧美极品少妇xxxxⅹ喷水| 国产韩日影视精品| 亚洲高清精品中出| 中文字幕国产一区二区| 欧美成人xxx| 久久夜精品va视频免费观看| 亚洲综合中文| 超碰人人爱人人| 亚洲v中文字幕| 中文字幕影音在线| 国产精品自产拍在线观看| 黄网站免费久久| 福利网址在线| 综合国产在线观看| 综合在线一区| 一本大道熟女人妻中文字幕在线| 狠狠爱在线视频一区| **日韩最新| 日本不卡免费新一二三区| 最新高清无码专区| 日产精品一区| 久久国产欧美精品| 亚洲美女淫视频| 日韩一区精品| 清纯唯美一区二区三区| 亚洲午夜成aⅴ人片| 国产精品一区免费在线| 日韩三级电影免费观看| 亚洲成人黄色影院| 免费精品一区| 一级全黄肉体裸体全过程| 欧美视频三区在线播放| 少妇精品久久久一区二区| 97国产精东麻豆人妻电影| 精品国产免费视频| 欧美特黄一区| 91破解版在线看| 欧美激情a∨在线视频播放 | 久久av一区二区三区亚洲| 国产精品丝袜91| 欧美特大特白屁股xxxx| 久久久com| 色老汉一区二区三区| 日韩欧美黄色| 欧美极品欧美精品欧美| 亚洲成av人片在线观看香蕉| 狠狠综合久久| 香蕉影院在线| 国产精品精品久久久久久| 2020国产成人综合网| 国产精品原创视频| 国产精品一区在线免费观看| 欧美一区二区三区免费| 欧美日韩国产免费观看| 日本韩国一区| 国产在线视频不卡| 亚洲最新视频在线观看| 精品中文一区| 69ww免费视频播放器| 久久免费视频这里只有精品| 97se亚洲国产综合自在线观| 国产成人精品一区二三区在线观看| 2025韩国大尺度电影| 精品偷拍一区二区三区在线看| 日本aⅴ免费视频一区二区三区| 国产在线69| 日韩精品一区二区三区丰满| 日韩精品专区在线| 青青草国产精品97视觉盛宴| 日本动漫同人动漫在线观看| 亚洲免费久久| 亚洲欧美精品一区| 国产乱码精品一区二区三区五月婷| a国产在线视频| ijzzijzzij亚洲大全| 亚洲欧洲xxxx| 不卡高清视频专区| 国产一区二区久久久久| 亚洲 欧美 日韩系列| 国产xxx69麻豆国语对白| 亚洲国产精品久久一线不卡| 中文一区一区三区免费在线观看| shkd中文字幕久久在线观看| 日韩不卡av| 亚洲香蕉成人av网站在线观看| 99免费精品在线观看| 岛国精品一区| 超碰在线公开超碰在线| 亚洲精品免费网站| 精品日韩99亚洲| 99视频一区二区| 国产影视精品一区二区三区| 国产在线你懂得| 26uuu成人| 97国产成人精品视频| 一道本成人在线| 免费久久精品视频| 国产区一区二| 一个人免费观看视频www在线播放| 精品日本一区二区| 正在播放亚洲1区| 亚洲国产日韩一级| 日韩一区精品字幕| www.欧美| 中文字幕av在线| 五月天久久综合网| 国语对白做受69| 欧美主播一区二区三区美女| 国产剧情一区二区三区| 国产99久久| 123区在线| 成人影院在线观看视频| 久久成人资源| 欧美激情女人20p| 国产一二精品视频| 亚洲欧美视频| 欧美国产日韩一区二区三区| 亚洲免费大片在线观看| 亚洲毛片一区| 亚洲色图图片| 免费在线黄色网址| 精品嫩模一区二区三区| 日韩av电影在线播放| 欧美一区二区三区的| 91女厕偷拍女厕偷拍高清| 亚洲中无吗在线| 国产在视频一区二区三区吞精| 天海翼一区二区三区四区在线观看 | 欧美视频网址| 成年网站在线视频网站| 91蝌蚪视频在线观看| 久久精品日产第一区二区三区乱码 | 99国产精品久久久久久久久久久| 国产成人ay|