国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

夸克、浙大開源OmniAvatar,一張圖+一段音,就能生成長視頻

人工智能 新聞
夸克技術團隊和浙江大學聯合開源了OmniAvatar,這是一個創新的音頻驅動全身視頻生成模型,只需要輸入一張圖片和一段音頻,OmniAvatar即可生成相應視頻。

近期,夸克技術團隊和浙江大學聯合開源了OmniAvatar,這是一個創新的音頻驅動全身視頻生成模型,只需要輸入一張圖片和一段音頻,OmniAvatar即可生成相應視頻,且顯著提升了畫面中人物的唇形同步細節和全身動作的流暢性。此外,還可通過提示詞進一步精準控制人物姿勢、情緒、場景等要素。

OmniAvatar已開源:

  • Model:https://huggingface.co/OmniAvatar/OmniAvatar-14B
  • Code:https://github.com/Omni-Avatar/OmniAvatar
  • Arxiv:https://arxiv.org/abs/2506.18866
  • Project Page:https://omni-avatar.github.io/

以下,是OmniAvatar在播客、唱歌、交互、動態背景等場景下的部分案例。

實驗表明,OmniAvatar在唇形同步、面部及半身視頻生成、文本控制等多個維度上,均取得領先表現,并更好地平衡了視頻質量、準確度、審美三要素。

圖片

圖片

此外,OmniAvatar專門針對長視頻生成進行了優化,可以更好地保持人物一致性和時間連貫性。

模型能力

圖片+音頻=全身視頻

當前,音頻驅動人體運動的技術已取得顯著進展,但大多數方法仍集中在面部運動,缺乏全身驅動的能力,且難以進行精確的提示詞控制。

OmniAvatar以Wan2.1-T2V-14B為基礎模型,利用LoRA方法進行微調,有效地引入了音頻特征。這種結合不僅保留了Wan2.1-T2V-14B在視頻生成方面的強大能力,還提高了模型對音頻輸入的適應性和生成質量。 

圖片

OmniAvatar架構圖

接下來,我們將通過一些具體案例,更詳細地展示模型在多種場景下的能力。

OmniAvatar能夠根據輸入的音頻和提示詞,生成虛擬人物視頻,其中,人物的唇形運動與音頻內容吻合,場景則反映了提示詞內容:

通過調整提示詞,還可實現對人物情緒的精確控制:

在帶有鏡頭運動的場景中,OmniAvatar仍能夠保持面部、動作和背景的自然流暢,展現了模型在動態場景下的強大適應能力:

對于長視頻生成,OmniAvatar通過參考圖像嵌入策略和幀重疊技術,確保了視頻的連貫性和人物身份的一致性:

像素級多層次音頻嵌入策略

精準唇部運動+自然肢體動作

大多數現有方法通常依賴交叉注意力機制來引入音頻特征,雖然效果良好,但會引入大量額外的計算開銷,并且容易過度關注音頻與面部特征之間的關系。

針對這一問題,團隊提出了一種基于像素的音頻嵌入策略,使音頻特征可以直接在模型的潛在空間中以像素級的方式融入。通過這一方法,不僅可以自然地將唇部運動與音頻內容對齊,還能夠確保音頻信息在整個視頻像素中均勻分布,從而使模型生成更協調、更自然的身體動作來匹配音頻。

該策略首先使用Wav2Vec2模型提取音頻特征,然后對這些特征進行分組打包和壓縮,再通過音頻打包模塊映射到視頻的潛在空間中。

圖片

接下來,為了確保模型在深層網絡中能有效地學習和保留音頻特征,OmniAvatar采用了一種多層級音頻嵌入策略,將音頻信息嵌入到DiT模塊的不同階段中。為防止音頻特征對潛在空間產生過度干擾,音頻嵌入僅應用于模型的第二層至中間層之間的模塊 。此外,這些層的權重不共享,使模型能夠在不同層次上保持獨立的學習路徑。

基于LoRA的優化策略

平衡微調,兼顧質量與細節

目前,針對音頻條件擴散模型的方法主要遵循兩種策略:一種是訓練完整的模型,另一種是僅微調特定層。

在進行完整訓練時,團隊發現更新所有層反而會導致模型生成的連貫性和視頻質量下降。具體來看,由于模型過度擬合人類語音數據集,導致泛化能力差,容易生成不切實際或靜態的內容,難以捕捉細節。但另一方面,僅微調和音頻特征相關的層會導致音頻和視頻之間的對齊效果差,唇形同步性能受損。

圖片

效果對比

為了解決這些挑戰,團隊提出了一種基于LoRA的平衡微調策略。該策略不同于以上兩種方法,而是使用LoRA策略高效地適應模型。LoRA通過在注意力和前向傳播(FFN)層的權重更新中引入低秩矩陣,使模型能夠在不改變底層模型容量的情況下學習音頻特征。

長視頻生成

身份保留+時間一致性

長視頻連續生成是音頻驅動視頻生成的難點,也是一項關鍵挑戰。為此,團隊提出了參考圖嵌入和重疊幀策略,以實現人物的身份保留和時間一致性。

圖片

代碼示例

身份保留。OmniAvatar引入了一個參考幀,作為人物身份的固定指導。具體來看,首先需提取參考幀的潛在表示;然后將這些表示多次重復,使其長度與視頻幀數匹配;接下來,再在每個時間步,將這個重復的參考幀潛在表示與視頻潛在表示進行連接。因此,通過參考幀設計,可有效錨定人物身份,確保在整個長視頻序列中的人物一致性。

時間一致性。為了實現無縫的視頻連續性,OmniAvatar采用了一種潛在重疊策略。首先,在訓練時使用單幀和多幀前綴潛在變量的組合進行訓練;其次,在推理過程中,對于第一批的幀,參考幀既作為前綴潛在變量,又作為身份指導;對于后續批次,則用前一組的最后幀作為潛在變量,參考幀仍保持固定用作身份指導。

One More Thing

OmniAvatar是團隊在多模態視頻生成上的初步嘗試,并在實驗數據集上得到了初步驗證,但尚未達到產品級應用水平。未來,團隊還將在復雜指令處理能力、多角色交互等方面進一步探索,擴大模型在更多場景中的應用。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2022-08-19 14:46:16

視覺框架

2023-03-04 22:14:06

視頻壓縮

2015-10-09 11:44:06

2021-02-07 09:01:10

Java并發編程

2019-09-11 10:12:12

華為

2015-03-10 10:15:27

AppleWatch開發Swift

2015-09-14 09:07:15

Java多線程

2018-06-19 08:02:00

統計程序微信

2023-12-13 13:06:30

2013-12-16 10:59:52

WiFi上鎖WiFi被盜

2024-05-07 08:49:45

微服務架構模式

2018-05-18 18:09:44

人工智能

2023-09-05 08:53:51

2018-02-13 14:56:24

戴爾

2015-06-24 10:51:10

iOS學習流程

2025-03-11 10:58:00

2020-09-12 16:45:49

Git

2021-09-29 11:30:01

大數據技術架構
點贊
收藏

51CTO技術棧公眾號

日本激情一区| 男人天堂网视频| 亚洲女同一区二区| 日韩成人在线电影| 你懂的视频在线一区二区| 亚洲第一福利视频在线| 精品人人人人| 国产女女做受ⅹxx高潮| 国产亚洲精品一区二555| 日韩精品亚洲一区| 在线视频91p| 国产成人精品福利一区二区三区 | 亚洲欧洲精品一区二区三区波多野1战4 | 中文字幕中文字幕一区| 国产极品一区| 日本大片免费看| 亚洲精品一区二区网址| 久久精品久久精品| 蜜桃视频在线观看免费视频| 中文字幕精品—区二区日日骚| 欧美本精品男人aⅴ天堂| 日韩高清不卡一区二区| 白浆在线视频| 黄色网在线视频| 日韩在线观看网址| 久久婷婷成人综合色| 中文字幕一区二区三区中文字幕| 可以免费在线看黄的网站| 超碰97人人做人人爱少妇| 久久精品夜色噜噜亚洲a∨| 亚洲精品福利| 91插插插插插插插插| 国产69精品久久久久99| 日韩毛片在线免费观看| 日本电影一区二区| 国产午夜在线视频| 明星裸体视频一区二区| 亚洲毛茸茸少妇高潮呻吟| 99久久精品费精品国产一区二区| eeuss国产一区二区三区四区| 嫩草嫩草嫩草| 国产精品视频免费一区二区三区| 欧美一区二区久久久| 精品一区二区三区影院在线午夜| 激情久久一区二区| 伊人国产在线视频| 国产福利视频一区| 午夜免费久久看| 99精品视频网| 亚洲www.| 亚欧美在线观看| 国产精品美女久久福利网站| 黄色精品在线观看| 福利网在线观看| 欧美成人在线免费| 亚洲综合一区二区| 在线亚洲伦理| 国产精品黄色片| 黄色春季福利在线看| 国产一区不卡在线观看| 亚洲三级av在线| 国产精品久久影院| 日韩午夜在线电影| 97欧美成人| 在线的色视频| 亚洲人一区二区| 97精品视频在线播放| 在线日韩av片| 成人中文字幕在线| 国产精品成人a在线观看| 男人久久天堂| 国产乱妇乱子| 一本一本久久a久久精品综合妖精| 九九热这里只有精品6| 一本色道久久综合亚洲精品按摩| 国内精品伊人久久久久av一坑| 人人网欧美视频| 在线视频中文字幕第一页| 色国产在线视频| 欧美一区1区三区3区公司| 久久久久久国产免费 | 男人的天堂久久| √天堂资源地址在线官网| 免费超爽大片黄| 亚洲一区精品电影| 亚洲人成在线观看网站高清| 一二三四区精品视频| 久国产精品韩国三级视频| 亚洲免费av一区二区| 777午夜精品电影免费看| 黄页在线观看| 久久涩涩网站| 97久久综合区小说区图片区| 精品在线你懂的| 中文字幕不卡的av| 欧美激情日韩| 在线视频成人| 毛片免费在线观看| 精品视频一区二区在线| 国产欧美一区二区三区另类精品 | 国产精品综合不卡av| 亚洲图片在区色| 欧美日在线观看| 91蝌蚪国产九色| 久久综合伊人| 不卡在线一区二区| 先锋影音网一区二区| 亚洲妇熟xxxx妇色黄| 麻豆电影在线观看| 欧美黄色免费影院| 日本在线播放不卡| 成人免费黄色网| 久久久噜噜噜久久久| 日韩高清免费在线| 欧美在线观看视频一区二区| 国产精品网友自拍| 国产成人精品影视| 国产日韩一区| 日韩欧美午夜| 91在线一区| 日韩经典一区| av大全在线| 免费人成黄页在线观看忧物| 天天爱天天做色综合| 国产美女主播在线播放 | 欧美视频一区二区三区| 国产精品护士白丝一区av| 国产a视频精品免费观看| 日韩成人免费在线| 日韩一级网站| 欧美在线亚洲| 欧美独立站高清久久| 天堂99x99es久久精品免费| 电影一区二区三区久久免费观看| 色资源二区在线视频| 少妇av在线| 在线日本中文字幕| 免费在线看v| 久久久亚洲精华液精华液精华液 | 精品日本一区二区三区| 国产精品丝袜一区二区三区| 国内精品在线一区| 久久手机精品视频| 亚洲日本成人网| 精品无人区乱码1区2区3区在线| 欧美一区二区三区色| 欧美综合在线视频| 狠狠躁夜夜躁人人躁婷婷91| 亚洲乱码日产精品bd| 国产精品高清亚洲| 国产色婷婷亚洲99精品小说| 99精品视频在线观看| www.日本不卡| 97久久超碰精品国产| hitomi一区二区三区精品| 国产精品一区二区久久精品爱涩| 久久精品久久综合| 麻豆精品一区二区| 蜜臀av性久久久久av蜜臀妖精 | 日韩国产欧美一区二区三区| 国产亚洲精品v| 亚洲欧美日韩国产综合精品二区| 国产日韩欧美在线播放不卡| 久久精品国语| 蜜臀av一区二区| 蜜桃传媒麻豆第一区在线观看| 日本va欧美va欧美va精品| 蜜臀av国产精品久久久久| 久久99精品国产麻豆不卡| 狠狠狠色丁香婷婷综合激情| 国产精品系列在线播放| 国产1区2区3区精品美女| 不卡的av电影| 中文字幕二三区不卡| 亚洲六月丁香色婷婷综合久久 | 亚洲精品www| 亚洲国产古装精品网站| 日韩精品在线第一页| 一本色道久久综合狠狠躁篇怎么玩| 在线观看久久久久久| 美女精品视频一区| 97香蕉久久夜色精品国产| 国产成人+综合亚洲+天堂| 5g国产欧美日韩视频| 久久综合一区二区三区| 一区二区日本伦理| 毛片在线视频观看| 一本色道无码道dvd在线观看| 日本a级片免费| 中文在线有码| a级在线观看| 高清亚洲高清| 天天久久夜夜| 狠狠综合久久| 国产精品资源在线看| 中文成人综合网| 色香色香欲天天天影视综合网| 精品国产一区二区精华| 日韩中文字幕在线免费观看| 国产成人综合一区二区三区|