国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

告別「面癱」配音,InfiniteTalk開啟從口型同步到全身表達(dá)新范式

人工智能 新聞
InfiniteTalk 是由美團(tuán)視覺智能部主導(dǎo)研發(fā)的新型虛擬人驅(qū)動技術(shù),技術(shù)論文、代碼、權(quán)重已開源。

傳統(tǒng) video dubbing 技術(shù)長期受限于其固有的 “口型僵局”,即僅能編輯嘴部區(qū)域,導(dǎo)致配音所傳遞的情感與人物的面部、肢體表達(dá)嚴(yán)重脫節(jié),削弱了觀眾的沉浸感。現(xiàn)有新興的音頻驅(qū)動視頻生成模型,在應(yīng)對長視頻序列時也暴露出身份漂移和片段過渡生硬等問題。為解決這些痛點,Infinitetalk 引入 “稀疏幀 video dubbing”。

這一新范式從根本上重新定義了 video dubbing,將其從簡單的 “嘴部區(qū)域修復(fù)” 轉(zhuǎn)變?yōu)?“以稀疏關(guān)鍵幀為引導(dǎo)的全身視頻生成”。該模型不僅能夠?qū)崿F(xiàn)口型與配音的精準(zhǔn)同步,更實現(xiàn)了面部表情、頭部轉(zhuǎn)動和肢體語言與音頻所表達(dá)情感的自然對齊,消除長視頻生成中的累積誤差和突兀過渡。

InfiniteTalk 是由美團(tuán)視覺智能部主導(dǎo)研發(fā)的新型虛擬人驅(qū)動技術(shù),技術(shù)論文、代碼、權(quán)重已開源。 美團(tuán)視覺智能部能圍繞豐富的本地生活電商場景,建設(shè)從基礎(chǔ)通用到細(xì)分領(lǐng)域的視覺技術(shù)能力,包括視覺生成大模型、多模交互虛擬人,助力營銷創(chuàng)意生產(chǎn)和商家低成本直播;文檔、商品、安全多模態(tài)大模型,助力商家開店經(jīng)營、平臺商品治理和違規(guī)賬號治理;人臉識別、文字識別、細(xì)粒度圖像分析、高性能檢測分割、街景理解成為公司基礎(chǔ)設(shè)施能力。

  • 項目主頁:https://meigen-ai.github.io/InfiniteTalk/
  • 開源代碼:https://github.com/MeiGen-AI/InfiniteTalk
  • 技術(shù)報告:https://arxiv.org/abs/2508.14033

我們先看示例:

一、引言 ——video dubbing 的一個長期痛點

長期以來,video dubbing 一直面臨一個核心的 “僵局”—— 其編輯范圍的局限性。傳統(tǒng)的 video dubbing 技術(shù),例如 MuseTalk 和 LatentSync,通常專注于對嘴部區(qū)域進(jìn)行 “修復(fù)式” 編輯,以實現(xiàn)口型與新音頻的同步。這種方法的主要局限在于,它幾乎不觸及人物的面部表情、頭部轉(zhuǎn)動和肢體動作。

這種 “局部編輯” 的策略導(dǎo)致了一個嚴(yán)重的矛盾:當(dāng)配音表達(dá)出強(qiáng)烈的情感(例如激動、憤怒或喜悅)時,視頻中人物的身體姿態(tài)卻保持著僵硬或靜止?fàn)顟B(tài)。例如,一段充滿激情的對話,人物卻只是面部肌肉輕微抽動,身體保持紋絲不動。這種視聽信息的不一致性會嚴(yán)重破壞觀眾的沉浸感,使生成的視頻顯得不自然,缺乏說服力。這種矛盾感的存在,從根本上制約了配音視頻的質(zhì)量,并成為內(nèi)容創(chuàng)作者亟待解決的難題。如圖 1 所示。

隨著人工智能技術(shù)的發(fā)展,一些音頻驅(qū)動的視頻生成模型應(yīng)運(yùn)而生,試圖解決這一問題。然而,直接將這些模型應(yīng)用于長 video dubbing 任務(wù),同樣暴露出新的、且同樣關(guān)鍵的挑戰(zhàn)。

首先是基于圖像轉(zhuǎn)視頻(Image-to-Video, I2V)的方法。這類模型通常以視頻的首幀圖像作為初始參考,然后根據(jù)音頻生成后續(xù)的視頻序列。雖然這種方法在理論上提供了更大的動作自由度,但它存在嚴(yán)重的 “累積誤差” 問題,如圖 2 (left)。由于模型缺乏持續(xù)的原始關(guān)鍵幀作為錨定,在生成較長的視頻序列時,人物的身份特征(如面部細(xì)節(jié)、發(fā)型等)會逐漸偏離源視頻,甚至背景的色調(diào)也可能發(fā)生不可控的偏移,導(dǎo)致視頻質(zhì)量隨時間推移而下降。

其次是基于首末幀轉(zhuǎn)視頻(First-Last-frame-to-Video, FL2V)的方法。該方法試圖通過同時使用視頻片段的起始幀和終止幀作為參考來解決累積誤差。然而,這種策略帶來了另一個問題:過渡生硬, 如圖 2(right)。FL2V 模型生成過程缺乏從前一片段向后一片段傳遞的 “動量信息”,不同視頻片段之間的動作銜接會顯得突兀和不自然,打破了視頻流的連續(xù)性。與此同時,其過于嚴(yán)格地遵循固定的參考幀,強(qiáng)制生成的視頻在片段(chunk)的邊界上精確復(fù)制參考幀的姿態(tài),即使這種姿態(tài)與新音頻的情感或節(jié)奏相悖。

這兩種主流 AI 方案的局限性揭示了一個核心矛盾:即 “局部編輯的僵硬” 與 “全局生成的失控”。傳統(tǒng)方法因編輯范圍狹窄而僵硬,而新興的 AI 生成模型則在長視頻的連貫性上遭遇了挑戰(zhàn)。

二、新的范式:稀疏幀 video dubbing

為了從根本上解決上述挑戰(zhàn),Infinitetalk 引入了一個全新的技術(shù)范式 ——“稀疏幀 video dubbing”。這一范式徹底改變了 video dubbing 的技術(shù)哲學(xué):它不再將任務(wù)定義為對嘴部區(qū)域的 “修復(fù)”(inpainting),而是將其重構(gòu)為一場 “以稀疏關(guān)鍵幀為引導(dǎo)的全身視頻生成”。其核心理念在于,不是逐幀地、僵硬地復(fù)制源視頻,而是策略性地僅保留和利用源視頻中的少數(shù)關(guān)鍵幀(sparse keyframes)作為核心參考。這些關(guān)鍵幀如同 “視覺錨點”,在生成過程中發(fā)揮著至關(guān)重要的作用。

為了應(yīng)對無限長度的視頻序列生成任務(wù),InfiniteTalk 采用了流式(streaming)生成架構(gòu),整體網(wǎng)絡(luò)框架如圖 4 所示。其工作原理是將一個超長視頻分解為多個小的、可管理的視頻片段(chunks),然后逐一進(jìn)行生成。然而,與簡單的分段生成不同,InfiniteTalk 的核心在于其精巧設(shè)計的 “上下文幀”(context frames)機(jī)制。

當(dāng)模型生成一個新片段時,它不僅僅依賴于源視頻的參考幀,還會利用上一段已生成視頻的末尾幀作為下一段生成的 “動量信息”。這些上下文幀為新片段的生成提供了必要的 “時間上下文”,使其能夠承接前一片段的運(yùn)動趨勢和動態(tài),確保動作的連續(xù)性和流暢性。這一機(jī)制如同接力賽中的接力棒,將前一棒的沖刺動量無縫傳遞給下一棒,從而徹底解決了傳統(tǒng) FL2V 模型中因缺乏動量信息而導(dǎo)致的片段間突兀過渡問題。通過流式架構(gòu)和上下文幀機(jī)制的結(jié)合,InfiniteTalk 成功地將 “片段生成” 任務(wù)提升為 “連續(xù)流生成”,這是其實現(xiàn) “無限長度” 生成能力的技術(shù)基石。

在 “稀疏幀 video dubbing” 范式下,一個關(guān)鍵的挑戰(zhàn)是如何在 “自由表達(dá)” 與 “跟隨參考” 之間找到微妙的平衡。過于嚴(yán)格地復(fù)制參考幀(如 M1 策略)會導(dǎo)致生成的動作僵硬,而如果控制過于松散(如 M2 策略),則又會面臨身份和背景失真等問題。InfiniteTalk 的核心策略是采用一種 “軟條件”(soft conditioning)控制機(jī)制 。該機(jī)制的核心發(fā)現(xiàn)是,模型的控制強(qiáng)度并非固定不變,而是由 “視頻上下文和參考圖像的相似度” 所決定 。基于這一發(fā)現(xiàn),Infinitetalk 設(shè)計了一種獨特的采樣策略,通過 “細(xì)粒度的參考幀定位”(fine-grained reference frame positioning)來動態(tài)調(diào)整控制強(qiáng)度,從而在動作自然度與參考幀的保真度之間取得平衡。

如表 3 所示,M0 策略因隨機(jī)采樣而控制強(qiáng)度過高,導(dǎo)致模型不恰當(dāng)?shù)貜?fù)制參考動作,削弱了同步性。M1 策略雖然在視覺質(zhì)量上表現(xiàn)尚可,但在同步性上表現(xiàn)較差,因為它過于嚴(yán)格地復(fù)制了邊界幀。M2 策略因參考幀與上下文幀的時間距離過遠(yuǎn),導(dǎo)致模型對身份和背景的控制力不足,最終在視覺質(zhì)量(FID、FVD)上表現(xiàn)最差。

最終被采納的 M3 策略,通過在訓(xùn)練中從鄰近分塊(adjacent chunks)中采樣參考幀,找到了一個 “最優(yōu)平衡點”(optimal equilibrium)。這種策略既能確保模型在視覺上遵循源視頻的風(fēng)格,又能賦予模型根據(jù)音頻動態(tài)生成全身動作的自由。

此外,該模型還能通過集成 SDEdit 或 Uni3C 等插件,實現(xiàn)對源視頻中微妙的鏡頭運(yùn)動(camera movement)的精確保留。這一點至關(guān)重要,因為它確保了生成的視頻不僅人物動作自然,連畫面的構(gòu)圖和運(yùn)鏡都與源視頻保持一致,進(jìn)一步提升了視頻的真實感和連貫性。

三、實驗數(shù)據(jù)與視覺實證

為了全面驗證 InfiniteTalk 的性能,將其與多個方法進(jìn)行了對比。

不同相機(jī)控制方法的對比:

四、結(jié)語與展望

InfiniteTalk 成功解決了 “僵硬” 與 “斷裂” 兩大痛點。其核心技術(shù) —— 流式生成架構(gòu)、軟條件控制以及全方位同步能力,共同為高質(zhì)量、長序列的視頻內(nèi)容生成提供了新的解決方案。在短視頻創(chuàng)作、虛擬偶像、在線教育以及沉浸式體驗等領(lǐng)域,這項技術(shù)可以為創(chuàng)作者提供強(qiáng)大的工具,以更低的成本、更高的效率生成富有表現(xiàn)力的動態(tài)內(nèi)容,徹底打破現(xiàn)有制作流程的瓶頸。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2017-03-06 13:00:41

VRAR計算平臺

2025-09-23 16:27:25

2022-09-02 15:11:18

開發(fā)工具

2022-05-25 10:28:35

模型AI

2025-06-26 09:06:59

2025-08-27 13:37:04

2025-03-11 03:00:02

MoCap數(shù)據(jù)運(yùn)動

2024-03-28 13:18:34

AI模型

2020-09-07 14:10:26

AI 數(shù)據(jù)人工智能

2025-05-20 00:08:00

2024-06-14 16:49:29

2025-06-09 02:14:00

2025-10-31 11:26:48

點贊
收藏

51CTO技術(shù)棧公眾號

爱看av在线入口| 欧美日韩亚洲一| av影院在线免费观看| 国产精品伦理一区二区| 国产精品久久久久免费| silk一区二区三区精品视频| 日韩一区二区三区电影在线观看| 黄色国产一级视频| 99精品视频免费观看| 456亚洲影院| 四虎影视4hu4虎成人| 欧美狂野另类xxxxoooo| 成年人视频在线免费| 久久九九国产| 国产日韩av高清| 亚洲三级av| 亚洲乱码一区二区| 国产三级在线播放| 欧美在线999| 中文字幕在线第一页| 国产精品不卡一区| 无码日韩人妻精品久久蜜桃| 国产伦精品一区二区三区免费迷 | 国产男女激情视频| 久久se这里有精品| 久久国产精品 国产精品| 亚洲精品国产偷自在线观看| 国产成人久久久| 老司机精品在线| 久久99精品国产99久久6尤物 | 91深夜福利视频| 亚洲人挤奶视频| 欧美精品久久久久久久免费观看| 国产成人毛片| 国产午夜精品免费一区二区三区| 免费看电影在线| 日韩一区二区三区在线视频| 国产视频在线看| 欧美午夜不卡视频| 色欧美激情视频在线| 欧美日韩中文字幕一区二区| 欧美精品少妇| 欧美天堂一区二区三区| 成人精品一区二区| 51精品秘密在线观看| 最新亚洲伊人网| 欧美日韩亚洲一区二| 亚洲电影小说图| 91搞黄在线观看| jizz性欧美10| 亚洲欧美一区二区激情| 日韩欧美2区| 欧美激情三级免费| 日韩av久操| 精品视频导航| 久久精品国产久精国产| 国产1区2区3区中文字幕| 久久综合av免费| 日本在线免费观看一区| 久久99国产精品免费网站| 欧美一区二区久久久| 欧美24videosex性欧美| 亚洲欧洲xxxx| 青青草综合视频| 精品国产欧美一区二区三区成人| 久久婷婷国产| 波多野结衣xxxx| 亚洲美女一区二区三区| fc2人成共享视频在线观看| 欧美视频裸体精品| 国产在线69| 亚洲美女精品成人在线视频| 大陆av在线播放| 久久国产精品久久国产精品| 欧美日本久久| 亚洲国产精品久久91精品| 欧美va视频| 欧美激情精品久久久久久蜜臀| 九九视频精品全部免费播放| 国产99在线免费| 国产精品资源在线看| 日韩欧美国产片| 欧美午夜一区二区三区免费大片| 97成人资源| 成人免费毛片app| 亚洲免费精彩视频| 免费欧美网站| 444亚洲人体| 粉嫩绯色av一区二区在线观看| 一区二区在线播放视频| 91久久香蕉国产日韩欧美9色| 国产网红女主播精品视频| 九色成人免费视频| 黄色综合网站| 成人精品视频一区二区| 欧美日韩中文精品| 精品中文字幕一区二区三区| www.久久爱.cn| 久久久久综合网| 免费大片黄在线| 国外成人在线播放| 玖玖在线精品| 波多野结衣xxxx| 亚洲国产精品va在线| 成人羞羞网站入口免费| 日韩av不卡播放| 一区二区三区91| 99九九久久| 明星裸体视频一区二区| 1000部国产精品成人观看| 欧美人与禽性xxxxx杂性| 国产精品久久久久久久久免费| 国产一二精品视频| 波多野结衣在线网站| 久久久女女女女999久久| 六月丁香婷婷久久| 亚洲一区影音先锋| 欧美偷拍综合| 国产精品综合网站| 国产成人精品亚洲午夜麻豆| 日本成人一区二区三区| 欧美成人午夜影院| 青青草国产精品亚洲专区无| 在线看视频你懂得| 久久久久久久久电影| 免费高清视频精品| 黄色电影免费在线看| 琪琪亚洲精品午夜在线| 99久久亚洲一区二区三区青草 | 欧美 另类 交| 狠狠色狠狠色综合日日小说| 欧美欧美在线| 永久免费网站视频在线观看| 欧美色涩在线第一页| 日韩理论片av| 1区不卡电影| 欧美肥臀大乳一区二区免费视频| 美美哒免费高清在线观看视频一区二区| 完全免费av在线播放| 日本午夜精品理论片a级appf发布| 九九久久精品一区| 亚洲毛片在线免费观看| 小小影院久久| 美女激情网站| 久久久久久久91| 91视频国产观看| 国产成人精选| 91亚洲精品国产| 伊人久久大香线蕉| 在线播放蜜桃麻豆| 国产精品美女主播在线观看纯欲| 成人福利视频网站| 成人软件在线观看| 久久久久久久久久久久久国产| 91精品婷婷国产综合久久竹菊| 国产一区视频在线观看免费| 欧美一区二区视频| 成人xxxxx色| 51精品视频一区二区三区| 羞羞答答国产精品www一本| 中文字幕在线观看日本| 成人情视频高清免费观看电影| 偷拍与自拍一区| 国产精品videosex性欧美| 香蕉视频在线网站| 久久成人亚洲精品| 欧美专区在线视频| 久久影院模特热| 日韩网站免费观看高清| 综合欧美国产视频二区| 成人在线播放av| 一区二区三区国产精品| 窝窝社区一区二区| 国外av网站| 91九色国产在线| 欧美日韩在线三级| 国产日本精品| 亚洲欧美小说色综合小说一区| 无码毛片aaa在线| 日韩中文娱乐网| 国产精品久久久久久久久久久免费看 | 一区二区三区韩国免费中文网站| 免费男女羞羞的视频网站中文字幕| 国产69久久精品成人| 欧美日韩激情视频| 美女诱惑一区| 成人在线观看免费播放| 羞羞的视频网站| 国产一区二区高清不卡| 亚洲成在人线av| 久久综合色8888| 色综合综合色| 在线免费观看污| 精品国产一区久久久| 亚洲欧洲制服丝袜| 亚洲二区视频| 免费一级欧美在线观看视频| 国外男同性恋在线看| 先锋在线资源一区二区三区| 久久视频在线播放|