国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

視頻模型真在推理,還是「表演」推理?港中文等質(zhì)疑:Chain-of-Frame是真的嗎?

人工智能 新聞
來自香港中文大學、北京大學、東北大學的研究團隊進行了系統(tǒng)性研究,對 Veo 3 等模型的零樣本推理潛力進行了深入評估,并提出了涵蓋空間、幾何、物理、時間等 12 個推理維度的綜合測試基準 ——MME-CoF。

近年來,以 Veo、Sora 為代表的視頻生成模型展現(xiàn)出驚人的合成能力,能夠生成高度逼真且時序連貫的動態(tài)畫面。這類模型在視覺內(nèi)容生成上的進步,表明其內(nèi)部可能隱含了對世界結(jié)構與規(guī)律的理解。更令人關注的是,Google 的最新研究指出,諸如 Veo 3 等模型正在逐步顯現(xiàn)出超越單純合成的 “涌現(xiàn)特性”,包括感知、建模和推理等更高層次能力。

這催生出一個與語言模型 “思維鏈”(Chain-of-Thought, CoT)相對應的新概念 ——Chain-of-Frame(CoF)。其核心思想是:模型通過逐幀生成視頻,以連貫的視覺推演方式逐步解決問題。然而,一個關鍵疑問仍未解決:這些模型是否真正具備零樣本推理(Zero-Shot Reasoning)的能力?抑或它們只是在模仿訓練數(shù)據(jù)中出現(xiàn)過的表面模式?

為探究這一問題,來自香港中文大學、北京大學、東北大學的研究團隊進行了系統(tǒng)性研究,對 Veo 3 等模型的零樣本推理潛力進行了深入評估,并提出了涵蓋空間、幾何、物理、時間等 12 個推理維度的綜合測試基準 ——MME-CoF。

  • 論文題目:Are Video Models Ready as Zero-Shot Reasoners? An Empirical Study with the MME-CoF Benchmark
  • 論文鏈接:https://arxiv.org/pdf/2510.26802v1
  • 項目主頁:https://video-cof.github.io/

什么是 Chain-of-Frame(CoF)推理?

“幀鏈推理” 可以視作語言中 “思維鏈”(CoT)的視覺類比:

  • CoT 通過逐步生成文字展現(xiàn)推理路徑。
  • CoF 則通過逐幀生成畫面,使場景在視覺上不斷演化,從而體現(xiàn)推演過程。

深入分析:12 項推理挑戰(zhàn)

為全面揭示視頻模型的推理潛力,研究團隊設計了 12 個維度的測試任務,對 Veo 3 進行了系統(tǒng)的實證分析。以下選取其中三個典型維度進行說明(其余部分可參閱原論文)。

1. 真實世界空間推理(Real-World Spatial Reasoning)

  • 任務: 評估模型在多視角自然場景中保持空間一致性的能力,包括視角變化、方位對齊與參考系穩(wěn)定性。
  • 發(fā)現(xiàn): 能較好處理簡單場景下的空間布局與視角切換,局部場景保持合理的空間關系與方向一致。
  • 局限: 在復雜視角變化或深度理解任務中表現(xiàn)不穩(wěn),常出現(xiàn)空間錯位、視角漂移或方向混亂,難以維持全局坐標一致性。

2. 3D 幾何推理(3D Geometry Reasoning)


  • 任務: 評估模型在三維幾何變換任務中的結(jié)構理解與連續(xù)性表現(xiàn),如物體折疊、旋轉(zhuǎn)與立體重構。
  • 發(fā)現(xiàn): 在單步、簡單幾何變換中可生成結(jié)構完整且視覺連貫的結(jié)果,具備初步的三維形態(tài)理解能力。
  • 局限: 多步或組合性變換中常出現(xiàn)結(jié)構錯位、自交或崩塌,無法維持幾何一致與物理合理性,整體三維推理仍脆弱。

3. 2D 幾何推理(2D Geometry Reasoning)


  • 任務: 評估模型在平面幾何構造與圖形操作任務中的準確性與約束保持能力,如點連線、形狀移動和構圖順序理解。
  • 發(fā)現(xiàn): 在簡單幾何連接任務中可識別并正確繪制基本關系,呈現(xiàn)初步幾何構造能力。
  • 局限: 易優(yōu)先生成視覺上美觀的圖形而非嚴格幾何符合,常出現(xiàn)連線順序錯誤、形狀變形或持續(xù)繪制超出任務范圍,缺乏穩(wěn)定的幾何約束意識。

其他六個推理維度概覽

除上述三項外,其余九個維度同樣揭示了 Veo 3 的限制:

  • 視覺細節(jié)推理(Visual Detail Reasoning):對被遮擋或微小目標的識別不穩(wěn),生成內(nèi)容易偏離任務要求。
  • 視覺追蹤推理(Visual Trace Reasoning):長時序依賴和規(guī)則驅(qū)動的動作鏈容易中斷,因果一致性不足。
  • 物理推理(Physics-Based Reasoning):未能準確遵循能量、力學等物理規(guī)律,僅表現(xiàn)為視覺層面的 “模擬”。
  • 旋轉(zhuǎn)推理(Rotation Reasoning):小角度旋轉(zhuǎn)可近似實現(xiàn),大角度下結(jié)構崩壞。
  • 圖表推理(Table & Chart Reasoning):可模仿局部視覺模式,但缺乏對數(shù)值關系的真實理解。
  • 物體計數(shù)(Object Counting Reasoning):在靜態(tài)場景下表現(xiàn)良好,但動態(tài)環(huán)境中常出現(xiàn)漏數(shù)或重復。
  • GUI 推理(GUI Reasoning):能生成點擊或拖動動作,但對操作目的與邏輯缺乏認知。
  • 具身推理(Embodied Reasoning):能識別物體位置與動作,但不遵守環(huán)境規(guī)則,偶有 “作弊式” 生成。
  • 醫(yī)學推理(Medical Reasoning):在放大或觀察局部細節(jié)時具備表面能力,但無法保持影像邏輯一致,易出現(xiàn)結(jié)構性錯誤。

MME-CoF:首個視頻推理基準

研究團隊基于上述實證研究整理了 MME-CoF 基準,以標準化方式評估視頻模型的推理潛能。其主要特征包括:

  • 首個系統(tǒng)量化視頻模型推理能力的框架;
  • 覆蓋 12 個維度、59 個精心設計任務;
  • 提示式設計創(chuàng)新:將抽象推理任務(如物理、幾何、計數(shù))轉(zhuǎn)化為可視化視頻生成挑戰(zhàn),迫使模型通過 “幀鏈推理” 展現(xiàn)過程性思考。

下表展示了多種視頻生成模型在 MME-CoF 基準上的評測結(jié)果,評分由 Gemini-2.5-Pro 完成,量表范圍為 0–4。研究團隊從五個維度進行評估。整體來看,各模型的平均得分普遍低于 2 分。

結(jié)論:推理還是表演?

綜合 Veo 3 的實證分析,基于對眾多視頻模型的定量評估結(jié)果,研究者得出以下結(jié)論:

1. 尚不具備獨立的零樣本推理能力 —— 模型主要依賴數(shù)據(jù)模式,而非邏輯推演。

2. 強生成 ≠ 強推理 —— 其表現(xiàn)更多來自模式記憶與視覺一致性,而非概念理解。

3. 注重表象而非因果 —— 模型生成的結(jié)果往往 “看起來對”,但邏輯上并不成立。

4. 未來仍具潛力 —— 可作為視覺推理系統(tǒng)的有力補充模塊,與邏輯模型協(xié)同構建更完整的多模態(tài)智能體系。

總體而言,這項研究為學界提供了清晰系統(tǒng)的實證分析和評估框架,揭示了視頻生成模型在從 “生成” 邁向 “推理”、實現(xiàn)真正的 “通用視覺模型” 的過程中尚需跨越的關鍵鴻溝。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2025-02-27 10:33:36

2025-02-24 08:30:00

視覺模型訓練

2025-02-10 14:05:00

訓練模型AI

2025-05-19 08:37:00

2025-06-17 17:19:31

AIOpenAIGoogle

2024-03-04 13:36:00

模型訓練

2025-04-16 15:28:31

模型AI數(shù)據(jù)

2025-11-03 08:15:00

2025-11-10 17:07:13

AI模型自動化

2021-12-01 10:05:12

模型人工智能計算

2025-07-17 09:21:11

2025-09-15 09:43:33

分層推理模型循環(huán)網(wǎng)絡推理

2025-06-10 03:30:00

2025-10-15 00:00:00

2025-04-11 09:35:34

2024-06-11 14:30:18

2025-05-29 09:20:00

模型研究推理

2025-06-13 01:00:00

人工智能大型推理模型推理模型

2025-06-27 08:40:00

模型推理AI

2025-12-12 09:18:06

AI開源模型
點贊
收藏

51CTO技術棧公眾號

www.欧美精品一二三区| 美女在线观看视频一区二区| 精品国产百合女同互慰| 亚洲欧美一区二区三区在线播放| 99久久精品99国产精品| 亚洲视频在线二区| 国产精品毛片在线| 国产精品区一区二区三在线播放| 亚洲日产av中文字幕| 欧美激情手机在线视频 | 老汉av免费一区二区三区| aa成人免费视频| 欧美一区网站| 成人3d动漫一区二区三区91| 日韩电影一区| 91免费福利视频| 欧美激情1区| 官网99热精品| 久久久久久网| 免费成人深夜夜行网站视频| 国产91综合网| 日韩国产欧美亚洲| 国产亚洲成aⅴ人片在线观看| 国产精品视频黄色| 亚洲乱码中文字幕| 亚洲男人网站| 欧美蜜桃一区二区三区| 在线播放免费av| 亚洲人成电影在线播放| 免费一区二区三区四区| 国内精品在线一区| 日本不卡电影| 蜜桃成人在线| 国产一区 二区 三区一级| 成人毛片一区二区| 中文字幕在线一区免费| 在线观看h视频| 欧美精品一级二级三级| 理论片午夜视频在线观看| 久久精品99久久久久久久久| 国偷自产视频一区二区久| 国产精品日韩在线| 国产视频一区三区| av高清在线免费观看| 亚洲人成影院在线观看| 精品乱码一区二区三四区视频 | 免费观看日韩电影| 国产极品在线视频| 亚洲一区视频在线| 二区三区在线观看| 日韩在线视频网站| 日韩亚洲一区在线| 在线亚洲美日韩| 国产精品福利电影一区二区三区四区 | 97av视频在线观看| 亚洲国产精品一区二区www在线| av中文资源在线| 亚洲精品久久7777777| 亚洲国产中文在线| 91视频国产高清| 精品一区二区精品| 免费观看一二区视频网站| 欧美一区二区性放荡片| 亚洲乱码一区| 麻豆久久久9性大片| 国产丝袜在线精品| 91欧美在线视频| 欧美成人小视频| 亚洲精品影视| 国产 porn| 精品日韩一区二区三区| 极品束缚调教一区二区网站| 欧美成人精品影院| 色综合色狠狠天天综合色| 欧美精品www在线观看| 性色视频在线观看| 日韩精品视频免费在线观看| 欧美一区在线观看视频| 成人欧美一区二区三区在线观看| 美女性感视频久久久| 国产精品区在线| 无码av免费一区二区三区试看| 菠萝蜜视频国产在线播放| 久久久精品免费视频| 国产精品不卡| 久久香蕉视频网站| 亚洲一区二区av电影| 高清在线视频不卡| 欧美中文在线视频| 蜜臀av性久久久久av蜜臀妖精| 偷窥自拍亚洲色图| 亚洲精品国产品国语在线| 国产成人精品一区二区免费看京| 久久国产日韩欧美| 中文字幕永久在线不卡| av在线私库| 91久久极品少妇xxxxⅹ软件| 97aⅴ精品视频一二三区| 午夜毛片在线| 欧美亚洲第一页| 国产大片一区二区| 无遮挡动作视频在线观看免费入口| 久久99精品久久久久久噜噜| 米奇777在线欧美播放| videoxxxx另类日本极品| 色偷偷噜噜噜亚洲男人的天堂| 国产精品普通话对白| 成视频年人免费看黄网站| 国产午夜精品全部视频播放 | 日本午夜一本久久久综合| 免费毛片aaaaaa| 久久亚洲精品一区| 蜜芽一区二区三区| 成人网视频在线观看| 国产成人啪精品视频免费网| 91色porny| 国产超碰精品| 在线观看日本一区| 欧美男男青年gay1069videost| 日韩不卡一区| 精产国产伦理一二三区| 午夜精品久久久久久99热软件| 成人av网站免费| 777午夜精品电影免费看| 日韩视频在线免费播放| 亚洲国产精品99| 日本欧美在线看| 宅男在线观看免费高清网站| 久久亚洲免费| 日韩久久精品一区| 日本美女视频一区二区| 日本动漫同人动漫在线观看| 蜜桃免费一区二区三区| 欧美精品一卡两卡| 在线日韩av| 人人干在线视频| 国产精品日韩一区二区免费视频| 午夜视频在线观看一区二区 | 男人在线视频资源| 日本久久久久久久久| 中文在线免费一区三区高中清不卡| 四虎国产精品免费久久5151| 9久久9毛片又大又硬又粗| 日韩少妇与小伙激情| www.色综合.com| 国产精品一区二区美女视频免费看 | 国产精品久久久久久久午夜| 自拍av一区二区三区| 亚洲小说图片| 羞羞视频在线免费看| 国产精品久久久久免费| 欧美一区二区三区系列电影| 久久精品国产免费| 欧美成人精品三级网站| 亚洲爆乳无码专区| 国产成人精品a视频一区www| 精品高清一区二区三区| 亚洲福利国产| 91精品论坛| 孩娇小videos精品| 国产精品成人v| 欧美日韩久久久一区| 久久99久国产精品黄毛片色诱| 亚洲高清国产拍精品26u| 先锋影音资源999| 成人免费在线视频网址| 日韩写真欧美这视频| 国产v综合v亚洲欧| 日本亚洲不卡| 在线观看黄色av| 2019日韩中文字幕mv| 91高清免费视频| 51精品视频一区二区三区| 成人性视频免费网站| 在线成人动漫av| 蜜桃视频在线观看www社区| 欧美国产综合在线| 国产99视频精品免视看7| 欧美一区日韩一区| 国产偷国产偷亚洲高清人白洁| 羞羞色午夜精品一区二区三区| 久久五月精品中文字幕| 欧美一级特黄a| 国产精品swag| 俺也去精品视频在线观看| 偷拍亚洲欧洲综合| 美女尤物国产一区| 亚洲激情77| 久久青青色综合| 国产精品99久久99久久久| 日韩精品欧美一区二区三区| 欧美大码xxxx| 91精品国产福利| 欧美国产一区二区| 亚洲三级视频| 538任你躁精品视频网免费| 在线观看a视频| 自拍偷拍21p| 中日韩在线视频| 成人福利视频在线观看|