国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假? 精華

發布于 2025-11-13 09:05
瀏覽
0收藏

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

論文鏈接:https://arxiv.org/pdf/2510.26802v1
項目主頁:https://video-cof.github.io/

引言

近年來,以 Veo、Sora 等為代表的視頻生成模型展現出驚人的生成能力,能夠合成高度逼真、時間連續的動態畫面。這些進展暗示,模型在視覺內容生成之外,或許已開始具備對物理世界結構與規律的潛在理解。

值得注意的是,Google 最新研究指出,諸如 Veo-3 等模型正在顯現出超越純粹生成的“涌現能力”,例如感知建模、動態預測以及推理能力。

由此催生出一個與語言模型“思維鏈”(Chain-of-Thought, CoT)相對應的新概念——幀鏈推理(Chain-of-Frame, CoF)。

其核心思想在于:視頻模型通過逐幀生成過程,構建連貫的視覺演化,從而體現思維與推理的過程。然而,一個關鍵問題仍懸而未決——這些模型是否真的具備零樣本推理(Zero-Shot Reasoning)能力?還是僅僅在模仿訓練數據中的表層模式?

為驗證這一點,來自香港中文大學、北京大學、東北大學等機構的研究團隊開展了系統研究,對 Veo-3 等模型的零樣本推理潛能進行全面評估,并提出了涵蓋空間、幾何、物理、時間等 12 個維度的綜合基準——MME-CoF。

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

什么是 Chain-of-Frame(CoF)?

“幀鏈推理(CoF)”可以視作語言中“思維鏈”(CoT)的視覺化形式:

  • CoT:通過逐步生成文本展示思考與推理路徑。
  • CoF:通過逐幀生成畫面,以動態演化的方式呈現推理與決策過程。

這種方式使模型不僅輸出結果,更在生成的時間維度上“展示”其思考軌跡。

12 項推理挑戰概覽

研究團隊圍繞 12 個推理維度構建了系統測試,對 Veo-3 模型進行了實證評估。以下為部分典型任務摘要。

視覺細節推理(Visual Detail Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

  • 目標:檢測模型保持細粒度視覺屬性(顏色、紋理)與空間關系的能力。
  • 表現:對顯著、易識別物體表現較好。
  • 局限:當目標較小、被遮擋或背景復雜時,模型易偏離任務目標或生成風格化偏差。

視覺追蹤推理(Visual Trace Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

  • 目標:評估模型在動作序列中維持因果連續性的能力。
  • 表現:在簡單任務中能生成連貫的短時序路徑。
  • 局限:長時序或高邏輯依賴任務中,模型難以保持連貫因果關系。

物理推理(Physics-based Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

  • 目標:測試模型是否理解重力、碰撞、摩擦等物理規律。
  • 表現:能生成短期合理的動態畫面。
  • 局限:經常違反物理約束(如能量守恒),僅在“模仿”物理而非真正推理。

真實世界空間推理(Real-World Spatial Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

  • 目標: 測試模型在視角變化下保持空間一致性的能力。
  • 表現: 簡單場景中能維持基本的方向與空間結構。
  • 局限: 在復雜多視角任務中常出現空間錯位或漂移。

3D 幾何推理(3D Geometry Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

  • 目標: 評估模型在立體折疊、旋轉與重構任務中的結構理解。
  • 表現: 在單步操作中具備一定三維感知。
  • 局限: 復雜組合變換時易崩壞,缺乏穩定幾何一致性。

2D 幾何推理(2D Geometry Reasoning)

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

  • 目標: 檢驗模型在平面構圖與形狀關系中的精確度。
  • 表現: 能識別并繪制基礎幾何關系。
  • 局限: 更傾向生成“好看”的圖形而非“正確”的幾何,易出現邏輯順序錯誤。

其他六個推理維度概覽

除上述6項外,其余6個維度同樣揭示了 Veo-3 的限制:

  • 旋轉推理(Rotation Reasoning):小角度旋轉可近似實現,大角度下結構崩壞。
  • 圖表推理(Table & Chart Reasoning):可模仿局部視覺模式,但缺乏對數值關系的真實理解。
  • 物體計數(Object Counting Reasoning):在靜態場景下表現良好,但動態環境中常出現漏數或重復。
  • GUI 推理(GUI Reasoning):能生成點擊或拖動動作,但對操作目的與邏輯缺乏認知。
  • 具身推理(Embodied Reasoning):能識別物體位置與動作,但不遵守環境規則,偶有“作弊式”生成。
  • 醫學推理(Medical Reasoning):在放大或觀察局部細節時具備表面能力,但無法保持影像邏輯一致,易出現結構性錯誤。

MME-CoF:首個視頻推理基準

研究團隊據此提出 MME-CoF,這是首個專門用于量化視頻模型推理能力的標準化評測體系。其主要特征包括:

  • 首個系統化視頻推理評估框架;
  • 覆蓋 12 個維度;
  • 將抽象的推理過程轉化為視頻生成挑戰,以迫使模型在視覺上展示“幀鏈思考”。

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

基于 MME-CoF 基準,研究團隊對多個主流模型進行了量化評測(由 Gemini-2.5-Pro 評分,滿分 4 分)。結果顯示:

  • 整體表現較低:多數模型平均得分不足 2 分,推理能力仍有限。
  • 優勢差異顯著:

a.Sora-2 在物理、具身與醫學推理中表現相對突出;

b.Veo-3 在真實空間推理上具優勢;

c.Seedance-1.0-Pro 在旋轉與三維幾何任務中略勝一籌。

  • 總體趨勢:各模型均在特定方向具備偏好性,但仍停留在“模式重現”層面,尚未形成真正的邏輯推理能力。

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

視頻模型在真推理還是“演”推理?港中文等提出新基準拷問:Chain-of-Frame到底是真是假?-AI.x社區

結論:推理,還是表演?

通過對 Veo-3 等模型的實證分析,研究團隊得出如下結論:

  • 缺乏真正的零樣本推理:當前視頻模型更多依賴數據模式,而非自主邏輯推演。
  • 生成強 ≠ 推理強:高質量的畫面并不代表深層理解。
  • 注重表象,忽視因果:生成結果“看似合理”,但常違背邏輯或物理規律。
  • 視頻模型可作為視覺推理系統的重要模塊,與語言或邏輯模型結合,推動多模態智能邁向真正的“通用理解”。

總體來看,本研究為學術界構建了一個系統且可驗證的實證評估框架,清晰揭示了視頻生成模型在從“內容生成”邁向“邏輯推理”,并邁向真正“通用視覺智能”過程中仍需跨越的核心瓶頸。


本文轉自AI生成未來 ,作者:AI生成未來


原文鏈接:??https://mp.weixin.qq.com/s/TshekyfXktEp3Eqm6TVtlg??

已于2025-11-13 10:18:19修改
收藏
回復
舉報
回復
相關推薦
欧美性受xxxx白人性爽| 日本黄xxxxxxxxx100| 日本精品网站| 欧美日韩综合视频| www.com黄色片| av电影在线观看一区| 亚洲精品国产精品国自产| 夜间精品视频| 成人看片人aa| 欧美hentaied在线观看| 亲子乱一区二区三区电影| 欧美成人家庭影院| 欧美性孕妇孕交| 国产人久久人人人人爽| 精品无码一区二区三区爱欲| 精一区二区三区| 亚洲精品美女网站| 国产福利视频在线观看| 色天使久久综合网天天| 中文字幕在线免费观看| 亚洲午夜三级在线| 少妇**av毛片在线看| 一区二区三区国产精品| 黄色一级影院| 亚洲色图清纯唯美| 午夜影院免费播放| 亚洲成人动漫av| 日本中文字幕电影在线观看 | 三级一区在线视频先锋| 欧美日韩另类综合| 奇米888四色在线精品| 亚洲一区二区三区四区中文| 久久国产精品一区二区| 影音先锋男人的网站| 国产一区二区三区在线观看精品| 亚洲一区三区在线观看| 国产激情一区二区三区四区 | 1024欧美极品| 午夜欧美在线一二页| 免费在线黄色影片| 欧美欧美午夜aⅴ在线观看| 久操视频在线免费播放| 成人激情免费视频| 亲子乱一区二区三区电影| 欧美国产偷国产精品三区| 亚洲最大激情中文字幕| 亚洲一卡久久| 免费cad大片在线观看| 2022国产精品视频| 免费黄色av电影| 欧美在线观看一区| 成人香蕉视频| 欧美日本高清视频在线观看| 波多野结衣成人在线| 日韩大片在线免费观看| 日韩av一区在线| 九9re精品视频在线观看re6| a视频在线播放| 精品一区电影国产| 黄视频网站在线观看| 岛国av一区二区在线在线观看| 国产精品天天狠天天看| 国产三级伦理在线| 亚洲一级不卡视频| 在线看日韩欧美| 麻豆精品蜜桃一区二区三区| 韩国欧美国产1区| 欧美狂欢多p性派对| 欧美三级资源在线| 国产伊人久久| 亚洲xxx自由成熟| 国产精品一区二区三区乱码| 香蕉521av成人网| 日韩三级高清在线| 伦理一区二区三区| 午夜精品福利一区二区| 亚洲欧洲日韩一区二区三区| av网站在线免费| 97碰在线观看| 久色成人在线| 国产不卡视频| 日韩成人黄色av| 欧美丝袜丝交足nylons172| 中文字幕欧美日韩一区二区三区| 亚洲美女淫视频| 中文不卡1区2区3区| 国产在线日韩在线| 99久久国产综合精品女不卡| www黄在线观看| 欧美精品video| 国产一级一区二区| 成人黄色免费| 国产亚洲美女精品久久久| 午夜欧美精品| 国产精品99久久99久久久| 中文字幕欧美在线| 特级西西人体www高清大胆| 日韩电影在线观看网站| 黄色一级片在线观看| 欧美连裤袜在线视频| 国产精品啪视频| 中文字幕永久在线不卡| 欧美**字幕| 97福利网站在线观看视频| 青青成人在线| 中文在线不卡视频| 国产精品观看| 麻豆md0077饥渴少妇| 韩国精品免费视频| 国产在线电影| 亚洲二区在线播放视频| 91亚洲无吗| 在线观看成人av电影| 欧美国产精品劲爆| av有声小说一区二区三区| 57pao精品| 欧美日韩综合| 亚洲日本精品国产第一区| 91免费版在线| 国产情侣一区二区三区| 国产成人精品在线视频| 国产日韩欧美三区| 日韩亚洲不卡在线| 国产精品久久看| 日韩av影视| 日韩影院精彩在线| 成人伊人精品色xxxx视频| 麻豆蜜桃在线| 亚洲人精品一区| 中文一区一区三区免费| 成人女性视频| 亚州国产精品久久久| 欧美日本一道| 1000精品久久久久久久久| 国产青春久久久国产毛片| 国产精品毛片久久| 欧美亚洲国产视频| 人人香蕉久久| 国产精品一区视频网站| 国产精品99久久精品| 成人精品久久一区二区三区| 激情欧美国产欧美| 黄网站色视频免费观看| 精品在线播放午夜| 日韩在线国产| 久久久久久夜| 一区二区成人国产精品| 中文字幕亚洲综合久久五月天色无吗''| 日韩女优毛片在线| julia中文字幕久久亚洲蜜臀| 国产精品亚洲专一区二区三区| 欧美另类网站| 国产美女在线精品| 国产高潮免费视频| 国产视频久久网| 国内成人自拍| aa在线免费观看| 亚洲福利视频二区| 丁香花在线电影小说观看| 久久精品视频网站| 国产大片一区| 国产日韩欧美另类| 偷拍欧美精品| www.日日操| 欧美亚州韩日在线看免费版国语版| 成人免费短视频| 51成人做爰www免费看网站| 日韩电影在线一区二区| 国产91在线亚洲| 日韩一区二区免费高清| 亚洲一级在线观看| 成人自拍视频在线观看| 亚洲国产mv| 日韩电影大片中文字幕| 亚洲男人天堂av| 国产精品日日摸夜夜摸av| 日本欧美韩国一区三区| 黄色在线观看网站| 国产在线观看免费网站| 亚洲福利av| 91精品国产亚洲| 中文字幕免费国产精品| 中文字幕精品久久久久| 91精品国产成人www| 蜜桃麻豆91| 色播在线观看| 日韩电影在线观看完整免费观看| av在线这里只有精品| 欧美成人三级视频网站| 91av俱乐部| 婷婷亚洲最大| 亚洲国产精品福利| 国产精品人人妻人人爽人人牛| 加勒比中文字幕精品| 亚洲久草在线视频| 成人女保姆的销魂服务| 日韩日韩日韩日韩| 亚洲成人tv| 日韩国产激情在线| 国产无遮挡又黄又爽免费软件 |