国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

LeCun的JEPA已進(jìn)化為視覺-語言模型,1.6B參數(shù)比肩72B Qwen-VL

人工智能 新聞
近日,來自 Meta、香港科技大學(xué)、索邦大學(xué)、紐約大學(xué)的一個(gè)聯(lián)合團(tuán)隊(duì)基于 JEPA 打造了一個(gè)視覺-語言模型:VL-JEPA。

LeCun 的聯(lián)合嵌入預(yù)測架構(gòu)(JEPA)迎來了新進(jìn)展。

近日,來自 Meta、香港科技大學(xué)、索邦大學(xué)、紐約大學(xué)的一個(gè)聯(lián)合團(tuán)隊(duì)基于 JEPA 打造了一個(gè)視覺-語言模型:VL-JEPA。

據(jù)作者 Pascale Fung 介紹,VL-JEPA 是第一個(gè)基于聯(lián)合嵌入預(yù)測架構(gòu),能夠?qū)崟r(shí)執(zhí)行通用領(lǐng)域視覺-語言任務(wù)的非生成模型。

下面展示了一段該模型實(shí)時(shí)工作的視頻:

不同于傳統(tǒng)的視覺-語言模型(VLM)通過自回歸方式生成 token,VL-JEPA 預(yù)測的是目標(biāo)文本的連續(xù)嵌入(embedding)。通過在抽象的表征空間中學(xué)習(xí),該模型能夠?qū)W⒂谂c任務(wù)相關(guān)的語義,同時(shí)忽略表層語言形式的多變性 。

  • 論文標(biāo)題:VL-JEPA: Joint Embedding Predictive Architecture for Vision-language
  • 論文地址:https://arxiv.org/abs/2512.10942

該論文共有四位共一作者:Delong Chen(陳德龍)、Mustafa Shukor、Théo Moutakanni、Willy Chung。JEPA 提出者、圖靈獎得主 Yann LeCun 也在作者名單中。

當(dāng)前 VLM 面臨的困難

理解周圍的物理世界是高級機(jī)器智能最重要的方面之一。這種能力使 AI 系統(tǒng)能夠在現(xiàn)實(shí)世界中學(xué)習(xí)、推理、規(guī)劃和行動,從而協(xié)助人類。

需要在現(xiàn)實(shí)世界中行動的智能系統(tǒng)包括可穿戴設(shè)備和機(jī)器人。構(gòu)成這一能力的機(jī)器學(xué)習(xí)任務(wù)包括描述生成(captioning)、檢索、視覺問答、動作跟蹤、推理和規(guī)劃等。用于此類現(xiàn)實(shí)世界應(yīng)用的系統(tǒng)必須具備實(shí)時(shí)響應(yīng)能力,且具有低延遲和低推理成本。

目前,完成這些任務(wù)的通用方法是使用基于 token 生成的大型視覺 - 語言模型(VLM)。

這些模型接收視覺輸入 X_V 和文本查詢 X_Q,在 token 空間中自回歸地生成所需的文本響應(yīng) Y,即 (X_V,X_Q)? Y。這種方法雖然直觀,但也有不足,原因主要有二:

  • VLM 的開發(fā)成本高昂。因?yàn)樗鼈兊挠?xùn)練目標(biāo)是生成響應(yīng) Y,這要求模型捕捉任務(wù)相關(guān)的語義,同時(shí)還要處理與任務(wù)無關(guān)的表層語言特征(如選詞、風(fēng)格或改寫)。在訓(xùn)練過程中,VLM 必須同時(shí)對這兩個(gè)方面建模,導(dǎo)致計(jì)算資源被浪費(fèi)在生成多樣化的 token 序列上,而這些序列最終并不影響輸出的正確性。
  • 實(shí)時(shí)任務(wù)面臨延遲挑戰(zhàn)。涉及直播視頻的實(shí)時(shí)任務(wù)(如實(shí)時(shí)動作跟蹤)需要稀疏且選擇性的解碼(例如,僅在新事件發(fā)生時(shí)才發(fā)出描述)。然而,VLM 依賴于逐 token 的自回歸解碼,必須在揭示 Y 的底層語義之前完成整個(gè)解碼過程。這一過程引入了不必要的延遲,并阻礙了實(shí)時(shí)動態(tài)更新語義的能力。

視覺-語言聯(lián)合嵌入預(yù)測架構(gòu)(VL-JEPA)

這個(gè)聯(lián)合團(tuán)隊(duì)開發(fā)的視覺-語言聯(lián)合嵌入預(yù)測架構(gòu)(VL-JEPA)能將昂貴的數(shù)據(jù)空間 token 生成學(xué)習(xí)轉(zhuǎn)變?yōu)楦咝У臐摽臻g語義預(yù)測。

如圖 1 所示,該模型會使用 x-encoder 將視覺輸入 X_V 映射為嵌入 S_V,使用 y-encoder 將目標(biāo)文本 Y 映射為嵌入 S_Y,并使用一個(gè)預(yù)測器來學(xué)習(xí)映射 (S_V,X_Q)? S_Y,其中 X_Q 是文本查詢(即提示詞)。

訓(xùn)練目標(biāo)定義在嵌入空間 ??_{VL-JEPA}=D (?_Y,S_Y),而不是數(shù)據(jù)空間 ??_VLM=D (?,Y)。在推理過程中,當(dāng)需要時(shí),y-encoder 會將預(yù)測的嵌入 ?_Y 讀出為文本空間 ?。

得益于其非生成式的特性,VL-JEPA 不必在 token 空間重建 Y 的每一個(gè)表層細(xì)節(jié)。相反,它只需要在嵌入空間預(yù)測抽象表征 S_Y。

在原始的 One-hot token 空間中,對于同一輸入,不同的合理輸出 Y 如果不共享重疊的 token,往往看起來幾乎是正交的。然而,在嵌入空間中,這些多樣化的目標(biāo)可以被映射到共享相似語義的鄰近點(diǎn)。

這就簡化了目標(biāo)分布,從而使學(xué)習(xí)過程更加高效。此外,與 VLM 不同,這種方法消除了在訓(xùn)練期間使用重型解碼器學(xué)習(xí)語言生成的需要,從而顯著提高了效率。

同時(shí),得益于其非自回歸的特性,VL-JEPA 可以在滑動窗口內(nèi)以極低的延遲產(chǎn)生連續(xù)的目標(biāo)語義嵌入流,因?yàn)樗恍枰淮吻跋騻鬟f,無需自回歸解碼。

這對實(shí)時(shí)在線應(yīng)用(如實(shí)時(shí)動作跟蹤、場景識別或規(guī)劃)特別有利,在這些應(yīng)用中,嵌入流可以被輕量級的 Y-Decoder 選擇性地解碼,從而實(shí)現(xiàn)高效且及時(shí)的更新。

實(shí)驗(yàn)表現(xiàn)

VL-JEPA 的優(yōu)勢也得到了實(shí)驗(yàn)驗(yàn)證。

該團(tuán)隊(duì)將其與經(jīng)典的 token 生成式 VLM 進(jìn)行了比較 :兩種設(shè)置使用相同的視覺編碼器、空間分辨率、幀率、訓(xùn)練數(shù)據(jù)、批量大小和迭代次數(shù)等,唯一的區(qū)別在于目標(biāo)是在 token 空間還是嵌入空間。

在這種匹配的訓(xùn)練條件下,VL-JEPA 在零樣本描述生成和分類上提供了一致的更高性能,同時(shí)使用的可訓(xùn)練參數(shù)大約只有一半,這表明嵌入空間監(jiān)督提高了學(xué)習(xí)效率。

除了訓(xùn)練階段,VL-JEPA 還通過選擇性解碼(selective decoding)帶來了顯著的推理效率提升,即僅在預(yù)測的嵌入流發(fā)生顯著變化時(shí)才進(jìn)行解碼。

實(shí)驗(yàn)表明,該策略將解碼操作次數(shù)減少了約 2.85 倍,同時(shí)保持了以平均 CIDEr 分?jǐn)?shù)衡量的整體輸出質(zhì)量。

該團(tuán)隊(duì)最終的 VL-JEPA 模型分兩個(gè)階段訓(xùn)練:

  • 使用描述數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,以建立穩(wěn)健的視覺-語言對齊;
  • 監(jiān)督微調(diào)(SFT)階段,賦予模型 VQA 能力。

第一階段產(chǎn)生的模型稱為 VL-JEPA_BASE,在零樣本分類和文本到視頻檢索方面進(jìn)行了評估。

VL-JEPA_BASE 在平均分類準(zhǔn)確率(跨 8 個(gè)數(shù)據(jù)集)和檢索 recall@1(跨 8 個(gè)數(shù)據(jù)集)方面優(yōu)于 CLIP、SigLIP2 和 Perception Encoder 模型。

經(jīng)過第二階段后,得到的 VL-JEPA_SFT 由于接觸了域內(nèi)訓(xùn)練數(shù)據(jù),分類性能顯著提高。

作為一個(gè)統(tǒng)一的通用模型,VL-JEPA_SFT 接近了針對單個(gè)基準(zhǔn)優(yōu)化的專用模型的性能。同時(shí),VL-JEPA_SFT 展現(xiàn)了有效的 VQA 能力,在涵蓋組合視覺推理、復(fù)雜對象計(jì)數(shù)和對象幻覺的四個(gè)數(shù)據(jù)集上,達(dá)到了與 InstructBLIP 和 Qwen-VL 等成熟 VLM 系列相當(dāng)?shù)男阅堋?/span>

以下視頻演示了使用 VL-JEPA 進(jìn)行機(jī)器人實(shí)時(shí)狀態(tài)跟蹤 (RoboVQA):

該團(tuán)隊(duì)也進(jìn)行了消融實(shí)驗(yàn)驗(yàn)證 VL-JEPA 各組件的有效性。更多詳情請參閱原論文。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2025-03-25 12:11:08

2025-10-28 15:40:01

AI模型訓(xùn)練

2025-11-17 09:15:37

2025-10-17 09:08:05

2024-09-19 14:00:00

模型開源代碼

2025-06-17 09:07:24

2025-09-24 08:50:30

2024-12-25 09:30:00

2024-12-25 20:13:35

2025-01-09 09:56:34

視覺模型圖像生成

2025-05-29 09:14:00

AI模型訓(xùn)練

2023-12-01 13:36:01

阿里云通義千問

2025-09-29 09:01:36

2025-03-17 09:40:00

2024-08-30 15:19:22

2025-06-18 08:47:00

2025-04-24 09:21:00

2024-06-03 10:43:34

2025-02-17 12:30:00

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

91免费版网站在线观看| 欧美1819sex性处18免费| 亚洲自拍偷拍网| 国产欧美精品va在线观看| 98精品视频| 久久久精品动漫| 人人狠狠综合久久亚洲| 美女av免费观看| 国产精品无遮挡| 永久免费在线观看| 欧美色网一区二区| 欧美成人精品一区二区男人小说| 久久香蕉频线观| 日本久久成人网| 国产三级精品在线不卡| 国产精品一区久久久久| 精品亚洲一区二区三区四区| 天天免费综合色| 国产资源在线观看入口av| 色综合老司机第九色激情| 一区二区三区中文| 妞干网视频在线观看| 一区二区欧美国产| 99热国产在线| 午夜精品一区二区三区在线视| 国产综合精品一区| 日韩网站在线免费观看| 亚洲成人777| 都市激情综合| 91综合免费在线| 91在线观看污| 国产天堂在线| 欧美美女15p| 久久综合婷婷| 女人体1963| 亚洲人成网站777色婷婷| 成人6969www免费视频| 日本女人高潮视频| 精品日本高清在线播放| 蜜桃视频成人m3u8| 国产欧美日韩一区| 中文字幕一区免费在线观看| 日韩另类在线| 国产日韩中文字幕| 久久久99精品免费观看| 最新国产露脸在线观看| 日韩暖暖在线视频| 成人午夜av影视| 成人短视频在线| 国产欧美在线观看| 国产午夜精品久久| 性欧美18xxxhd| 精品在线视频一区二区三区| 亚洲女同女同女同女同女同69| a欧美人片人妖| 高清一区二区三区视频| 国产精品电影一区二区| 天天免费亚洲黑人免费| 国内不卡一区二区三区| 亚洲免费大片在线观看| 日本免费一区二区三区等视频| 久久国产主播精品| 亚洲一区二区成人在线观看| 日韩免费大片| 一区二区在线高清视频| 日本韩国一区二区三区| 杨幂一区二区三区免费看视频| 日韩精品一区二区免费| 欧美成人精品二区三区99精品| 国产精品久久久久久久| 超碰在线97免费| 日韩精品在线播放| 国产欧美激情| 成人免费在线观看| 成人福利视频在线观看| **网站欧美大片在线观看| 国产一区二区三区影视| 亚洲高清视频一区| 精品视频免费在线| 国产精品免费不| 国产福利在线免费| 久久综合伊人77777| 成人综合婷婷国产精品久久蜜臀| 国产乱码在线| 亚洲精品在线观看免费| 日韩精品一区二区在线| 亚洲欧美日韩一区在线观看| 成年人免费在线视频| 成人做爰66片免费看网站| 欧美日韩精品在线播放| 日韩精品免费一区二区三区| 五月婷婷狠狠操| 欧美日韩成人网| 97精品久久久午夜一区二区三区| 国产精品极品美女在线观看| 在线播放豆国产99亚洲| 亚洲成人免费网站| 久久精品国产77777蜜臀| 黄网站在线观| 这里只有精品66| 亚洲欧美一区二区三区久久| 国产一区二三区| 99re66热这里只有精品4| 免费看国产曰批40分钟| 欧美成人精品不卡视频在线观看| 久久综合九色综合欧美就去吻| 在线视频成人| 久久婷婷国产91天堂综合精品| 美日韩精品免费视频| 国产女人aaa级久久久级 | 欧美猛男超大videosgay| 好看不卡的中文字幕| 国产女人在线观看| 久久手机视频| 亚洲激情视频在线播放| 国产黄色成人av| 国产精品一区二区美女视频免费看| 欧美丰满熟妇xxxxx| 国产精品69久久| 欧美性xxxx在线播放| 国产欧美短视频| 欧美大片免费高清观看| 日本女优爱爱视频| 国产成人在线亚洲欧美| 欧美影片第一页| 国产在线视视频有精品| 麻豆一区在线| 中文在线天堂库| 免费观看成人高| 色一情一乱一区二区| 亚洲欧美在线视频观看| 欧美黄色大片网站| 青青青免费在线视频| 人妻少妇被粗大爽9797pw| 欧美在线视频免费播放| 欧美在线色视频| 国模娜娜一区二区三区| 国产精品美女久久久久| 蜜桃一级网站.| 免费看成人午夜电影| 中文字幕亚洲欧美一区二区三区 | 爱情岛论坛亚洲首页入口章节| 国产欧美日韩免费| 亚洲电影av在线| 日韩国产在线| 国产精品一二三| 国产三级在线播放| 精品人妻少妇一区二区| 26uuu久久噜噜噜噜| 欧美日韩国产片| av成人老司机| 午夜精品久久久久久久四虎美女版| 91麻豆国产福利在线观看宅福利| 免费看日本毛片| 亚洲bt欧美bt日本bt| 亚洲欧美精品一区二区| 亚洲国产精品久久不卡毛片 | 成视人a免费观看视频| 国产亚洲欧美一区二区| 日韩在线观看免费高清完整版| 亚洲国产视频直播| 国模无码大尺度一区二区三区| 欧美丝袜一区| 黄瓜视频成人app免费| 中文字幕av在线播放| 人人妻人人澡人人爽欧美一区| 国产欧美精品va在线观看| 亚洲一级黄色片| 在线看一区二区| 国产日韩欧美一区二区三区乱码 | 免费一级欧美在线观看视频| 日韩在线免费播放| 欧美色图色综合| 国产精品手机视频| 97视频人免费观看| 精品在线小视频| 欧美主播一区二区三区| 国产精品久久久99| 懂色av一区二区三区免费观看 | 色综合天天综合网天天狠天天| 99精品一区二区| 日本美女一区二区三区| 99精品网站| www.神马久久| 素人啪啪色综合| 污网站在线免费看| 欧美知名女优| 日韩一级理论片| 日本福利视频在线观看| 精品人伦一区二区三区| 国产精品久久色| 欧美黑人性猛交| 一本一本久久a久久精品综合小说 一本一本久久a久久精品牛牛影视 | 久久国产精品久久久久久久久久| 777亚洲妇女| 一道本成人在线| 一区二区三区精品在线| 久久天天做天天爱综合色| 国产成人自拍网| 国产在线视视频有精品|