国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

<progress id="fmjzb"><tfoot id="fmjzb"></tfoot></progress>

<table id="fmjzb"></table>

<delect id="fmjzb"></delect>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

LeCun的JEPA已進(jìn)化為視覺-語言模型，1.6B參數(shù)比肩72B Qwen-VL

2025-12-22 08:55:00

人工智能新聞

近日，來自 Meta、香港科技大學(xué)、索邦大學(xué)、紐約大學(xué)的一個(gè)聯(lián)合團(tuán)隊(duì)基于 JEPA 打造了一個(gè)視覺-語言模型：VL-JEPA。

LeCun 的聯(lián)合嵌入預(yù)測架構(gòu)（JEPA）迎來了新進(jìn)展。

近日，來自 Meta、香港科技大學(xué)、索邦大學(xué)、紐約大學(xué)的一個(gè)聯(lián)合團(tuán)隊(duì)基于 JEPA 打造了一個(gè)視覺-語言模型：VL-JEPA。

據(jù)作者 Pascale Fung 介紹，VL-JEPA 是第一個(gè)基于聯(lián)合嵌入預(yù)測架構(gòu)，能夠?qū)崟r(shí)執(zhí)行通用領(lǐng)域視覺-語言任務(wù)的非生成模型。

下面展示了一段該模型實(shí)時(shí)工作的視頻：

不同于傳統(tǒng)的視覺-語言模型（VLM）通過自回歸方式生成 token，VL-JEPA 預(yù)測的是目標(biāo)文本的連續(xù)嵌入（embedding）。通過在抽象的表征空間中學(xué)習(xí)，該模型能夠?qū)Ｗ⒂谂c任務(wù)相關(guān)的語義，同時(shí)忽略表層語言形式的多變性。

論文標(biāo)題：VL-JEPA: Joint Embedding Predictive Architecture for Vision-language
論文地址：https://arxiv.org/abs/2512.10942

該論文共有四位共一作者：Delong Chen（陳德龍）、Mustafa Shukor、Théo Moutakanni、Willy Chung。JEPA 提出者、圖靈獎得主 Yann LeCun 也在作者名單中。

當(dāng)前 VLM 面臨的困難

理解周圍的物理世界是高級機(jī)器智能最重要的方面之一。這種能力使 AI 系統(tǒng)能夠在現(xiàn)實(shí)世界中學(xué)習(xí)、推理、規(guī)劃和行動，從而協(xié)助人類。

需要在現(xiàn)實(shí)世界中行動的智能系統(tǒng)包括可穿戴設(shè)備和機(jī)器人。構(gòu)成這一能力的機(jī)器學(xué)習(xí)任務(wù)包括描述生成（captioning）、檢索、視覺問答、動作跟蹤、推理和規(guī)劃等。用于此類現(xiàn)實(shí)世界應(yīng)用的系統(tǒng)必須具備實(shí)時(shí)響應(yīng)能力，且具有低延遲和低推理成本。

目前，完成這些任務(wù)的通用方法是使用基于 token 生成的大型視覺 - 語言模型（VLM）。

這些模型接收視覺輸入 X_V 和文本查詢 X_Q，在 token 空間中自回歸地生成所需的文本響應(yīng) Y，即 (X_V,X_Q)? Y。這種方法雖然直觀，但也有不足，原因主要有二：

VLM 的開發(fā)成本高昂。因?yàn)樗鼈兊挠?xùn)練目標(biāo)是生成響應(yīng) Y，這要求模型捕捉任務(wù)相關(guān)的語義，同時(shí)還要處理與任務(wù)無關(guān)的表層語言特征（如選詞、風(fēng)格或改寫）。在訓(xùn)練過程中，VLM 必須同時(shí)對這兩個(gè)方面建模，導(dǎo)致計(jì)算資源被浪費(fèi)在生成多樣化的 token 序列上，而這些序列最終并不影響輸出的正確性。
實(shí)時(shí)任務(wù)面臨延遲挑戰(zhàn)。涉及直播視頻的實(shí)時(shí)任務(wù)（如實(shí)時(shí)動作跟蹤）需要稀疏且選擇性的解碼（例如，僅在新事件發(fā)生時(shí)才發(fā)出描述）。然而，VLM 依賴于逐 token 的自回歸解碼，必須在揭示 Y 的底層語義之前完成整個(gè)解碼過程。這一過程引入了不必要的延遲，并阻礙了實(shí)時(shí)動態(tài)更新語義的能力。

視覺-語言聯(lián)合嵌入預(yù)測架構(gòu)（VL-JEPA）

這個(gè)聯(lián)合團(tuán)隊(duì)開發(fā)的視覺-語言聯(lián)合嵌入預(yù)測架構(gòu)（VL-JEPA）能將昂貴的數(shù)據(jù)空間 token 生成學(xué)習(xí)轉(zhuǎn)變?yōu)楦咝У臐摽臻g語義預(yù)測。

如圖 1 所示，該模型會使用 x-encoder 將視覺輸入 X_V 映射為嵌入 S_V，使用 y-encoder 將目標(biāo)文本 Y 映射為嵌入 S_Y，并使用一個(gè)預(yù)測器來學(xué)習(xí)映射 (S_V,X_Q)? S_Y，其中 X_Q 是文本查詢（即提示詞）。

訓(xùn)練目標(biāo)定義在嵌入空間 ??_{VL-JEPA}=D (?_Y,S_Y)，而不是數(shù)據(jù)空間 ??_VLM=D (?,Y)。在推理過程中，當(dāng)需要時(shí)，y-encoder 會將預(yù)測的嵌入 ?_Y 讀出為文本空間 ?。

得益于其非生成式的特性，VL-JEPA 不必在 token 空間重建 Y 的每一個(gè)表層細(xì)節(jié)。相反，它只需要在嵌入空間預(yù)測抽象表征 S_Y。

在原始的 One-hot token 空間中，對于同一輸入，不同的合理輸出 Y 如果不共享重疊的 token，往往看起來幾乎是正交的。然而，在嵌入空間中，這些多樣化的目標(biāo)可以被映射到共享相似語義的鄰近點(diǎn)。

這就簡化了目標(biāo)分布，從而使學(xué)習(xí)過程更加高效。此外，與 VLM 不同，這種方法消除了在訓(xùn)練期間使用重型解碼器學(xué)習(xí)語言生成的需要，從而顯著提高了效率。

同時(shí)，得益于其非自回歸的特性，VL-JEPA 可以在滑動窗口內(nèi)以極低的延遲產(chǎn)生連續(xù)的目標(biāo)語義嵌入流，因?yàn)樗恍枰淮吻跋騻鬟f，無需自回歸解碼。

這對實(shí)時(shí)在線應(yīng)用（如實(shí)時(shí)動作跟蹤、場景識別或規(guī)劃）特別有利，在這些應(yīng)用中，嵌入流可以被輕量級的 Y-Decoder 選擇性地解碼，從而實(shí)現(xiàn)高效且及時(shí)的更新。

實(shí)驗(yàn)表現(xiàn)

VL-JEPA 的優(yōu)勢也得到了實(shí)驗(yàn)驗(yàn)證。

該團(tuán)隊(duì)將其與經(jīng)典的 token 生成式 VLM 進(jìn)行了比較：兩種設(shè)置使用相同的視覺編碼器、空間分辨率、幀率、訓(xùn)練數(shù)據(jù)、批量大小和迭代次數(shù)等，唯一的區(qū)別在于目標(biāo)是在 token 空間還是嵌入空間。

在這種匹配的訓(xùn)練條件下，VL-JEPA 在零樣本描述生成和分類上提供了一致的更高性能，同時(shí)使用的可訓(xùn)練參數(shù)大約只有一半，這表明嵌入空間監(jiān)督提高了學(xué)習(xí)效率。

除了訓(xùn)練階段，VL-JEPA 還通過選擇性解碼（selective decoding）帶來了顯著的推理效率提升，即僅在預(yù)測的嵌入流發(fā)生顯著變化時(shí)才進(jìn)行解碼。

實(shí)驗(yàn)表明，該策略將解碼操作次數(shù)減少了約 2.85 倍，同時(shí)保持了以平均 CIDEr 分?jǐn)?shù)衡量的整體輸出質(zhì)量。

該團(tuán)隊(duì)最終的 VL-JEPA 模型分兩個(gè)階段訓(xùn)練：

使用描述數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，以建立穩(wěn)健的視覺-語言對齊；
監(jiān)督微調(diào)（SFT）階段，賦予模型 VQA 能力。

第一階段產(chǎn)生的模型稱為 VL-JEPA_BASE，在零樣本分類和文本到視頻檢索方面進(jìn)行了評估。

VL-JEPA_BASE 在平均分類準(zhǔn)確率（跨 8 個(gè)數(shù)據(jù)集）和檢索 recall@1（跨 8 個(gè)數(shù)據(jù)集）方面優(yōu)于 CLIP、SigLIP2 和 Perception Encoder 模型。

經(jīng)過第二階段后，得到的 VL-JEPA_SFT 由于接觸了域內(nèi)訓(xùn)練數(shù)據(jù)，分類性能顯著提高。

作為一個(gè)統(tǒng)一的通用模型，VL-JEPA_SFT 接近了針對單個(gè)基準(zhǔn)優(yōu)化的專用模型的性能。同時(shí)，VL-JEPA_SFT 展現(xiàn)了有效的 VQA 能力，在涵蓋組合視覺推理、復(fù)雜對象計(jì)數(shù)和對象幻覺的四個(gè)數(shù)據(jù)集上，達(dá)到了與 InstructBLIP 和 Qwen-VL 等成熟 VLM 系列相當(dāng)?shù)男阅堋?/span>

以下視頻演示了使用 VL-JEPA 進(jìn)行機(jī)器人實(shí)時(shí)狀態(tài)跟蹤 (RoboVQA)：

該團(tuán)隊(duì)也進(jìn)行了消融實(shí)驗(yàn)驗(yàn)證 VL-JEPA 各組件的有效性。更多詳情請參閱原論文。

責(zé)任編輯：張燕妮來源：機(jī)器之心

AI 語言模型架構(gòu)

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

91免费版网站在线观看| 欧美1819sex性处18免费| 亚洲自拍偷拍网| 国产欧美精品va在线观看| 98精品视频| 久久久精品动漫| 人人狠狠综合久久亚洲| 美女av免费观看| 国产精品无遮挡| 永久免费在线观看| 欧美色网一区二区| 欧美成人精品一区二区男人小说| 久久香蕉频线观| 日本久久成人网| 国产三级精品在线不卡| 国产精品一区久久久久| 精品亚洲一区二区三区四区| 天天免费综合色| 国产资源在线观看入口av| 色综合老司机第九色激情| 一区二区三区中文| 妞干网视频在线观看| 一区二区欧美国产| 99热国产在线| 午夜精品一区二区三区在线视| 国产综合精品一区| 日韩网站在线免费观看| 亚洲成人777| 都市激情综合| 91综合免费在线| 91在线观看污| 国产天堂在线| 欧美美女15p| 久久综合婷婷| 女人体1963| 亚洲人成网站777色婷婷| 成人6969www免费视频| 日本女人高潮视频| 精品日本高清在线播放| 蜜桃视频成人m3u8| 国产欧美日韩一区| 中文字幕一区免费在线观看| 日韩另类在线| 国产日韩中文字幕| 久久久99精品免费观看| 最新国产露脸在线观看| 日韩暖暖在线视频| 成人午夜av影视| 成人短视频在线| 国产欧美在线观看| 国产午夜精品久久| 性欧美18xxxhd| 精品在线视频一区二区三区| 亚洲女同女同女同女同女同69| a欧美人片人妖| 高清一区二区三区视频| 国产精品电影一区二区| 天天免费亚洲黑人免费| 国内不卡一区二区三区| 亚洲免费大片在线观看| 日本免费一区二区三区等视频| 久久国产主播精品| 亚洲一区二区成人在线观看| 日韩免费大片| 一区二区在线高清视频| 日本韩国一区二区三区| 杨幂一区二区三区免费看视频| 日韩精品一区二区免费| 欧美成人精品二区三区99精品| 国产精品久久久久久久| 超碰在线97免费| 日韩精品在线播放| 国产欧美激情| 成人免费在线观看| 成人福利视频在线观看| **网站欧美大片在线观看| 国产一区二区三区影视| 亚洲高清视频一区| 精品视频免费在线| 国产精品免费不| 国产福利在线免费| 久久综合伊人77777| 成人综合婷婷国产精品久久蜜臀| 国产乱码在线| 亚洲精品在线观看免费| 日韩精品一区二区在线| 亚洲欧美日韩一区在线观看| 成年人免费在线视频| 成人做爰66片免费看网站| 欧美日韩精品在线播放| 日韩精品免费一区二区三区| 五月婷婷狠狠操| 欧美日韩成人网| 97精品久久久午夜一区二区三区| 国产精品极品美女在线观看| 在线播放豆国产99亚洲| 亚洲成人免费网站| 久久精品国产77777蜜臀| 黄网站在线观| 这里只有精品66| 亚洲欧美一区二区三区久久| 国产一区二三区| 99re66热这里只有精品4| 免费看国产曰批40分钟| 欧美成人精品不卡视频在线观看| 久久综合九色综合欧美就去吻| 在线视频成人| 久久婷婷国产91天堂综合精品| 美日韩精品免费视频| 国产女人aaa级久久久级 | 欧美猛男超大videosgay| 好看不卡的中文字幕| 国产女人在线观看| 久久手机视频| 亚洲激情视频在线播放| 国产黄色成人av| 国产精品一区二区美女视频免费看| 欧美丰满熟妇xxxxx| 国产精品69久久| 欧美性xxxx在线播放| 国产欧美短视频| 欧美大片免费高清观看| 日本女优爱爱视频| 国产成人在线亚洲欧美| 欧美影片第一页| 国产在线视视频有精品| 麻豆一区在线| 中文在线天堂库| 免费观看成人高| 色一情一乱一区二区| 亚洲欧美在线视频观看| 欧美黄色大片网站| 青青青免费在线视频| 人妻少妇被粗大爽9797pw| 欧美在线视频免费播放| 欧美在线色视频| 国模娜娜一区二区三区| 国产精品美女久久久久| 蜜桃一级网站.| 免费看成人午夜电影| 中文字幕亚洲欧美一区二区三区 | 爱情岛论坛亚洲首页入口章节| 国产欧美日韩免费| 亚洲电影av在线| 日韩国产在线| 国产精品一二三| 国产三级在线播放| 精品人妻少妇一区二区| 26uuu久久噜噜噜噜| 欧美日韩国产片| av成人老司机| 午夜精品久久久久久久四虎美女版| 91麻豆国产福利在线观看宅福利| 免费看日本毛片| 亚洲bt欧美bt日本bt| 亚洲欧美精品一区二区| 亚洲国产精品久久不卡毛片 | 成视人a免费观看视频| 国产亚洲欧美一区二区| 日韩在线观看免费高清完整版| 亚洲国产视频直播| 国模无码大尺度一区二区三区| 欧美丝袜一区| 黄瓜视频成人app免费| 中文字幕av在线播放| 人人妻人人澡人人爽欧美一区| 国产欧美精品va在线观看| 亚洲一级黄色片| 在线看一区二区| 国产日韩欧美一区二区三区乱码 | 免费一级欧美在线观看视频| 日韩在线免费播放| 欧美色图色综合| 国产精品手机视频| 97视频人免费观看| 精品在线小视频| 欧美主播一区二区三区| 国产精品久久久99| 懂色av一区二区三区免费观看 | 色综合天天综合网天天狠天天| 99精品一区二区| 日本美女一区二区三区| 99精品网站| www.神马久久| 素人啪啪色综合| 污网站在线免费看| 欧美知名女优| 日韩一级理论片| 日本福利视频在线观看| 精品人伦一区二区三区| 国产精品久久色| 欧美黑人性猛交| 一本一本久久a久久精品综合小说一本一本久久a久久精品牛牛影视 | 久久国产精品久久久久久久久久| 777亚洲妇女| 一道本成人在线| 一区二区三区精品在线| 久久天天做天天爱综合色| 国产成人自拍网| 国产在线视视频有精品|

<dfn id="pap5i"><legend id="pap5i"></legend></dfn>