国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

謝賽寧團(tuán)隊(duì)新作打破“多語言詛咒”!MetaCLIP 2支持300多種語言,英語性能反倒提升了

人工智能 新聞
謝賽寧團(tuán)隊(duì)提出了首個(gè)基于全球數(shù)據(jù)從頭訓(xùn)練的CLIP——MetaCLIP 2,通過擴(kuò)展元數(shù)據(jù)、優(yōu)化篩選和提升模型容量。

謝賽寧團(tuán)隊(duì)新作正在引起熱議!

一直以來,作為文生圖基石的CLIP模型主要基于英文數(shù)據(jù)訓(xùn)練,但實(shí)際上,全球互聯(lián)網(wǎng)仍有超過50%的非英文數(shù)據(jù)。

為了將CLIP模型進(jìn)一步擴(kuò)展,研究人員需要搞定兩大“攔路虎”:

  • 缺乏處理非英語數(shù)據(jù)的篩選方法;
  • 現(xiàn)有多語言CLIP的英語性能比純英語版本差(即所謂的“多語言詛咒”)。

而謝賽寧團(tuán)隊(duì)正是在這兩方面取得突破。他們提出了首個(gè)基于全球數(shù)據(jù)從頭訓(xùn)練的CLIP——MetaCLIP 2,通過擴(kuò)展元數(shù)據(jù)、優(yōu)化篩選和提升模型容量,斬獲了以下成果:

  1. 搭建了能處理300多種語言的CLIP數(shù)據(jù)整理流程。
  2. 打破了“多語言詛咒”,不僅沒有影響英語任務(wù)的表現(xiàn),而且反倒還提升了。

論文一作Yung-Sung Chuang(MIT博士生、現(xiàn)Meta實(shí)習(xí)生)激動(dòng)表示:

是時(shí)候告別語言過濾器了!

圖片

剛被小扎從OpenAI挖走的Lucas Beyer也出來對這一觀點(diǎn)表示認(rèn)同,順帶還感謝了論文中的引用:

很高興看到我們提出并始終倡導(dǎo)的“NoFilter”理念能在MetaCLIP 2中得到應(yīng)用。

這就是正確的道路!

圖片

這也引來了謝賽寧本人的回應(yīng):

早在MetaCLIP中,團(tuán)隊(duì)的目標(biāo)也是NoFilter(與其搞復(fù)雜過濾,不如相信原始數(shù)據(jù)的價(jià)值)。

我也認(rèn)為NoFilter才是正道。

圖片

下面詳細(xì)來看MetaCLIP 2所采用的方法。

基于MetaCLIP,進(jìn)一步優(yōu)化結(jié)構(gòu)和流程

概括而言,為了讓CLIP模型能從全球數(shù)據(jù)中學(xué)習(xí),MetaCLIP 2采用了三大關(guān)鍵創(chuàng)新:

  • 構(gòu)建全球元數(shù)據(jù)
  • 實(shí)施全球篩選算法
  • 構(gòu)建全球模型的訓(xùn)練框架

圖片

開始之前,論文先回顧了原始MetaCLIP所采用的思路。

簡單說,其篩選邏輯主要分三步:

  1. 從英語WordNet、維基百科提取50萬個(gè) “視覺概念”,組成元數(shù)據(jù)列表M;
  2. 用這些概念匹配圖像-文本對的描述文字(逐個(gè)檢查文本里的內(nèi)容,看能否匹配到M里的詞條);
  3. 設(shè)定一個(gè)閾值t,通過 “平衡機(jī)制”(控制頭部/尾部概念的比例)篩選數(shù)據(jù),確保“貓”“狗”這類常見概念和“深海生物”“小眾建筑”這類少見概念分布合理。

順便一提,OpenAI CLIP將t設(shè)置為20k,而MetaCLIP為了適配十億級英語數(shù)據(jù),把t調(diào)高到170k ,讓平衡策略更適合大規(guī)模數(shù)據(jù)。

而MetaCLIP 2,正是在英文MetaCLIP的基礎(chǔ)上,進(jìn)一步優(yōu)化了架構(gòu)和流程。

這第一步非常簡單,無非是將之前的元數(shù)據(jù)擴(kuò)展到300多種語言。

具體而言,它現(xiàn)在包含了多語言的WordNet和各國維基百科的詞匯,有點(diǎn)像給每種語言都編了一套 “視覺概念詞典”。

然后用算法給每種語言“量身篩數(shù)據(jù)”。

先是識別文字是哪種語言,再用對應(yīng)語言的“字典”去匹配圖像-文字對。

同時(shí)給每種語言設(shè)立單獨(dú)的篩選標(biāo)準(zhǔn)(比如控制“常見概念”和“少見概念”的比例),確保每種語言的數(shù)據(jù)分布合理,不會出現(xiàn)某類內(nèi)容過多的情況。

下圖為MetaCLIP 2篩選全球多語言圖像-文本對的偽代碼(用Python/NumPy風(fēng)格編寫):

圖片

最后再調(diào)整訓(xùn)練策略,避免“顧此失彼”。

一方面,鑒于全球數(shù)據(jù)變多了,所以團(tuán)隊(duì)按比例增加了訓(xùn)練時(shí)“見過的樣本量”(比如擴(kuò)大2.3倍),保證英語樣本量不減少。

另一方面,團(tuán)隊(duì)發(fā)現(xiàn)模型大小很關(guān)鍵——小一點(diǎn)的模型(如ViT-L/14)還會受“多語言詛咒”,但大一點(diǎn)的ViT-H/14能打破詛咒,讓英語和非英語能力一起提升。

圖片

p.s. 大語言模型中的“多語言詛咒”是指,當(dāng)模型在多語言數(shù)據(jù)上進(jìn)行訓(xùn)練時(shí),出現(xiàn)某些特定語言(尤其是原本表現(xiàn)較好的語言,如英語 )性能下降的現(xiàn)象。

采用以上數(shù)據(jù)篩選方法,MetaCLIP 2與NoFilter理念形成了深度協(xié)同——篩選邏輯的本質(zhì)從“語言過濾”(如直接排除非英語數(shù)據(jù))轉(zhuǎn)向“概念平衡”,從“排除數(shù)據(jù)”(如用單一標(biāo)準(zhǔn)排除數(shù)據(jù))轉(zhuǎn)向“優(yōu)化分布”。

多語言任務(wù)創(chuàng)下新SOTA,還打破了“多語言詛咒”

為了驗(yàn)證方法的有效性,團(tuán)隊(duì)基于全網(wǎng)公開數(shù)據(jù)(英語占44%,非英語占56%)進(jìn)行了實(shí)驗(yàn)。

訓(xùn)練配置上,團(tuán)隊(duì)基本沿用OpenAI CLIP/MetaCLIP的參數(shù),僅調(diào)整樣本量(如ViT-H/14用290億樣本)和模型容量。

實(shí)驗(yàn)結(jié)果顯示,MetaCLIP 2在多項(xiàng)測試中表現(xiàn)亮眼:

首先,它打破了大語言模型領(lǐng)域存在的“多語言詛咒”,證明學(xué)了非英語數(shù)據(jù)后,英語能力不僅沒有下降,甚至反而變強(qiáng)了。

例如,它在ImageNet識別日常物品上準(zhǔn)確率達(dá)到81.3%,超過純英語CLIP的80.5%。

圖片

其次,它在多語言測試中(如用280種語言給圖片分類、跨36種語言搜圖),成績遠(yuǎn)超之前的mSigLIP、SigLIP 2等模型。

還是上面這張圖,它在Babel-ImageNet多語言圖像分類任務(wù)里,取得了50.2%的準(zhǔn)確率;在XM3600圖像到文本檢索任務(wù)中,檢索匹配的準(zhǔn)確率達(dá)到64.3%。

更有意思的是,MetaCLIP 2不僅更懂“文化多樣性”,而且嵌入質(zhì)量也更優(yōu)。

一方面,它在文化多樣性任務(wù)(如地理定位)上表現(xiàn)更優(yōu),如在Dollar Street、GLDv2等數(shù)據(jù)集上,全球數(shù)據(jù)訓(xùn)練的模型準(zhǔn)確率顯著高于純英語或純非英語模型。

圖片

另一方面,它在對齊性(圖像-文本相關(guān)性)和均勻性(視覺嵌入分布)上的得分同樣更優(yōu)。

圖片

劃重點(diǎn),目前相關(guān)數(shù)據(jù)和代碼均已開源了~

論文:https://arxiv.org/abs/2507.22062

代碼地址:https://github.com/facebookresearch/MetaCLIP

責(zé)任編輯:張燕妮 來源: 量子位
相關(guān)推薦

2011-03-07 09:45:51

FileZilla

2025-08-01 09:08:00

2023-08-04 10:18:15

2025-04-08 09:10:00

模型訓(xùn)練AI

2025-07-04 08:52:00

3D圖像生成AI

2009-07-31 16:24:55

ibmdwEclipse

2014-04-16 14:50:20

Spark

2009-08-03 17:33:01

ASP.NET多語言支

2025-11-12 08:42:00

2009-07-17 10:02:29

WPF程序多語言支持

2023-05-25 16:24:13

2025-10-23 16:56:40

AI模型訓(xùn)練

2020-04-14 09:50:02

2024-12-23 12:37:34

2009-08-25 10:44:50

C#實(shí)現(xiàn)多語言

2011-08-05 17:54:33

Cocoa Touch 多語言

2014-07-09 09:20:06

WPFWPF應(yīng)用

2012-04-19 11:40:21

Titanium

2009-08-21 18:46:30

下載Server 20

2024-02-06 12:50:08

AI訓(xùn)練
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

91精品91| 午夜精品一区二区三区电影天堂 | 亚洲1卡2卡3卡4卡乱码精品| 美洲天堂一区二卡三卡四卡视频 | 香港欧美日韩三级黄色一级电影网站| 欧美日韩中文字幕日韩欧美| 国产精品va在线观看无码| 久久99国产精品久久99大师| 日韩国产一区三区| 91伦理视频在线观看| 亚洲精品久久久蜜桃| 女人天堂av手机在线| 天堂va蜜桃一区二区三区漫画版| 日本亚洲欧洲色| 亚洲天堂中文字幕在线观看| 亚洲欧美综合图区| 亚洲大胆人体大胆做受1| 欧美日韩在线视频首页| 羞羞视频立即看| 久久精品人人做人人爽人人| 少妇大叫太大太粗太爽了a片小说| 91不卡在线观看| 国产国语videosex另类| gogo久久日韩裸体艺术| 久久精品国产91精品亚洲| av电影一区| 亚洲精品国产欧美| 宅男网站在线免费观看| 91精品国产免费久久综合| 国产二区在线播放| 日韩欧美成人精品| 免费观看v片在线观看| 一区二区三区日韩欧美| 久草在线国产| 亚洲黄一区二区三区| 欧美aaa大片| 亚洲r级在线视频| 在线视频手机国产| 日韩欧美精品中文字幕| 日本中文字幕电影在线观看 | 久久精品国产成人| 黄瓜视频成人app免费| 国产一区二区免费| 国产精品伦一区二区| 日韩一区av在线| 欧美国产中文高清| 超薄丝袜一区二区| 久久精品凹凸全集| 国产精品激情av在线播放 | 91国产视频在线观看| 外国精品视频在线观看| 在线视频你懂得一区二区三区| 污版网站在线观看| 亚洲自拍偷拍麻豆| 国产一二三区在线视频| 欧美日本在线视频| av影片在线| 久久久精品国产网站| 久久视频在线观看| 成人国产精品av| 亚洲伊人网站| 蜜桃视频成人在线观看| 99re66热这里只有精品3直播| 成人免费观看cn| 欧美激情综合网| 一级视频在线免费观看| 欧美高清精品3d| 永久免费毛片在线播放| 另类天堂视频在线观看| sdde在线播放一区二区| 精品免费一区二区三区蜜桃| 国产精品123| 激情av网站| 日韩一二三四区| 日韩免费一级| www.久久久| 国产成人8x视频一区二区 | 国产精品精品国产一区二区| 国产精品日韩一区二区 | 开心丁香婷婷深爱五月| 色悠久久久久综合欧美99| 亚洲综合伊人久久大杳蕉| 久久精品国产欧美激情| 日本女优一区| 亚洲aⅴ天堂av在线电影软件| 国产成人亚洲精品青草天美| bt电影在线| 欧美老女人第四色| 国产一区二区三区视频在线| 亚洲xxx自由成熟| 国产二区国产一区在线观看| 2019中文字幕视频| 日韩精品最新网址| 麻豆成人入口| 欧美一区2区三区4区公司二百| 国产剧情一区二区三区| 国产wwww| 亚洲美女久久久| 久久香蕉国产| 久久99中文字幕| 在线视频观看一区| 日韩成人18| 亚洲美女网站18| 亚洲成人你懂的| 亚洲精品一区二区在线播放∴| 91免费高清视频| 久久免费看少妇高潮| 污污在线观看| 国产色婷婷国产综合在线理论片a| 秋霞电影一区二区| 在线观看免费网站| 久久影视免费观看 | 国产日本久久| 成人久久一区二区| 白白色 亚洲乱淫| h视频网站在线观看| 欧美黑人巨大精品一区二区| 亚洲欧美日韩国产综合精品二区 | 国产婷婷成人久久av免费高清| 91精品国产自产精品男人的天堂| 成人在线免费观看一区| 欧美激情在线一区二区| 国产美女精品写真福利视频| 亚洲综合中文字幕68页| 欧美极品美女视频| 超碰aⅴ人人做人人爽欧美| 99久久自偷自偷国产精品不卡| 91丝袜国产在线播放| 色呦呦久久久| 国产精品手机视频| 中文字幕日韩av资源站| 久久99国产精品二区高清软件| 成人在线看片| 午夜电影网亚洲视频| 成人搞黄视频| 免费一级特黄特色毛片久久看| 无吗不卡中文字幕| 久久a爱视频| 日本精品www| 国产亚洲精品成人av久久ww| 奇米777欧美一区二区| 日本美女在线中文版| 亚洲www在线| 亚洲18色成人| 国产精品一国产精品| 中文字幕网av| 久久99久久99精品免观看粉嫩| 国产在线播放一区二区三区| fc2ppv国产精品久久| 久久久久久久久四区三区| 欧美日韩激情一区| 国产精品日本| av在线free| 亚洲人成网站在线观看播放| 欧美一区国产二区| 国产亚洲一级| 欧美亚洲系列| 少妇熟女一区二区| 亚洲人成电影网| 粉嫩高潮美女一区二区三区 | 欧美日韩蜜桃| 欧美美乳在线| 成人黄色片视频网站| 色欧美片视频在线观看| 国产精品观看| 调教视频免费在线观看| 精品欧美一区二区在线观看视频| 欧美在线你懂的| 免费永久网站黄欧美| 任你弄在线视频免费观看| 黄色网zhan| 色av中文字幕一区| 国产亲近乱来精品视频| 国产欧美日韩视频在线| 亚洲色图另类色图| 欧美不卡在线一区二区三区| 亚洲第一av网站| 99r国产精品| 国产欧美日韩精品一区二区三区 | 久久精品国产亚洲aⅴ | 91九色露脸| 欧美一区三区二区| 国产美女av一区二区三区| 国产精品视频首页| 日本韩国福利视频| 国产精品一区二区av| 日韩欧美在线123| 懂色av一区二区三区免费观看| 日本.亚洲电影| 国产主播色在线| 久久国产手机看片| 在线播放日韩专区| 一区二区三区日韩欧美精品| 99国产精品久久久久久久成人热 | av资源在线观看免费高清| 日本一区视频在线| 欧美精品情趣视频| 欧美日韩在线视频观看| 韩国精品在线观看| 综合亚洲自拍|