国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

12種模態(tài),一個學習框架,Meta-Transformer實現(xiàn)骨干網(wǎng)絡(luò)大一統(tǒng)

人工智能 新聞
近日,香港中文大學多媒體實驗室聯(lián)合上海人工智能實驗室的研究團隊提出一個統(tǒng)一多模態(tài)學習框架 ——Meta-Transformer,采用全新的設(shè)計思路,通過統(tǒng)一學習無配對數(shù)據(jù),可以理解 12 種模態(tài)信息。

在邁向通用人工智能(AGI)的諸多可能的方向中,發(fā)展多模態(tài)大模型(MLLM)已然成為當前炙手可熱的重要路徑。在 GPT4 對圖文理解的沖擊下,更多模態(tài)的理解成為學術(shù)界關(guān)注的焦點,通感時代真要來了嗎?

我們知道,人類在學習的過程中不僅僅會接觸到文字、圖像,還會同時接觸聲音、視頻等各種模態(tài)的信息,并在腦中對這些信息同時進行加工處理和統(tǒng)一學習。

那么:人工智能可以具備人類統(tǒng)一學習多模態(tài)信息的能力嗎?事實上,多模態(tài)之間的互補性可以增強人工智能的學習能力,比如,CLIP 將圖像與文本進行統(tǒng)一學習的方式就取得了巨大的成功。但受限于多種模態(tài)之間巨大的差異性以及現(xiàn)有多模態(tài)模型對配對數(shù)據(jù)的依賴性,實現(xiàn)模態(tài)通用感知存在著艱巨挑戰(zhàn)。

為了解決上述挑戰(zhàn),近日,香港中文大學多媒體實驗室聯(lián)合上海人工智能實驗室的研究團隊提出一個統(tǒng)一多模態(tài)學習框架 ——Meta-Transformer,采用全新的設(shè)計思路,通過統(tǒng)一學習無配對數(shù)據(jù),可以理解 12 種模態(tài)信息

圖片圖片



圖片


  • 網(wǎng)站地址:https://kxgong.github.io/meta_transformer/
  • 代碼地址:https://github.com/invictus717/MetaTransformer

Meta-Transformer 實現(xiàn)骨干網(wǎng)絡(luò)的大一統(tǒng),具有一個模態(tài)共享編碼器,并且無需配對數(shù)據(jù),能夠在 12 個不同的模態(tài)上完成 16 個不同的感知任務。該工作不僅為當前多模態(tài)學習提供了強大的工具,也給多模態(tài)領(lǐng)域帶來新的設(shè)計思路。

圖 1:Meta-Transformer 框架下統(tǒng)一的多模態(tài)感知,能夠處理 12 種不同的模態(tài)圖 1:Meta-Transformer 框架下統(tǒng)一的多模態(tài)感知,能夠處理 12 種不同的模態(tài)

表 1:相比于現(xiàn)有工作,Meta-Transformer 可以利用統(tǒng)一的模態(tài)共享編碼器來處理更多的模態(tài),并且擺脫了多模態(tài)訓練過程中對于配對數(shù)據(jù)的依賴性。

接下來,一起詳細看一看 Meta-Transformer 的創(chuàng)新與貢獻體現(xiàn)在哪些方面。

Meta-Transformer 通向無限模態(tài)的感知范式

1、統(tǒng)一的模態(tài)共享編碼器

相比于先前 CLIP 使用不同的圖像和文本編碼器,以及 BEIT-3 的部分共享編碼器框架,Meta-Transformer 的核心設(shè)計在于一個所有模態(tài)完全共享的編碼器。該設(shè)計在編碼器層面統(tǒng)一多達 12 個模態(tài),證明了多模態(tài)數(shù)據(jù)完全共享編碼器的可行性。共享編碼器有助于在編碼器階段減小由不同的網(wǎng)絡(luò)參數(shù)引入的表征差異,這離統(tǒng)一的多模態(tài)感知智能更近了一步,即一個通用的網(wǎng)絡(luò)結(jié)構(gòu)處理任意模態(tài)的信息。

Meta-Transformer 可以有效地處理和學習高達 12 種模態(tài)的數(shù)據(jù),從常見的文本、圖像到音頻、視頻,甚至在其他更復雜的數(shù)據(jù)類型上也有所突破,如點云和高光譜數(shù)據(jù)。該設(shè)計有助于拓寬未來的多模態(tài)工作的設(shè)計思路。

圖 2:Meta-Transformer 的框架圖:對于不同模態(tài)的數(shù)據(jù),研究人員基于不同模態(tài)的信息特性設(shè)計了相應的特征序列構(gòu)造方式,接著將得到的特征序列輸入到預訓練后參數(shù)凍結(jié)的編碼器中,由此提取的表征能夠在多個模態(tài)上解決下游多個任務。

2、無需配對數(shù)據(jù):更加靈活的訓練方式

當前許多模態(tài)工作依賴于內(nèi)容配對的多模態(tài)數(shù)據(jù)來語義對齊兩個模態(tài),但收集生成多個模態(tài)兩兩之間配對的數(shù)據(jù)的高難度限制了當前的多模態(tài)工作推廣到更廣泛的數(shù)據(jù)模態(tài)上。為了緩解這一限制,該研究提出 Data2Seq 方法, 將不同模態(tài)的原數(shù)據(jù)嵌入到一個共同編碼空間,轉(zhuǎn)換成各自對應 token 序列,隨后使用統(tǒng)一的模態(tài)共享編碼器繼續(xù)編碼 token 序列,因而任一模態(tài)的數(shù)據(jù)就可以訓練 Meta-Transformer 感知相應的模態(tài)的能力。實驗表明,Meta-Transformer 能夠在缺少配對數(shù)據(jù)訓練場景下展現(xiàn)優(yōu)異性能。

3、更多模態(tài):通向模態(tài)通用感知

現(xiàn)有的多模態(tài)模態(tài)框架多側(cè)重于視覺和語言,較少衍生到更多其他模態(tài)。相比之下,Meta-Transformer 能夠?qū)τ?12 種不同的數(shù)據(jù)模態(tài)提供一套統(tǒng)一的學習框架,包括文本、圖像、點云、音頻、視頻、紅外、超光譜、X 射線、表格、圖形、時間序列和慣性測量單元(IMU)數(shù)據(jù)。這種廣泛的數(shù)據(jù)模態(tài)覆蓋,極大擴展了 Meta-Transformer 的應用范圍,并且 Meta-transformer 框架對于擴展到更多的模態(tài)有著易擴展、低成本、高訓練效率的優(yōu)勢。

Meta-Transformer 的方法介紹

Meta-Transformer 統(tǒng)一處理來自不同模態(tài)的數(shù)據(jù),并通過共享編碼器完成對十二種模態(tài)的編碼。為了實現(xiàn)這一目標,Meta-Transformer 由三個部分組成:Data2Seq tokenization 模塊、統(tǒng)一的共享編碼模塊和下游任務學習模塊。

首先,研究人員提出了一套處理多模態(tài)數(shù)據(jù)的核心方案:數(shù)據(jù)分組 — 卷積提取局部語義 — 語義聚合 —— 空間映射,將各種模態(tài)的數(shù)據(jù)轉(zhuǎn)換為在同一個共享的嵌入空間內(nèi)的 token 序列。

圖 3:Data-to-Sequence 的設(shè)計方案能夠有效地將不同模態(tài)的數(shù)據(jù)轉(zhuǎn)化為同一個流行嵌入空間內(nèi)的 token 序列,具有極強的模態(tài)拓展性。

緊接著,Meta-Transformer 將使用統(tǒng)一的共享編碼器對上一步得到的的不同模態(tài)的 token 序列進行編碼。研究人員使用 LAION-2B 數(shù)據(jù)集對于骨干網(wǎng)絡(luò)進行預訓練,在預訓練之后凍結(jié)了模型參數(shù),得到深度為 L 的 Transformer 編碼器由多個堆疊的多頭自注意力(MSA)層和 MLP 塊組成。輸入的 token 首先進入 MSA 層,然后進入 MLP 塊。然后第 (?- 1) 個 MLP 塊的輸出作為第?個 MSA 層的輸入,層歸一化(LN)被添加到每一層之前。MLP 包含兩個線性 FC 層和一個 GELU 非線性激活層。

最后,在獲得學習表征后,研究人員將表征輸入特定任務的頭,它主要由 MLP 組成,因模態(tài)和任務而異。Meta-Transformer 的學習目標可以概括為

圖片


其中 h (?),g (?),與 f (?),分別表示 tokenizer,模型骨干網(wǎng)絡(luò),以及下游任務網(wǎng)絡(luò)中的運算過程。

實驗結(jié)果

Meta-Transformer 具有豐富且優(yōu)秀的實驗結(jié)果。下表 2 展示了 Meta-Transformer 在不同模態(tài)上的實驗內(nèi)容。可以看出,Meta-Transformer 從 12 種模態(tài)中提取表征信息,能夠有效地服務 16 個不同模態(tài)的下游任務,且擁有出色的性能。

表 2:Meta-Transformer 能處理 12 個模態(tài)的 16 個感知任務.

圖片圖片

圖 3:Meta-Transforme 有著優(yōu)秀的多模態(tài)感知能力,在文字、圖像、點云、聲音、紅外、高光譜以及醫(yī)療 X 光圖像理解任務方面與現(xiàn)有的單模態(tài) SOTA 模型性能相接近,并且在多模態(tài)理解能力方面大幅領(lǐng)先 ImageBind.

對于圖像理解:

如下表 3 所示,與 Swin Transformer 系列和 InternImage 相比,Meta-Transformer 在圖像理解任務中表現(xiàn)突出。在分類任務中,Meta-Transformer 與 Meta-Transformer-B16F 和 Meta-Transformer-L14F 在零鏡頭分類下的表現(xiàn)非常好,分別達到了 69.3% 和 75.3%。與此同時,當調(diào)整預訓練參數(shù)時,Meta-Transformer-B16T 和 Meta-Transformer-L14T 分別達到 85.4% 和 88. 1% 的準確率,超越了現(xiàn)有最先進的方法。在目標檢測與語義分割方面,Meta-Transformer 也提供了出色的性能,進一步證明了其對圖像理解的通用能力。

表 3:Meta-Transformer 對于圖像理解方面的能力,分別在 ImageNet-1K 圖像分類,MS COCO 目標檢測,以及 ADE-20K 的語義分割上進行了評估。

對于點云理解:

表 4 展示了 Meta-Transformer 在點云上的實驗結(jié)果。當在二維數(shù)據(jù)上進行預訓練時,Meta-Transformer 在 ModelNet-40 上僅用 0.6M 可訓練參數(shù)就達到了 93.6% 的總體準確率(OA),與表現(xiàn)最好的模型不相上下。此外,Meta-Transformer 在 ShapeNetPart 數(shù)據(jù)集中表現(xiàn)出色,僅訓練 2.3M 參數(shù)的情況下,在實例 mIoU 和類別 mIoU 方面都獲得了最好的實驗結(jié)果,分別為 87.0% 和 85.2%。由此可見,Meta-Transformer 在點云理解任務中表現(xiàn)出了顯著的優(yōu)勢,在可訓練參數(shù)較少的情況下提供了具有競爭力的性能。

表 4:Meta-Transformer 對于點云理解方面的能力,分別在 ModelNet-40 形狀分類,S3DIS 室內(nèi)場景分割,以及 ShapeNet Part 物體分割任務上進行了評估。

研究結(jié)論

Meta-Transformer 是一種統(tǒng)一的多模態(tài)學習框架,它能處理并關(guān)聯(lián)來自多種模態(tài)的信息,包括自然語言、2D 圖像、3D 點云、音頻、視頻等。它實現(xiàn)了無配對訓練數(shù)據(jù)的場景下進行多模態(tài)感知,是第一個能夠在 12 種模態(tài)上進行統(tǒng)一學習的框架。Meta-Transformer 能夠有助于將多模態(tài)大模型推廣至更多模態(tài),也為實現(xiàn)統(tǒng)一的多模態(tài)智能提供了參考。Meta-Transformer 具有的多模態(tài)感知理解能力也會為人工智能技術(shù)作為服務全社會的基礎(chǔ)設(shè)施,對于教育、醫(yī)療、娛樂等領(lǐng)域提供更智能、更便捷、更豐富多元的服務。

責任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2023-07-30 16:05:44

多模態(tài)學習框架自然語言

2024-08-26 07:40:00

AI訓練

2025-07-17 10:33:53

2023-05-10 14:58:06

開源模型

2025-06-09 09:50:00

VeactReact

2015-07-30 12:27:30

重郵華為

2017-12-15 17:14:10

云端

2024-04-23 13:38:00

AI數(shù)據(jù)

2015-05-06 13:52:52

微軟外媒

2020-12-13 13:40:22

健康碼移動應用

2025-03-13 10:18:42

2014-07-29 13:25:43

WWDC 2014 S

2023-03-13 13:40:20

機器學習AI

2024-01-24 09:24:19

自動駕駛算法

2025-03-18 09:29:54

2012-02-28 09:54:01

Windows 8微軟賬戶

2024-12-10 09:49:53

2023-07-17 08:03:03

Shell腳本SQL

2024-03-20 09:29:41

2024-03-04 00:45:00

視頻訓練
點贊
收藏

51CTO技術(shù)棧公眾號

亚洲免费网站| 免费在线成人| 欧美精品xxxxbbbb| 国产乱理伦片a级在线观看| 日韩精品一区二区三区| 日本精品视频一区二区三区| 国产小视频在线| 日本亚洲欧美天堂免费| 成人一区二区在线| 亚洲国产婷婷| 全部孕妇毛片丰满孕妇孕交| 欧美最新大片在线看| 欧美大片免费| 亚洲影院污污.| 91日韩在线专区| 国产黄色小视频在线| 国产成人一区二区三区| gogo大胆日本视频一区| 日本黄色片在线观看| 91精品视频播放| 欧美激情综合五月色丁香| 黄色大片在线| 麻豆蜜桃91| 欧美日本一道本| 91九色鹿精品国产综合久久香蕉| 97中文在线| 日韩av一二三| 玖玖在线免费视频| 亚洲男子天堂网| 国产精品久久久久久久| 国产视频在线观看网站| 久久精品一偷一偷国产| 中文字幕日本乱码精品影院| 欧美hd在线| 国产成人无吗| 三上悠亚免费在线观看| 色777狠狠综合秋免鲁丝| 中文字幕永久在线不卡| 天堂久久av| 99热在线免费观看| 91免费电影网站| 欧美一区二区三区电影| 久久精品国语| 全球最大av网站久久| www.av片| 久久成年人视频| 国产精品社区| 男人添女人下部高潮视频在线观看| 韩国成人一区| 亚洲超碰97人人做人人爱| 亚洲天堂偷拍| 超碰国产一区| 人妻精品无码一区二区三区| 成人黄色av免费在线观看| 色婷婷综合久久久中文字幕| 国产伊人久久| 日韩香蕉视频| 视频一区二区三区入口| 桃花色综合影院| 97国产精品视频| 极品裸体白嫩激情啪啪国产精品| 日韩国产小视频| 欧美午夜精品久久久久久孕妇 | 欧美日韩色婷婷| 波多野结衣在线观看| 国产国语刺激对白av不卡| www国产精品视频| 亚洲另类av| 欧美午夜精品理论片a级大开眼界 欧美午夜精品久久久久免费视 | eeuss影院在线播放| 国产精品久久久久久久久婷婷| 亚洲国产精品视频在线观看| 91一区在线观看| 偷拍精品福利视频导航| 日韩专区在线| 亚洲人成无码网站久久99热国产| 99精品国自产在线| 欧美性xxxxx极品| 久久人人97超碰com| 国产日本一区二区| 欧美 日韩 国产 激情| 久久久久久91香蕉国产| 亚洲欧美在线视频| 青青一区二区三区| 日韩a在线观看| 欧美日韩一区在线播放| 久久天天躁狠狠躁老女人| 99国产精品一区| 欧美 日韩 国产 一区| 国产精品综合视频| 麻豆av一区| 一区二区亚洲精品国产| 国产精品xx| 第一视频专区在线| 欧美变态xxxx| 在线免费观看日本欧美| 日本美女一区二区三区视频| 蜜臀av性久久久久av蜜臀妖精| 日本午夜精品一区二区三区电影| 一区视频二区视频| 一本到三区不卡视频| 国产精品成人a在线观看| 久草在线官网| 国产欧美精品久久久| 欧美性xxxx极品高清hd直播| 欧美 日韩 国产一区二区在线视频 | 精品一区二区成人免费视频| 777精品伊人久久久久大香线蕉| 亚洲激情在线| 精品国产99久久久久久| 久久r热视频| 久久亚洲欧美日韩精品专区| 91尤物视频在线观看| 欧美视频精品全部免费观看| 天天干天天草天天| 国产精品免费一区二区三区都可以| 亚洲.国产.中文慕字在线| 久久久久久久久国产一区| 自拍视频在线网| 中文字幕成人一区| 中文字幕在线日韩| 国产欧美精品国产国产专区| 欧美日中文字幕| 成人不用播放器| 成人短视频在线看| 欧美另类xxx| 91福利在线观看| 国产成人免费在线| 欧美顶级毛片在线播放| 久草视频在线看| 日韩视频一二三| 亲子乱一区二区三区电影 | av黄色在线观看| 国产欧美综合一区| 97视频在线观看免费| 欧美日韩一区高清| 成人精品视频.| 精品av一区二区| 久久av色综合| 中文字幕一区二区三区四区在线视频| 成人欧美一区二区三区黑人孕妇| 欧美成人性战久久| 国产精品国产三级国产aⅴ无密码 国产精品国产三级国产aⅴ原创 | 日韩欧美看国产| 日韩男人天堂| 五码日韩精品一区二区三区视频| 久久久精品网站| 欧美三级欧美成人高清www| 日韩高清在线观看| 秋霞一区二区| 国产乱子伦三级在线播放| 老子影院午夜伦不卡大全| 国产成人一区二区在线| 欧美一卡在线观看| 国产精品人人做人人爽人人添| 狠狠综合久久av一区二区老牛| 欧美爱爱视频| 黄色影院在线播放| 北条麻妃视频在线| 欧美人与性禽动交精品| 国产91精品高潮白浆喷水| 精品乱人伦一区二区三区| 一区二区三区丝袜| 国产一区二区三区在线观看免费| 91麻豆国产自产在线观看亚洲 | 91美女视频在线| 北条麻妃av高潮尖叫在线观看| 国产成人一区二区三区免费看| 亚洲国产精品二十页| 香蕉久久国产| 三级精品视频| 人人鲁人人莫人人爱精品| 亚洲图片123| 欧美亚洲一二三区| 精品视频高清无人区区二区三区| 久久琪琪电影院| 国产婷婷97碰碰久久人人蜜臀| 黄色成人av在线| 久久―日本道色综合久久| 亚洲在线国产日韩欧美| 西野翔中文久久精品国产| 亚洲校园激情春色| 香蒸焦蕉伊在线| www.这里只有精品| 51xx午夜影福利| 日韩和欧美的一区二区| 91精品视频在线| 91av视频在线观看| 久久人人爽人人爽人人片亚洲| 欧美大片国产精品| 欧美亚洲禁片免费| 亚洲一卡二卡三卡四卡| 国产精品欧美经典| 99在线精品免费| 91青青国产在线观看精品| 日韩一区二区三区视频| 国产精品无码一本二本三本色| 中文字幕资源网在线观看免费| 丁香啪啪综合成人亚洲小说 | 色婷婷国产精品久久包臀|