国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Google最新《高效Transformers》闡述提升Transformers效率方式

人工智能 新聞
最近Google的Yi Tay發布了關于Transformers最新論文,提供這類模型的最新進展的全面概述。

Transformer模型是當下的研究焦點,因為它們在語言、視覺和強化學習等領域的有效性。例如,在自然語言處理領域,Transformer已經成為現代深度學習堆棧中不可缺少的主要部分。

最近,提出的令人眼花繚亂的X-former模型Linformer, Performer, Longformer等這些都改進了原始Transformer架構的X-former模型,其中許多改進了計算和內存效率。

為了幫助熱心的研究人員在這一混亂中給予指導,本文描述了大量經過深思熟慮的最新高效X-former模型的選擇,提供了一個跨多個領域的現有工作和模型的有組織和全面的概述。

論文鏈接:https://arxiv.org/abs/2009.06732

介紹

Transformer是現代深度學習領域中一股強大的力量。Transformer無處不在,在語言理解、圖像處理等許多領域都產生了巨大的影響。因此,在過去的幾年里,大量的研究致力于對該模型進行根本性的改進,這是很自然的。這種巨大的興趣也刺激了對該模式更高效變體的研究。

最近出現了大量的Transformer模型變體,研究人員和實踐者可能會發現跟上創新的速度很有挑戰性。在撰寫本文時,僅在過去6個月里就提出了近12種新的以效率為中心的模式。因此,對現有文獻進行綜述,既有利于社區,又十分及時。

自注意力機制是確定Transformer模型的一個關鍵特性。該機制可以看作是一種類似圖的歸納偏差,它通過基于關聯的池化操作將序列中的所有標記連接起來。一個眾所周知的自注意力問題是二次時間和記憶復雜性,這可能阻礙模型在許多設置的可伸縮性。最近,為了解決這個問題,出現了大量的模型變體。以下我們將這類型號命名為「高效Transformers」。

根據上下文,可以對模型的效率進行不同的解釋。它可能指的是模型的內存占用情況,當模型運行的加速器的內存有限時,這一點非常重要。效率也可能指計算成本,例如,在訓練和推理期間的失敗次數。特別是對于設備上的應用,模型應該能夠在有限的計算預算下運行。在這篇綜述中,我們提到了Transformer在內存和計算方面的效率,當它們被用于建模大型輸入時。

有效的自注意力模型在建模長序列的應用中是至關重要的。例如,文檔、圖像和視頻通常都由相對大量的像素或標記組成。因此,處理長序列的效率對于Transformer的廣泛采用至關重要。

本篇綜述旨在提供這類模型的最新進展的全面概述。我們主要關注的是通過解決自注意力機制的二次復雜性問題來提高Transformer效率的建模進展和架構創新,我們還將在后面的章節簡要討論一般改進和其他效率改進。

本文提出了一種高效Transformer模型的分類方法,并通過技術創新和主要用例對其進行了表征。特別地,我們回顧了在語言和視覺領域都有應用的Transformer模型,試圖對各個領域的文獻進行分析。我們還提供了許多這些模型的詳細介紹,并繪制了它們之間的聯系。

本節概述了高效Transformer模型的一般分類,以其核心技術和主要用例為特征。盡管這些模型的主要目標是提高自注意機制的內存復雜度,但我們還包括了提高Transformer體系結構的一般效率的方法。

固定模式(FP)——對自注意最早的修改是通過將視野限制在固定的、預定義的模式(如局部窗口和固定步距的塊模式)來簡化注意力矩陣。

組合模式(CP)——組合方法的關鍵思想是通過組合兩個或多個不同的訪問模式來提高覆蓋率。例如,Sparse Transformer通過將一半的頭部分配給每個模式,將跨步注意力和局部注意力結合起來。類似地,軸向Transformer運用了一系列以高維張量作為輸入的自注意計算,每個計算都沿著輸入張量的單個軸。從本質上說,模式的組合以與固定模式相同的方式降低了內存復雜度。但是,不同之處在于,多個模式的聚合和組合提高了自注意機制的整體覆蓋率。

可學習的模式(LP) -固定的,預先確定的模式的擴展是可學習的模式。不出所料,使用可學習模式的模型旨在以數據驅動的方式學習訪問模式。學習模式的一個關鍵特征是確定令牌相關性的概念,然后將令牌分配到桶或集群。值得注意的是,Reformer 引入了一種基于哈希的相似性度量,以有效地將令牌聚為塊。類似地,路由Transformer對令牌使用在線k-means聚類。同時,Sinkhorn排序網絡通過學習對輸入序列的塊進行排序,暴露了注意權值的稀疏性。在所有這些模型中,相似函數與網絡的其他部分一起端到端訓練??蓪W習模式的關鍵思想仍然是利用固定模式(塊狀模式)。然而,這類方法學會了對輸入標記進行排序/聚類——在保持固定模式方法的效率優勢的同時,實現了序列的更優全局視圖。

神經記憶——另一個突出的方法是利用可學習的側記憶模塊,它可以一次訪問多個令牌。一種常見的形式是全局神經存儲器,它能夠訪問整個序列。全局標記充當一種模型內存的形式,它學習從輸入序列標記中收集數據。這是在Set transformer中首次引入的誘導點方法。這些參數通常被解釋為「內存」,用作將來處理的臨時上下文的一種形式。這可以被認為是參數關注的一種形式。ETC 和Longformer也使用了全局記憶令牌。在有限的神經記憶(或誘導點)中,我們能夠對輸入序列執行一個初步的類似于池的操作來壓縮輸入序列——在設計高效的自注意模塊時,這是一個可以隨意使用的巧妙技巧。

低秩方法——另一種新興的技術是通過利用自注意矩陣的低秩近似來提高效率。

內核——另一個最近流行的提高transformer效率的方法是通過內核化來查看注意力機制。

遞歸——塊方法的一個自然擴展是通過遞歸連接這些塊。

下采樣——另一種降低計算成本的常用方法是降低序列的分辨率,從而以相應的系數降低計算成本。

稀疏模型和條件計算——雖然不是專門針對注意力模塊,稀疏模型稀疏地激活一個參數子集,這通常提高了參數與FLOPs的比率。

責任編輯:張燕妮 來源: 新智元
相關推薦

2025-06-27 08:50:40

2024-07-04 09:22:24

2023-05-09 15:41:03

2023-03-02 08:00:00

開源PyNeuraLogTransforme

2012-04-20 09:47:59

戴爾存儲虛擬化

2025-12-02 16:31:15

2024-09-26 10:42:20

2022-05-16 09:48:30

Google性能優化LCP

2024-11-15 08:24:41

2022-09-04 14:38:00

世界模型建模IRIS

2023-09-26 16:09:19

RWKV

2024-06-21 08:42:54

BERTNLP自然語言處理

2025-03-10 10:20:00

TransformeDecoder自然語言處理

2023-05-06 11:59:55

ACT-1人工智能語音

2012-04-04 11:30:34

Google

2010-03-02 14:15:11

Android平臺

2023-03-16 08:00:00

機器學習深度學習人工智能

2020-11-02 16:20:07

GuavaJava編程語言

2009-12-25 17:15:03

Linux內存

2025-03-31 02:22:00

點贊
收藏

51CTO技術棧公眾號

日韩精品中文字幕吗一区二区| 亚洲国产一区二区精品专区| 日韩精品高清视频| 久久久精品日韩| 中文幕av一区二区三区佐山爱| 免费福利影院| 欧美xxxx老人做受| 国产精品天美传媒沈樵| 成人天堂资源www在线| 成人av在线播放网址| 久久精品日产第一区二区| 天天综合一区| 999成人网| 999视频精品| 欧美激情第10页| 国产精品mm| 经典一区二区| 中文字幕21页在线看| 国产区高清在线| 黄色国产精品视频| 色之综合天天综合色天天棕色| 国产精品久久久久福利| 欧美另类99xxxxx| 亚洲成人免费网站| 欧美精品第一页| 亚洲欧美春色| 亚洲精品555| 在线三级中文| 夜夜添无码一区二区三区| 色综合伊人色综合网| 亚洲欧美一区二区三区孕妇| 日韩在线激情| 日韩a在线播放| 亚洲成av人片在www色猫咪| 亚洲区欧洲区| 日本精品久久久久久久| 久久综合久久综合九色| 北岛玲日韩精品一区二区三区| 亚洲国产精品一区二区第一页| 国产精品video| 日韩中文字幕久久| 精品国产一二三| 欧美一区二区三区在线| 天天av天天翘天天综合网| 亚洲欧美另类小说视频| 国产午夜亚洲精品不卡| 久久久久国产精品麻豆ai换脸 | 91精品天堂福利在线观看| 欧美97人人模人人爽人人喊视频| 韩国美女久久| 亚洲男人在线| av日韩精品| 亚洲精品白浆高清| 欧洲美女精品免费观看视频| 国模精品视频| 69堂精品视频在线播放| 桃子视频成人app| 超碰国产精品一区二页| 一区二区三区高清在线观看| 国产精品久久国产| 国产免费毛卡片| 1024在线视频| 成人在线播放| 国产高清亚洲| 亚洲精品国模| 日本不卡的三区四区五区| 99在线精品一区二区三区| 亚洲欧洲av在线| 欧美日韩一区二区三区四区五区| 中文字幕亚洲欧美一区二区三区 | 国产成人三级视频| 一级片视频免费观看| 九九在线视频| 久久天堂av| 好看的日韩av电影| 国产欧美久久久精品影院| 在线播放国产精品二区一二区四区 | 一区二区三区中文字幕| 欧美一区二区三区视频在线观看| 久久人人爽人人爽爽久久| 91九色单男在线观看| 日韩av片在线看| 日韩毛片久久久| jlzzjlzz亚洲女人| 成人97人人超碰人人99| 欧美日韩国产a| 日本午夜在线亚洲.国产| 日本精品二区| 水中色av综合| 无码少妇一区二区三区| 成人免费看的视频| 欧美电影精品一区二区| 成人有码视频在线播放| jizz国产| 日韩有吗在线观看| 26uuu国产在线精品一区二区| 欧美一区二区在线视频| 国产精品中文字幕久久久| 一本久道中文无码字幕av| 久久天堂av| 毛片一区二区| 91精品国产综合久久婷婷香蕉 | 激情视频免费| 成人香蕉社区| 国产精品网友自拍| 97视频免费在线看| 国产喷水theporn| 高潮久久久久久久久久久久久久| 99久久精品费精品国产一区二区| 欧美三级电影在线观看| 5g国产欧美日韩视频| 国产高清免费av在线| 亚洲电影在线一区二区三区| 欧美日韩免费看| 日韩欧美电影一二三| 国产亚洲欧洲在线| 欧美日韩一区视频| 欧美色网站导航| 亚洲国产精品网站| 日本精品免费一区二区三区| 一区二区三区网址| 曰本一区二区三区视频| 一区二区三区欧美日| 91免费的视频在线播放| 欧美日本网站| 翔田千里一区二区| 亚洲黄色av网站| 国产成人精品无码播放| 在线一级成人| 3751色影院一区二区三区| 欧美精品久久久久久久久久久| 日本久久一区| 激情成人中文字幕| 欧美高清性xxxxhdvideosex| av在线精品| 亚洲一二三区视频在线观看| 亚洲自拍偷拍福利| 在线观看v片| 亚洲欧美经典视频| 国产麻豆日韩| 澳门av一区二区三区| 久久精品人人做| 福利视频一区二区三区| 在线能看的av网址| 一区二区三区日韩精品| 欧美日本国产精品| 国产精一区二区| 日韩欧美视频一区二区三区| 老司机午夜网站| 9色在线视频网站| 国产宾馆实践打屁股91| 国产区亚洲区欧美区| 九色91在线| 国产精品不卡在线观看| 久久99精品久久久久久久久久| 91视频亚洲| 欧美一卡2卡3卡4卡| 日本视频一二区| 久久一区二区三区四区| 国产一区二区无遮挡| 国产成人免费精品| 91麻豆精品国产91久久久| 一本岛在线视频| 国产成人av电影在线播放| 国产欧美日韩精品在线观看| 在线国产日本| 国产福利片在线观看| 国产一区二区你懂的| 91产国在线观看动作片喷水| av有码在线观看| 欧美精品一级二级| 免费理论片在线观看播放老| 亚洲国产综合人成综合网站| 国产三区在线视频| 免费在线观看成人| 99re在线| 一区二区三区四区日韩| 亚洲2020天天堂在线观看| 麻豆久久一区| 在线观看久久久久久| 美女高潮视频在线看| 亚洲精品在线不卡| 高清在线视频不卡| 亚洲欧美资源在线| 99riav视频一区二区| 亚洲黄色www网站| 欧美办公室脚交xxxx| 日韩精品在线视频美女| 欧美伦理91| 亚洲黄在线观看| 成人在线网址| 日韩国产欧美精品在线| 国产丝袜在线播放| 精品国产123| 亚洲精品一区| 日韩视频一二区| 久久久国产精品麻豆| 91在线短视频| 99久久影视| 91嫩草国产在线观看|