国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

GPT-4的32k輸入框還是不夠用?Unlimiformer把上下文長度拉到無限長

人工智能 新聞
Unlimiformer 可以被注入到任何現(xiàn)有的編碼器 - 解碼器 transformer 中,能夠處理長度不限的輸入。

Transformer 是時下最強大的 seq2seq 架構(gòu)。預(yù)訓(xùn)練 transformer 通常具有 512(例如 BERT)或 1024 個(例如 BART)token 的個上下文窗口,這對于目前許多文本摘要數(shù)據(jù)集(XSum、CNN/DM)來說是足夠長的。

但 16384 并不是生成所需上下文長度的上限:涉及長篇敘事的任務(wù),如書籍摘要(Krys-′cinski et al.,2021)或敘事問答(Kociskyet al.,2018),通常輸入超過 10 萬個 token。維基百科文章生成的挑戰(zhàn)集(Liu*et al.,2018)包含超過 50 萬個 token 的輸入。生成式問答中的開放域任務(wù)可以從更大的輸入中綜合信息,例如回答關(guān)于維基百科上所有健在作者的文章的聚合屬性的問題。圖 1 根據(jù)常見的上下文窗口長度繪制了幾個流行的摘要和問答數(shù)據(jù)集的大小;最長的輸入比 Longformer 的上下文窗口長 34 倍以上。

圖片

在這些超長輸入的情況下,vanilla transformer 無法進行縮放,因為原生注意力機制具有平方級的復(fù)雜度。長輸入 transformer 雖然比標(biāo)準(zhǔn) transformer 更高效,但仍需要大量的計算資源,這些資源隨著上下文窗口大小的增加而增加。此外,增加上下文窗口需要用新的上下文窗口大小從頭開始重新訓(xùn)練模型,計算上和環(huán)境上的代價都不小。

在「Unlimiformer: Long-Range Transformers with Unlimited Length Input」一文中,來自卡內(nèi)基梅隆大學(xué)的研究者引入了 Unlimiformer。這是一種基于檢索的方法,這種方法增強了預(yù)訓(xùn)練的語言模型,以在測試時接受無限長度的輸入。

圖片

論文鏈接:https://arxiv.org/pdf/2305.01625v1.pdf

Unlimiformer 可以被注入到任何現(xiàn)有的編碼器 - 解碼器 transformer 中,能夠處理長度不限的輸入。給定一個長的輸入序列,Unlimiformer 可以在所有輸入 token 的隱藏狀態(tài)上構(gòu)建一個數(shù)據(jù)存儲。然后,解碼器的標(biāo)準(zhǔn)交叉注意力機制能夠查詢數(shù)據(jù)存儲,并關(guān)注前 k 個輸入 token。數(shù)據(jù)存儲可以存儲在 GPU 或 CPU 內(nèi)存中,能夠次線性查詢。

Unlimiformer 可以直接應(yīng)用于經(jīng)過訓(xùn)練的模型,并且可以在沒有任何進一步訓(xùn)練的情況下改進現(xiàn)有的 checkpoint。Unlimiformer 經(jīng)過微調(diào)后,性能會得到進一步提高。本文證明,Unlimiformer 可以應(yīng)用于多個基礎(chǔ)模型,如 BART(Lewis et al.,2020a)或 PRIMERA(Xiao et al.,2022),且無需添加權(quán)重和重新訓(xùn)練。在各種長程 seq2seq 數(shù)據(jù)集中,Unlimiformer 不僅在這些數(shù)據(jù)集上比 Longformer(Beltagy et al.,2020b)、SLED(Ivgi et al.,2022)和 Memorizing transformers(Wu et al.,2021)等強長程 Transformer 表現(xiàn)更好,而且本文還發(fā)現(xiàn) Unlimiform 可以應(yīng)用于 Longformer 編碼器模型之上,以進行進一步改進。

Unlimiformer 技術(shù)原理

由于編碼器上下文窗口的大小是固定的,Transformer 的最大輸入長度受到限制。然而,在解碼過程中,不同的信息可能是相關(guān)的;此外,不同的注意力頭可能會關(guān)注不同類型的信息(Clark et al.,2019)。因此,固定的上下文窗口可能會在注意力不那么關(guān)注的 token 上浪費精力。

在每個解碼步驟中,Unlimiformer 中每個注意力頭都會從全部輸入中選擇一個單獨的上下文窗口。通過將 Unlimiformer 查找注入解碼器來實現(xiàn):在進入交叉注意力模塊之前,該模型在外部數(shù)據(jù)存儲中執(zhí)行 k 最近鄰 (kNN) 搜索,在每個解碼器層中的每個注意力頭中選一組 token 來參與。

編碼

為了將比模型的上下文窗口長度更長的輸入序列進行編碼,本文按照 Ivgi et al. (2022) 的方法對輸入的重疊塊進行編碼 (Ivgi et al. ,2022),只保留每個 chunk 的輸出的中間一半,以確保編碼過程前后都有足夠的上下文。最后,本文使用 Faiss (Johnson et al., 2019) 等庫對數(shù)據(jù)存儲中的編碼輸入進行索引(Johnson et al.,2019)。

檢索增強的交叉注意力機制

在標(biāo)準(zhǔn)的交叉注意力機制中,transformer 的解碼器關(guān)注編碼器的最終隱狀態(tài),編碼器通常截斷輸入,并僅對輸入序列中的前 k 個 token 進行編碼。

本文不是只關(guān)注輸入的這前 k 個 token,對于每個交叉注意頭,都檢索更長的輸入系列的前 k 個隱狀態(tài),并只關(guān)注這前 k 個。這樣就能從整個輸入序列中檢索關(guān)鍵字,而不是截斷關(guān)鍵字。在計算和 GPU 內(nèi)存方面,本文的方法也比處理所有輸入 token 更便宜,同時通常還能保留 99% 以上的注意力性能。

圖 2 顯示了本文對 seq2seq transformer 架構(gòu)的更改。使用編碼器對完整輸入進行塊編碼,并將其存儲在數(shù)據(jù)存儲中;然后,解碼時查詢編碼的隱狀態(tài)數(shù)據(jù)存儲。kNN 搜索是非參數(shù)的,并且可以被注入到任何預(yù)訓(xùn)練的 seq2seq transformer 中,詳情如下。

圖片

實驗結(jié)果

長文檔摘要

表 3 顯示了長文本(4k 及 16k 的 token 輸入)摘要數(shù)據(jù)集中的結(jié)果。

圖片

在表 4 的訓(xùn)練方法中,Unlimiformer 能夠在各項指標(biāo)上達到最優(yōu)。

圖片

書籍摘要

表 5 顯示了在書籍摘要上的結(jié)果。可以看到,基于 BARTbase 和 PRIMERA,應(yīng)用 Unlimiformer 都能取得一定的改進效果。

圖片

責(zé)任編輯:張燕妮 來源: 機器之心
相關(guān)推薦

2023-08-29 12:45:32

2023-06-28 18:10:27

羊駝家族大模型集體進化

2023-07-11 10:02:23

2024-06-03 14:24:00

2024-04-01 00:00:00

馬斯克Grok 1.5HumanEval

2023-11-17 18:06:15

2024-05-07 14:02:28

開源MoE指標(biāo)

2025-03-17 09:40:00

2024-03-25 00:05:00

開源模型AI

2023-05-14 14:15:00

GPT-4AI

2024-04-12 17:41:28

GPT-4TurboClaude

2025-12-03 08:33:51

2024-04-07 00:45:00

開源模型

2013-10-23 14:28:30

2023-08-24 15:57:41

模型文檔檢索

2021-03-15 23:11:12

內(nèi)存虛擬化技術(shù)

2024-03-14 08:11:45

模型RoPELlama

2021-09-06 14:53:15

人工智能機器學(xué)習(xí)技術(shù)

2024-07-31 15:08:35

2023-06-30 09:49:23

模型Meta
點贊
收藏

51CTO技術(shù)棧公眾號

国产综合色香蕉精品| 欧美日韩尤物久久| 姬川优奈aav一区二区| 视频免费裸体网站| 色综合色综合色综合| 成人免费高清在线播放| 欧美一级午夜免费电影| 中文在线中文资源| 久久综合伊人77777蜜臀| 国产成人aa在线观看网站站| 国产精品劲爆视频| 亚洲深爱激情| 中国丰满熟妇xxxx性| 成人免费在线播放视频| 最近中文字幕mv2018在线高清| 色综合夜色一区| 草美女在线观看| 日韩中文字幕第一页| 五月天亚洲一区| 国产视色精品亚洲一区二区| 国产一区美女在线| 成人动漫h在线观看| 欧美中文字幕久久| 日韩欧美专区| 91色在线观看| 波多野结衣中文字幕一区 | 91在线品视觉盛宴免费| 日韩激情视频在线播放| 国产一区二区三区不卡av| 国产尤物99| 久久夜色精品国产欧美乱极品| 一本大道香蕉久在线播放29| 精品成人a区在线观看| 欧美调教视频| 亚洲欧洲精品一区二区| 亚洲免费观看在线视频| 操喷在线视频| 26uuu日韩精品一区二区| 99在线精品视频在线观看| 蜜臀av午夜一区二区三区| 欧美午夜精品一区二区蜜桃| 亚洲精品一区二区在线播放∴| 91丝袜美腿美女视频网站| 国产高清不卡一区| 国产在线视频网址| 欧美激情极品视频| 欧美另类综合| 欧美伦理片在线观看| 亚洲二区中文字幕| 亚洲欧美综合久久久| 中文字幕日韩精品无码内射| 在线视频中文字幕一区二区| 成人资源在线播放| 一区精品在线| 欧美系列日韩一区| 伊人精品一区| 国产av人人夜夜澡人人爽麻豆| 欧美日韩性视频在线| 91精品国产自产精品男人的天堂 | 久久天天做天天爱综合色| 日本视频在线播放| 国产精品午夜视频| 久久免费精品国产久精品久久久久| 18+视频在线观看| 91精品视频一区| 久久久99精品久久| 日韩成人影音| 欧美人xxxxx| 欧美性高潮在线| 亚洲电影一级片| 欧美自拍小视频| 在线播放日韩精品| 激情丁香综合五月| 久久亚洲资源| 欧美一区2区三区4区公司二百| 欧美日韩另类在线| japanese国产精品| 3344永久| 欧美中文在线免费| 久久久精品国产99久久精品芒果 | 亚洲成a人v欧美综合天堂麻豆| 国产精品扒开腿爽爽爽视频| 国产亚洲综合在线| 精品中文在线| 黄色片久久久久| 色婷婷久久av| 99久久精品久久久久久清纯| 蜜桃成人精品| 中文字幕第50页| 亚洲精品在线91| 激情欧美一区二区三区在线观看| xvideos国产在线视频| 懂色av一区二区三区在线播放| 午夜精品久久久久久久蜜桃app| 亚洲精品中文字幕99999| 午夜国产一区二区三区| 久久久天堂国产精品女人| 国产日韩欧美综合在线| 91国内精品| av黄色免费| 国产精品久久久久999| 亚洲一区二区在线免费看| 国产在线观看91一区二区三区| 成年在线播放小视频| 亚洲国产精品成人综合色在线婷婷| 视频欧美精品| 九热视频在线观看| 午夜精品www| 亚洲精品国产a久久久久久| 台湾佬综合网| 欧美猛交免费看| 丁香激情综合国产| 色综合.com| 色悠悠久久综合网| 国产成人精品av| 色综合夜色一区| 99国产精品久久久久久久 | 综合136福利视频在线| 国产一区免费电影| 国产黄色免费在线观看| 岛国视频一区免费观看| 日韩av影视在线| 亚洲欧美日韩国产综合在线| 久久看人人摘| 欧洲精品一区| 欧美一级做a| 污视频在线免费观看网站| 尤物免费看在线视频| 日本免费一二区| 精品久久久久久亚洲| 亚洲国产精品字幕| 亚洲一区精品在线| 亚洲一区二区三区三| 性欧美暴力猛交另类hd| 午夜视频在线免费| 色狠狠久久av五月综合|| 日韩一级精品视频在线观看| 国产性做久久久久久| 日本在线成人| 色网站在线看| 337p粉嫩大胆噜噜噜鲁| 91传媒免费看| 国产主播欧美精品| 国产极品精品在线观看| 欧美极品少妇xxxxⅹ免费视频| 精品国偷自产在线视频99| 欧美日韩成人一区二区| 亚洲一本大道在线| 尤物网在线观看| 肉大捧一出免费观看网站在线播放| 欧美成人精品三级在线观看 | 欧美一区亚洲二区| 久久av.com| 欧美午夜电影网| 成人久久视频在线观看| 欧美一区电影| 神马午夜在线视频| 999大胆视频| 亚洲a∨一区二区三区| 高清欧美性猛交| 日韩欧美中文字幕公布| 国产日韩欧美一区二区三区乱码| 欧美体内she精视频在线观看| 国产成人精选| av福利在线播放| 久草综合在线观看| 久久草视频在线看| 欧美一级淫片videoshd| 日韩精品高清视频| 亚洲午夜精品在线| 福利91精品一区二区三区| 欧美日本一区| 红杏aⅴ成人免费视频| 成人免费高清观看| 500福利第一精品导航| 国产精品国产对白熟妇| 国产精品视频500部| 久久久影视精品| 日韩精品视频三区| 一本大道久久精品懂色aⅴ| 99在线热播精品免费| 在线观看视频日韩| 91精品久久久久久综合五月天| 丁香花在线影院| 在线中文字幕av| 一级片视频免费观看| 在线观看欧美一区| 国偷自产av一区二区三区小尤奈| 97婷婷大伊香蕉精品视频| 亚洲欧美自拍一区| 欧美一区二区免费观在线| 黄色精品一区二区| 国产精品成人免费在线| 成人激情视频网站| 日本不卡免费在线视频| 伊人久久久大香线蕉综合直播| 欧美一级精品| 色狠狠久久av综合| 日韩一区二区三区色 | 男男激情在线|