国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

最強LLaMA突然來襲!只改一個超參數,實現上下文3.2萬token,多個任務打敗ChatGPT、Claude 2

人工智能
LLaMA 2 Long使用了4000億token語料加持下,并進行位置編碼修改。所以LLaMA 2 Long究竟是如何誕生的?與LLaMA 2相比,LLaMA 2 Long的變化并不多。一是訓練參數上,采用了高達4000億token的數據源。二是架構上,與LLaMA 2保持不變,但對位置編碼進行了一個非常小的必要修改,以此完成高達3.2億token的上下文窗口支持。

悄無聲息,羊駝家族“最強版”來了!

與GPT-4持平,上下文長度達3.2萬token的LLaMA 2 Long,正式登場。

圖片

在性能上全面超越LLaMA 2。

圖片

和競爭對手相比,在指令微調MMLU (5-shot)等測試集上,表現超過ChatGPT。

圖片

在人類評估(human evaluation)上甚至優于10萬token的Claude 2,這個話題還在Reddit上引發了討論。

圖片

要知道,這些對比版本中,LLaMA 2 Long使用的最大版本也只有70B,遠小于其他大模型。

這讓人不禁感慨:Meta確實還是有兩下子的。

圖片

也有人覺得,這才是最近Meta發布會的最大新聞啊,比Meta版ChatGPT要更令人興奮。

圖片

論文介紹,LLaMA 2 Long使用了4000億token語料加持下,并進行位置編碼修改。

所以LLaMA 2 Long究竟是如何誕生的?

只對位置編碼進行了一個非常小的改動

與LLaMA 2相比,LLaMA 2 Long的變化并不多。

一是訓練參數上,采用了高達4000億token的數據源。

——相反,原始LLaMA 2包含多個變體,但最多的版本也只有700億。

二是架構上,與LLaMA 2保持不變,但對位置編碼進行了一個非常小的必要修改,以此完成高達3.2億token的上下文窗口支持。

在LLaMA 2中,它的位置編碼采用的是旋轉編碼RoPE方法。

它是目前大模型中應用最廣的一種相對位置編碼,通過旋轉矩陣來實現位置編碼的外推。

本質上來說,RoPE就是將表示單詞、數字等信息的token embeddings映射到3D圖表上,給出它們相對于其他token的位置——即使在旋轉時也如此。

這就能夠使模型產生準確且有效的響應,并且比其他方法需要的信息更少,因此占用的計算存儲也更小。

在此,Meta的研究人員通過對70億規模的LLaMA 2進行實驗,確定了LLaMA 2中的RoPE方法的一個關鍵限制:

即,阻止注意力模塊聚集遠處token的信息。

為此,Meta想出了一個非常簡單的破解辦法:

減少每個維度的旋轉角度。

具體而言就是將超參數“基頻(base frequency) b”從10000增加到500000。

這一改動立刻奏效,縮小了RoPE對遠端token的衰減效應,并且在擴展LLAMA的上下文長度上優于一項類似的名為“位置插值”的方法(如下圖所示,RoPE PI,衰減效果較為“隱含”)

圖片

Ps. 圖中RoPE表示基線方法,RoPE ABF為Meta此次發明的新方法,xPos是另一種應用了該方法的旋轉編碼變體。

一個問題是,通過上面這個可視化結果,Meta觀察到RoPE在長程區域出現了較大的“振蕩”,這對于語言建模來說可能不是個好消息。

不過,通過報告幾種方法在長序列困惑度和FIRST-SENTENCE-RETRIEVAL兩個任務上的表現來看,問題不大。

圖片

而且,尤其在后者任務上,他們提出的RoPE ABF是唯一一個可以始終保持性能的變體。

圖片

在附錄中,Meta還通過可視化為螺旋圖這一非常有趣的方式,將RoPE ABF與RoPE PI的差異進行了理論分析。

結果是,與RoPE PI相比,RoPE ABF的優勢主要體現在它能以更大的粒度分配嵌入向量(the embedded vectors),從而使模型更容易區分位置。

圖片

此外,他們還觀察到,嵌入向量之間的相對距離既對RoPE PI的關鍵參數有線性依賴性,也對RoPE ABF的關鍵參數也有對數依賴性。

這也就是為什么我們可以很容易地對基頻這一超參數“下手”。

最終,LLaMA 2 Long憑借著這一改動,達成了3.2萬的上下文token,并通過長下文連續預訓練的共同作用,獲得了開頭所示的好成績:

除了全面超越LLaMA 2、在特定任務上超越Claude 2和ChatGPT,Meta也給出了它和一些開源長下文模型的對比。

結果也相當不賴。

圖片

One More Thing

值得一提的是,這個最新的版本,是用LLaMA2生成的文本內容來進行訓練的。

圖片

官方會不會正式發布這一版本,現在還沒有更明確的消息,模型的網址也還沒有找到。

不過已經有人提前興奮起來了:

這對可商用微調大模型來說太有用了!

圖片

而在此之前,已經有非官方版本實現了3.2萬token上下文,也是開源可商用。

“長頸鹿(Giraffe)”基于13B版本的LLaMA2打造。

研究團隊提出了一種稱為“截斷(truncation)”的方法,對原始RoPE編碼進行變換。

圖片

llama-2-7b-32k-instruct也可以支持3.2萬上下文,模型規模是7B。

論文:https://arxiv.org/pdf/2309.16039.pdf。

參考鏈接:
[1]https://venturebeat.com/ai/meta-quietly-releases-llama-2-long-ai-that-outperforms-gpt-3-5-and-claude-2-on-some-tasks/。
[2]https://twitter.com/_akhaliq/status/1707569241191285207。
[3]https://www.reddit.com/r/LocalLLaMA/comments/16v0onb/meta_has_released_a_new_paper_llama_2_long_beats/。
[4]https://news.ycombinator.com/item?id=37698604。

責任編輯:姜華 來源: 量子位
相關推薦

2023-10-21 12:53:27

數據研究

2025-08-29 14:17:01

ClaudeOpenAIGemini

2023-11-22 16:51:53

2023-08-10 14:04:15

代碼模型

2023-10-11 13:21:12

模型數據

2025-08-14 14:45:15

2022-09-15 08:01:14

繼承基礎設施基礎服務

2025-07-25 10:06:05

2017-05-11 14:00:02

Flask請求上下文應用上下文

2021-07-26 07:47:36

Cpu上下文進程

2012-12-31 10:01:34

SELinuxSELinux安全

2025-04-07 09:35:00

Meta模型開源

2025-03-18 10:34:33

2022-09-14 13:13:51

JavaScript上下文

2023-08-07 12:52:04

模型免費商用技術

2024-05-06 13:01:21

數據模型

2025-12-12 09:00:00

2023-08-29 13:26:55

ChatGPT企業版任務

2017-06-27 18:52:05

TensorFlow深度學習

2025-12-09 09:28:54

點贊
收藏

51CTO技術棧公眾號

欧美国产精品中文字幕| 欧美一区在线视频| 日本免费成人网| 国产精品久久久久久久久久妞妞 | 一区二区在线影院| 久久久这里只有精品视频| 亚洲第一会所001| 精品国产一区久久| 美女网站视频在线| 欧美一区二区三区免费视频| 成人动漫在线免费观看| 欧美日韩国产影院| 欧洲一区av| 91免费版看片| 国内在线视频| 国内一区二区在线| 99不卡视频| 亚洲黄色在线看| 18禁网站免费无遮挡无码中文 | 欧美黄色www| 成人在线观看免费播放| 亚洲日本欧美日韩高观看| 日本三级一区| 在线观看精品国产视频| gay欧美网站| www.日韩欧美| japanese色系久久精品| 7777免费精品视频| 久久av免费看| 91九色在线视频| 亚洲毛片网站| 亚洲欧美日韩另类精品一区二区三区| 青草av.久久免费一区| 五月天av影院| 久久人人爽爽爽人久久久| 成人性生交免费看| 大桥未久av一区二区三区| 激情综合闲人网| 欧美精品一区二区在线播放| 成人国产精品| 久久久免费电影| 成人三级视频| 欧美视频1区| 99riav久久精品riav| 黄网免费入口| 欧美日韩电影一区| 成人激情视屏| 国产精品 欧美在线| 亚洲狠狠婷婷| 激情小视频网站| 中日韩免费视频中文字幕| avtt天堂资源网| 三级一区在线视频先锋| 国产专区精品视频| 国产盗摄女厕一区二区三区| 九九热这里只有在线精品视| 91视频综合| 亚洲ai欧洲av| 久久久www成人免费无遮挡大片| 超碰影院在线| 亚洲国产精品99| jizz国产精品| 欧美日韩亚洲在线 | 忘忧草在线www成人影院| 538国产精品视频一区二区| 国产欧美日韩一区二区三区在线| 国产va亚洲va在线va| 一区二区三区在线视频播放| 日本aa在线| 91精品国产一区| 久久久久久网| 久久久久久77777| 日韩精品久久久久久福利| 国产一区二区三区四区大秀| 亚洲精品一区二区三区四区五区| 亚洲你懂的在线视频| 蜜臀99久久精品久久久久久软件| 亚洲精品免费一区二区三区| 国产情侣久久| 成人免费网址在线| 日韩欧美一区二区三区| 国产不卡网站| 国产又爽又黄的激情精品视频 | 欧美一区日韩一区| 超碰在线中文字幕| 久久久久久伊人| 手机亚洲手机国产手机日韩| 亚洲自拍高清视频网站| 久久精品一区八戒影视| 久草视频在线看| 国产精品不卡在线观看| 国产乱真实合集| 欧美日韩性视频| 久久av网站| 成人av在线不卡| 亚洲精品videossex少妇| 成人毛片免费看| 久草视频这里只有精品| 日韩免费精品视频| 日韩最新在线视频| www.视频在线.com| 高清在线视频日韩欧美| 久久国产免费看| 欧美91精品久久久久国产性生爱| 久久久久久网址| 国产精品99久| 在线观看中文| 国产精品网站入口| 91农村精品一区二区在线| 91福利在线免费| 久久久综合亚洲91久久98| 精品成人av一区| 亚洲精品合集| 可以免费在线看黄的网站| 国产一区二区欧美日韩| 午夜综合激情| 欧洲不卡av| 狠狠综合久久av| 欧美在线观看一区| 综合久久亚洲| 日本ー区在线视频| 91精品视频在线看| 精品国产鲁一鲁一区二区张丽| 国产精品嫩模av在线| 91麻豆福利| 国产成人高清激情视频在线观看| 久久久99精品久久| 日韩国产一二三区| 久久亚洲国产成人精品无码区| 亚洲成人精品久久久| 蜜桃视频免费观看一区| 黄网在线免费看| 亚洲最新在线| 日韩电影中文字幕在线| 精品一区二区在线视频| 电影网一区二区| 成年女人18级毛片毛片免费| 亚洲剧情一区二区| 日本成人在线一区| cao在线视频| 黑人巨茎大战欧美白妇| 在线色欧美三级视频| 久久午夜老司机| 一区三区在线欧| 一级片在线视频| 九九九九精品| 日韩电影网在线| eeuss鲁片一区二区三区在线观看| 精品久久毛片| av大片免费看| 不卡视频一区二区三区| 日韩一区二区三区视频| 捆绑紧缚一区二区三区视频| 亚洲不卡系列| 五月天婷婷激情视频| 国产精品美女www| 在线观看亚洲精品| 热久久久久久久| 欧美精品日日操| 69久久久久久| 成人午夜在线观看| 欧美一区二区三区在线观看视频 | 黄色的视频在线免费观看| 国模精品一区二区三区| 日韩电影中文字幕在线观看| 91麻豆精品视频| 欧美三级美国一级| 黄色网页在线看| 日本天堂免费a| 777精品视频| 欧美色爱综合网| 国产成人亚洲综合a∨婷婷| 成人免费视频观看| 人人爱人人干婷婷丁香亚洲| 三上悠亚av一区二区三区| 久久久久久九九九九| 国产精品久久精品| 91精品国产自产在线| 亚洲国产精品成人一区二区| 91丨porny丨蝌蚪视频| 欧美精品二区| 中文字幕视频精品一区二区三区| 午夜免费精品视频| 日韩av在线免费看| 国产视频视频一区| 欧美freesex交免费视频| 二区三区在线观看| 亚洲男人天堂色| 国产欧美亚洲日本| 久久综合伊人77777蜜臀| 色婷婷综合久久久中文字幕| 国产福利一区在线| 99成人在线视频| 国产91欧美| jyzzz在线观看视频| 青青在线视频免费| 日韩在线三区| 国产日韩av在线播放| 亚洲午夜色婷婷在线| 在线视频国内一区二区|