国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

大模型中的知識存儲,到底是怎么回事

發布于 2025-6-4 06:03
瀏覽
0收藏

1. 引言

大型語言模型(LLMs)在訓練過程中從龐大的知識語料庫(如維基百科)中獲取了大量的事實知識,并在各種自然語言任務中展現出卓越的性能。因此,LLMs 常被視為支撐知識導向任務的知識庫。然而,要有效利用這些模型中的知識,需要深入理解 LLMs 存儲和管理事實知識的機制。這種理解對于模型編輯等任務至關重要,這些任務涉及修改模型中嵌入的知識。

當前的研究主要集中在研究 LLMs 中嵌入的知識。這些工作將知識視為三元組 (s, r, o),包括頭實體(主語,s)、尾實體(賓語,o)和它們之間的關系 r。研究人員探索了語言模型如何在其參數中封裝知識。

大模型中的知識存儲,到底是怎么回事-AI.x社區

例如,Dai 等人采用知識歸因方法,識別出表達事實知識的特定神經元,而 Meng 等人使用因果追蹤發現主語與 MLP 模塊之間存在強因果關系。

然而,這些研究主要從實體的角度調查 LLMs 中的知識。如果我們從關系的角度來處理相同的知識,可能會得到完全不同的觀察結果。理論上,一條知識包括實體和它們之間的關系;缺少任何一個,知識就是不完整的。因此,在這種情況下,實體和關系應該是等價的,這也是當前許多模型編輯工作的前提,因為需要在模型參數中修改知識。

盡管如此,目前的研究還沒有探討這種等價性是否成立。為了填補這一空白,本文調查了實體和關系之間的差異。為了探索這種潛在的等價性,研究者采用了模型編輯技術,這是一種用于更新或糾正語言模型中新的或錯誤知識的技術。

研究目標是通過修改實體或關系知識來確定這些變化是否會產生一致的結果,并從兩個角度觀察效果。理想情況下,這些效果應該是相同的,因為編輯的知識涉及同一條信息。

2. 相關工作

隨著事實信息的不斷演變,存儲在大型語言模型(LLMs)中的知識可能會變得過時或不正確。因此,迫切需要及時更新 LLMs 中不恰當的知識,同時保留其他有價值的知識。最近,這個問題引起了研究人員的廣泛關注。

雖然參數高效微調和增量學習技術提供了修改 LLMs 的途徑,但需要注意的是,這些方法可能容易過擬合,并且在應用于具有極大參數規模的 LLMs 時可能會產生巨大的計算成本。為了解決這些問題,Sinitsin 等人提出了模型編輯(Model Editing)的概念,旨在高效準確地改變模型中存儲的事實知識。

目前,主要有三種類型的模型編輯方法:

  • 基于記憶的方法:這些技術利用額外的可訓練參數來存儲記憶或學習 LLMs 中知識更新所需的調整(Δ)。
  • 定位-編輯方法:這些方法采用因果中介分析來定位 LLMs 中的知識神經元,然后修改這些識別出的區域。本文主要探討這種知識定位方法。
  • 上下文內知識編輯方法:這些方法是一種免訓練的范式,通過在輸入上下文中連接演示來實現知識編輯。

3. 背景與方法

3.1 任務定義

大模型中的知識存儲,到底是怎么回事-AI.x社區

3.2 模型編輯方法

大模型中的知識存儲,到底是怎么回事-AI.x社區

3.3 定位關系知識

因果追蹤

大模型中的知識存儲,到底是怎么回事-AI.x社區

截斷因果分析

大模型中的知識存儲,到底是怎么回事-AI.x社區

4. 實驗

為了研究知識如何存儲在模型參數中,研究者提出了以下研究問題(RQs):

  • RQ1:關系知識存儲在哪里?它是否像實體知識一樣存儲在 MLPs 中?
  • RQ2:無論存儲位置如何,關系和實體知識在知識三元組中是否同等重要?

4.1 實驗設置

在實驗中,研究者使用 GPT-2 XL(1.5B)和 GPT-J(6B)作為基礎語言模型。實驗在四個 NVIDIA RTX A6000 GPU 和十個 NVIDIA GeForce RTX 3090 GPU 上進行。評估指標包括可靠性和泛化性。

可靠性量化編輯過程的可靠性,可靠性越高表示編輯越成功。為了衡量可靠性,研究者評估編輯準確性如下:

$ M_{rel} = E_{(x,y^) \sim D}[1_{f(x;θ^(x,y^)) = y^}] $

,泛化性衡量編輯后模型的預測在各種輸入或上下文中的泛化能力:

$ M_{gen} = E_{(\tilde{x}) \sim N(x)}[1_{f(\tilde{x};θ^) = f(x;θ^) = y^*}] $

其中 指重新表述的文本提示,N(x) 表示等價于 x 的重新表述提示集。

4.2 RQ1:關系的因果分析

研究者進行了因果追蹤分析,以確定關系知識在模型參數中的位置,結果如圖 2 所示。通過在提示的不同位置和不同模型組件(如單個狀態、MLP 層和注意力層)之間改變中介,計算了 1207 個事實陳述的平均間接效應(AIE)。結果顯示,與先前的發現一致,最后一個標記的最后幾層存在高 AIE 分數。

大模型中的知識存儲,到底是怎么回事-AI.x社區

這表明恢復這些層中 MLP 的隱藏狀態可以恢復大部分必要信息。此外,研究者觀察到故意損壞的關系標記的早期層也存在高 AIE 分數,強調了這些早期層在預測合理性方面的重要性。

同樣,研究者注意到最后一個損壞標記的中間注意力層存在顯著的 AIE。研究者發現,通過知識三元組中的關系 r 識別的知識存儲位置與 MLP 層和注意力層都有很強的相關性,如圖 3 所示。

大模型中的知識存儲,到底是怎么回事-AI.x社區

這一結論與先前通過實體定位識別較低 MLP 層中知識存儲的工作不同。研究者發現,通過關系定位的知識表達與較高的 MLP 層和中上層注意力層密切相關。當探索模型知識表達從實體視角到關系視角時,知識表達的因果位置在模型中發生了顯著變化。

這表明模型參數中的知識存儲位置是復雜的,不能簡單地通過單一視角的因果追蹤來確定,假設知識被隔離在特定的模型層中。因此,研究者認為,通過這種定位來修改相應的模型參數以控制知識的表達是不合理的。

4.3 RQ2:探究等價性

在假設實體和關系視角在知識三元組中在邏輯上等價的前提下,如圖 3 所示,實體知識和關系知識被認為是可互換的。基于這一假設,研究者假設通過改變關系知識來修改實體知識在理論上是可能的。

為了驗證這一假設,研究者應用模型編輯技術從關系和實體角度修改語言模型中的知識,并觀察效果是否相同。表1展示了應用基于關系的模型編輯方法后,從關系和實體兩個角度的評估結果。

表1:編輯關系知識后的性能

方法

實體知識


關系知識



可靠性

泛化性

可靠性

泛化性

GPT-2 XL





FT

23.92

25.44

98.79

79.03

KN

22.53

24.61

97.52

76.16

MEND

22.33

24.63

100.0

83.24

ROME

27.92

28.12

99.99

84.47

MEMIT

24.15

24.63

91.36

76.24

GPT-J





MEND

15.51

17.99

100.0

81.52

ROME

30.95

31.87

100.0

95.97

MEMIT

18.92

19.37

100.0

88.50

與研究者的假設相反,結果令人驚訝地發現,實體的評估分數遠遠落后于關系的評估分數。編輯關系知識在關系方面取得了高指標,表明這些編輯方法是有效的。然而,實體知識的結果明顯較低,這表明編輯關系并不能有效地改變實體知識。這是令人困惑的,因為同一三元組中的實體和關系定義了一條知識。理論上,改變三元組的任何部分都應該改變整個三元組,這意味著它們應該是等價的。

表2展示了應用基于實體的編輯方法后,從關系和實體角度的評估結果。

表2:通過編輯實體知識的性能

方法

實體知識


關系知識



可靠性

泛化性

可靠性

泛化性

GPT-2 XL





ROME

99.93

96.6

96.12

74.46

MEMIT

93.88

79.6

97.28

76.01

GPT-J





ROME

99.99

99.49

91.37

74.52

MEMIT

99.87

95.08

92.36

74.20

表2中的結果顯示,評估結果相對穩定,波動較小。關系知識的可靠性有所提高,但泛化性指標顯著下降。這些發現表明,從實體角度進行模型編輯可能會改變知識片段之間的關系信息。然而,這些變化是不一致的。

上述發現表明,編輯實體知識和關系知識并不完全等價。

5. 結論

本文揭示了LLMs中的關系知識不僅編碼在MLP層中,還顯著地編碼在注意力模塊中。這一發現與之前假設知識主要存儲在MLP權重中的觀點形成對比。研究者的分析表明,實體和關系知識在LLMs中是分開存儲的,突出了知識存儲機制的復雜性。

這些見解對于改進模型可解釋性和開發先進的基于知識的應用至關重要。此外,研究者的發現為未來在LLM相關任務(如模型編輯)的研究和開發提供了新的視角。具體來說:

  • 知識存儲的復雜性:研究結果表明,LLMs中的知識存儲機制比之前認為的更為復雜。實體和關系知識并不簡單地存儲在相同的位置或以相同的方式表示。這意味著在設計知識編輯或提取算法時,需要考慮這種復雜性。
  • 模型編輯的挑戰:研究發現,編輯實體知識和關系知識并不完全等價。這對當前的模型編輯技術提出了挑戰,因為許多現有方法假設可以通過修改一個方面(如實體)來影響另一個方面(如關系)。未來的模型編輯方法需要更細致地考慮知識的不同方面。
  • 注意力機制的重要性:研究結果強調了注意力模塊在存儲關系知識方面的重要性。這表明在分析和修改LLMs中的知識時,不能僅僅關注MLP層,還需要考慮注意力機制的作用。
  • 模型解釋的新方向:這項研究為理解LLMs如何表示和處理知識提供了新的視角。這可能會引導新的模型解釋方法,幫助研究者更好地理解這些復雜模型的內部工作原理。
  • 知識表示的多樣性:研究發現實體和關系知識可能以不同的方式存儲和表示。這暗示了LLMs中知識表示的多樣性,可能需要更復雜的方法來全面理解和操作模型中的知識。

這項研究不僅挑戰了現有的關于LLMs中知識存儲的假設,還為未來的研究指明了方向。它強調了需要更細致、多角度的方法來理解和操作這些復雜模型中的知識。這些見解可能會推動更有效的模型編輯技術、更準確的知識提取方法,以及更深入的模型可解釋性研究。

本文轉載自??芝士AI吃魚??,作者:芝士AI吃魚

已于2025-6-4 10:21:53修改
收藏
回復
舉報
回復
相關推薦
久久久久亚洲av无码专区喷水| 亚洲欧美成人一区| 女同视频在线观看| 成人蜜臀av电影| 久久久免费av| 国产网红在线观看| 国产午夜亚洲精品理论片色戒| 91在线观看免费高清完整版在线观看| 日本高清在线观看视频| 亚洲国产日韩a在线播放| 少妇性饥渴无码a区免费| 久久久夜精品| 国产精品免费久久久| 美女国产精品久久久| 日韩欧美色综合| 可以在线观看的av网站| 一区二区三区日韩在线观看| 播放灌醉水嫩大学生国内精品| 欧美aaa在线| 精品一区二区日本| 亚洲天堂一区二区三区四区| 国产91色在线|免| 7m精品国产导航在线| 国产亚洲精品久久久久动| 老司机精品视频在线观看6| 亚洲国产精品嫩草影院| 久久综合伊人77777麻豆最新章节| 国产乱淫av一区二区三区| 蜜桃视频日韩| 国产日韩亚洲| 成人欧美一区二区三区在线观看 | 国产高清视频在线播放| 亚洲在线视频一区| 成人羞羞视频免费看看| 国产亚洲成年网址在线观看| 三上悠亚久久精品| 国产激情精品久久久第一区二区 | 伊人久久噜噜噜躁狠狠躁| 中文欧美日本在线资源| 欧美男男tv网站在线播放| 日韩美女视频在线| 欧美18一19xxx性| 欧美日韩精品是欧美日韩精品| 在线中文字幕资源| 日韩欧美在线视频| 男人的天堂在线视频| 在线亚洲人成电影网站色www| 免费在线超碰| 欧美午夜视频网站| 国产在线观看91| 亚洲高清色综合| 亚洲性色av| 日韩中文字幕网站| 国产一区二区三区免费在线| 久久久久久亚洲| 神马影视一区二区| 91福利视频导航| 国产精品久久久一区二区| 在线国产精品网| 波多野结衣中文一区| 黄色片视频在线播放| 亚洲乱码国产乱码精品精可以看| 中文字幕在线视频网| 在线观看亚洲专区| 9lporm自拍视频区在线| 日韩中文在线视频| 亚洲午夜久久| 日韩在线观看免费全| 国产一区久久久| 久久av少妇| 亚洲成人第一| 国产一区二区三区日韩| 亚洲欧美亚洲| 国产精品扒开腿爽爽爽视频| 午夜国产精品视频免费体验区| 欧美日韩精品中文字幕一区二区| 久久国产麻豆精品| 日日碰狠狠丁香久燥| 亚洲一区免费观看| caoporm免费视频在线| 色综合伊人色综合网| 欧美精选视频在线观看| 久久伊人一区| 国产欧美一区在线| 不卡在线视频| 久久影院模特热| 亚洲精品电影| 国产精品无码电影在线观看| 伊人夜夜躁av伊人久久| 三级网站视频在在线播放| 欧美国产视频一区二区| 精品电影一区| 欧洲熟妇精品视频| 欧美日韩一区中文字幕| 91精品福利观看| 国产乱码精品一区二区三区卡 | 亚洲欧洲一级| 欧美亚洲另类色图| 欧美日韩精品一区二区三区| 欧美一区二区三区婷婷| 国产精品亚洲自拍| 国产一区二区导航在线播放| 蜜芽视频在线观看| 国产亚洲精品久久久久久牛牛 | 亚洲国产wwwccc36天堂| 免费成人在线电影| 成人网在线视频| 91在线高清观看| 婷婷五月在线视频| 668精品在线视频| 国产真实乱子伦精品视频| 性一爱一乱一交一视频| 一区二区三区四区精品| 伊人久久大香线蕉av超碰演员| 免费无码国产v片在线观看| 91精品国产综合久久精品性色| 国产96在线亚洲| 国产日本欧美在线| 欧美日韩色综合| 精品久久中文| 欧美日韩一区二区三区69堂| 亚洲精品国产精品国产自| 香蕉视频国产精品| 久久这里只精品| 在线电影av不卡网址| 久久久亚洲人| 久久精品国产亚洲a∨麻豆| 国内精品久久影院| 国产91精品一区二区麻豆网站| 秋霞成人影院| 国产一区玩具在线观看| 中文字幕中文字幕一区| 亚洲电影二区| 欧美黄色免费网址| 日韩免费一区二区| 在线成人h网| 瑟瑟在线观看| 日韩免费在线观看视频| 国产精品久线在线观看| av一级久久| 男女激情无遮挡| 欧美视频日韩| 日韩一区二区福利| 国产精品综合在线视频| dj大片免费在线观看| 国产不卡一区二区在线观看 | 在线观看亚洲成人| 精品视频97| 日本中文字幕电影| 2023亚洲男人天堂| 国产精品乱人伦中文| 在线播放一区二区精品视频| 91视频 -- 69xx| 色悠悠国产精品| 不卡视频免费播放| 美女久久久久久| 男的插女的下面视频| 国产亚洲欧美日韩精品| 国产一区二区不卡老阿姨| 国产乱码精品一区二三赶尸艳谈| 久久久福利视频| 91精品国产综合久久香蕉麻豆| 激情六月综合| 巨大荫蒂视频欧美另类大| 欧美日韩喷水| 7777精品久久久大香线蕉| 日本不卡高清视频| 新版的欧美在线视频| 国产亚洲黄色片| 不用播放器成人网| 国产精品人人做人人爽人人添| 在线一级成人| 欧美老女人性开放| 国产一级二级三级精品| 91精品国产麻豆| 久久99热这里只有精品| 朝桐光一区二区| 日韩欧美在线免费观看视频| 91国语精品自产拍在线观看性色 | 韩剧1988在线观看免费完整版| 亚洲国产精品av| 日韩在线中文| 91caoporm在线视频| 欧日韩一区二区三区| 精品无码久久久久久国产| av一区二区三区| 天堂综合网久久| 精品亚洲综合| 亚洲精品白虎| 日韩亚洲国产中文字幕| 综合久久一区二区三区| 中文精品电影| jizzjizz中国精品麻豆| 已婚少妇美妙人妻系列| 91精品久久久久久久久久另类| 日韩小视频在线观看专区| 91在线一区二区三区| 偷偷www综合久久久久久久| 欧美大胆a人体大胆做受| 成人eeuss影院在线观看|