国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

長思維鏈里的推理步驟,哪些最關鍵?三招鎖定LLM的「命門句子」

人工智能 新聞
在最近的一項研究中,來自杜克大學和 Aiphabet 的研究者提出,在句子層面分析推理痕跡或許是一種有前途的方法。

思維鏈里的步驟很重要,但有些步驟比其他步驟更重要,尤其是在一些比較長的思維鏈中。

找出這些步驟,我們就可以更深入地理解 LLM 的內部推理機制,從而提高模型的可解釋性、可調試性和安全性。

但是,這些步驟沒有那么好找,因為每個生成的 token 都依賴于之前的所有 token,其計算難以分解。

在最近的一項研究中,來自杜克大學和 Aiphabet 的研究者提出,在句子層面分析推理痕跡或許是一種有前途的方法。

圖片

  • 論文標題:Thought Anchors: Which LLM Reasoning Steps Matter? 
  • 論文鏈接:https://arxiv.org/pdf/2506.19143

作者指出,與 token 相比,句子的連貫性更強,并且往往與 LLM 提取的推理步驟相一致;與段落相比,句子不太可能混淆推理步驟,并且可以作為連接不同步驟的有效對象。

作者提出了三種互補的方法來分析 LLM 的推理過程,這些方法旨在識別推理過程中的關鍵步驟,即所謂的「思維錨(thought anchor)」,這些步驟對后續推理過程具有重大影響。

圖片

第一種是黑盒方法。它通過反事實分析衡量句子對最終答案的影響。即通過比較模型在包含某個句子和不包含該句子時的最終答案分布,來評估該句子對最終答案的影響。

第二種是白盒方法。它通過注意力模式識別關鍵句子,揭示關鍵句子如何影響推理軌跡的其余部分。

第三種是因果歸因方法。它通過抑制注意力直接測量句子之間的因果關系,即抑制對特定句子的注意力如何影響后續每個句子的 logits。

圖片

每種方法都為思維錨的存在提供了證據。這些推理步驟非常重要,對后續推理過程產生了不成比例的影響。這些思維錨通常是計劃句或回溯句。

作者提供了一個開源工具,用于可視化方法的輸出。

開源工具鏈接:http://thought-anchors.com/

這項研究也為更精確地調試推理失敗、識別不可靠性的來源以及開發提高推理模型可靠性的技術打開了大門。

圖片

通過反事實測量句子影響

有些句子比其他句子更重要,但哪些句子最重要取決于我們如何定義和衡量重要性。作者將句子層面的重要性表述為一個反事實影響的問題:包含或排除一個句子會如何影響后續步驟以及模型的最終輸出?

在之前的研究中,句子重要性通常是通過在推理過程中的每個句子位置強制模型給出最終答案來近似的,這種方法叫做「forced-answer」(如圖 3A)。

圖片

這種方法的一個局限性在于,對于某些最終答案而言,句子 S 可能是必要的,但 LLM 在推理過程中往往較晚才生成該句子。這意味著,對于出現在 S 之前的所有句子,強制回答的準確率都會很低,從而無法準確判斷這些早期步驟的重要性。

考慮一個由句子圖片以及最終答案 A 組成的推理軌跡。作者通過重新采樣來定義一個度量,用以衡量句子 S 導致答案 A 出錯的程度。作者稱這個度量為反事實重要性。他們通過以下三個步驟來激勵并定義這個度量:

推理軌跡采樣。對于給定的句子 S_i,生成 100 次推理軌跡。一種情況下包含句子 S_i(干預條件),另一種情況下用一個語義不同的句子 T_i 替代 S_i(基礎條件)。

分布比較。計算兩種條件下最終答案分布的 KL 散度。從而得到一個衡量句子 S_i 改變答案程度的標量。作者稱其為重采樣重要性度量。

語義過濾。重采樣重要性的問題在于,如果 T_i 與 S_i 相同或相似,那么我們無法得知 S_i 是否重要。因此,作者通過計算句子對的余弦相似度,并設定一個相似度閾值,篩選出那些與原句子 S_i 語義不同的替代句子 T_i。這樣可以避免因替代句子與原句子過于相似而導致的分析偏差,從而更準確地評估 S_i 對最終答案的影響。

由于作者在給定句子 S_i 之后重新采樣所有步驟,因此避免了上述強制回答方法的局限性。

在數據集中,他們發現規劃生成(Plan generation)和不確定性管理(uncertainty management)例如,回溯)句子的反事實重要性始終高于其他類別的句子,如事實檢索或主動計算(見圖 3B)。這支持了這樣一種觀點:高層次的組織性句子可以錨定、組織并引導推理軌跡。作者認為,與強制回答重要性和先前基于 token 或注意力的度量相比,這種方法提供了更有信息量的結果。

通過注意力聚集衡量句子重要性

作者假設重要的句子可能會受到下游句子更多的關注。盡管注意力權重并不一定意味著因果聯系,但高度的關注是重要的句子可能對后續句子施加影響的合理機制。作者進一步推測,對重要句子的高度關注可能由特定的注意力頭驅動,通過追蹤這些頭,可能能夠確定關鍵句子。

作者評估了不同的頭在多大程度上將注意力集中在特定的句子上。首先,對于每個推理軌跡,他們將每個注意力頭的 token-token 注意力權重矩陣取平均值,形成一個句子 - 句子矩陣,其中每個元素是兩個句子之間所有 token 對的平均值?;诿總€注意力矩陣,他們計算其對角線下方列的平均值,以衡量每個句子從所有下游句子中獲得的關注程度;只在相隔至少四個句子的句子對之間取平均值,以專注于遠距離的連接。這為每個頭生成了一個分布(例如,圖 4A),并且每個頭通常將注意力集中在特定句子上的程度可以通過其分布的峰度來量化(對每個推理軌跡進行計算,然后在軌跡之間取平均值)。繪制每個頭的峰度圖表明,一些注意力頭強烈地將注意力集中在推理軌跡中特定的、可能是重要的句子上(圖 4B)。

圖片

圖 5 表明,規劃生成、不確定性管理和自我檢查(self checking)句子始終通過接收頭獲得最多的關注(見圖 5),而主動計算句子獲得的關注最少。進一步與這一發現一致的是,根據重采樣方法,那些獲得高接收頭關注的句子往往也會對下游句子產生更大的影響。這些發現與以下觀點相符:推理軌跡是圍繞高層句子構建的 —— 這些句子啟動的計算可能連接高層陳述,但對整體推理路徑的影響可能微乎其微。

圖片

通過「注意力抑制」衡量句子重要性

自然而言,考察注意力權重存在一個固有局限:它們無法衡量因果關系。此外,接收頭未必適合識別句子與單個后續句子間的關聯。因此,作者接下來聚焦于句子間依賴關系的因果歸因分析。

基于重采樣的句子間分析雖能考察此類依賴關系,但在映射邏輯連接時精度有限 —— 因為反事實重要性反映的是句子對另一句子的總效應(包括直接和間接影響)。而本文方法旨在分離句子間的直接影響,從而有望實現對邏輯連接更精確的建模。

作者通過抑制對特定句子的所有注意力(所有層和頭),觀察其對后續句子的影響。具體而言,影響程度定義為 token logits 與基線 logits(未抑制時)的 KL 散度。對后續句子的總效應計算為其組成 token log-KL 散度的平均值。

該方法基于兩個假設:

  1. token logits 能準確捕捉句子的語義內容;
  2. 注意力抑制不會導致分布外行為的干擾。

因此需驗證注意力抑制法與重采樣法的相關性 —— 后者雖精度較低,但不依賴上述假設。

注意力抑制矩陣與重采樣矩陣的值呈現顯著相關性。在 20 條推理軌跡中,19 條顯示正相關。當僅分析推理軌跡中相距 5 句以內的案例時(可能更好捕捉直接效應),相關性更強??紤]到兩種方法測量的是因果關系的不同維度,且重采樣法本身包含隨機噪聲,這些相關系數具有實質意義。該結果支持了重采樣方法的有效性。

案例研究

所采用的三種技術覆蓋了推理軌跡中不同層面的歸因分析。接下來,作者通過模型對具體問題的響應展示了這些技術的實用性和互補性。選用的例題是:「當十六進制數 66666_16 轉換為二進制表示時,它有多少個二進制位(比特)?」

圖片

重采樣

模型處理此問題的思路是:首先考慮 66666_16 包含 5 個十六進制位,而每個十六進制位可用 4 個二進制位表示?;诖诉壿?,思維鏈最初得出「20 比特」的答案。然而這一初始答案忽略了 6_16 實際對應 110_2(而非 0110_2,因其最前面的 0 無效),因此正確答案應為「19 比特」。在第 13 句時,模型通過啟動將 66666_16 轉換為十進制再轉二進制的計算,轉向了正確解答。

重采樣方法揭示了這一初始錯誤軌跡和關鍵轉折點(圖 2A 已展示)。具體表現為:第 6-12 句期間預期準確率持續下降,但第 13 句使反事實準確率急劇上升。值得注意的是,若采用強制模型立即生成響應的評估方法(如部分已有研究所示),則會完全錯過第 13 句的關鍵作用 —— 該方法僅會得到 0 準確率。

圖片

接收頭

模型得出最終正確答案的推理軌跡可分解為多個計算模塊(見圖 6 流程圖)。首先,模型建立將 66666_16 轉換為十進制的計算公式(第 13-19 句);接著執行該公式的計算,得出 66666_16 對應的十進制值為 419,430(第 20-33 句);隨后通過提出并求解新公式圖片,確定正確答案為「19 比特」(第 34-41 句)。此時模型注意到與早期「20 比特」答案的矛盾(第 42-45 句),于是啟動雙重驗證計算:先確認十六進制轉十進制的準確性(第 46-58 句),再校驗二進制轉換的正確性(第 59-62 句)。在強化對「19 比特」答案的確信后,模型最終發現初始「20 比特」錯誤的根源:「因最前面的 0 不計入位數」(第 66 句)。

上述過程基于作者對注意力模式的分析:接收頭精準定位了發起計算或陳述關鍵結論的句子,從而將推理軌跡劃分為具有明確意義的模塊(圖 6)。

注意力抑制分析

除了被組織成計算模塊外,該推理過程還展現出與句子間依賴關系相關的框架結構(圖 6)。其中一個結構特征是包含錯誤提議、發現矛盾及最終解決的自我糾正模式。具體而言,模型最初提出「20 比特」的錯誤答案(第 12 句),隨后決定重新核驗。這導致與通過十進制轉換計算得出的「19 比特」答案產生矛盾(第 43-44 句)。在重新核驗支持「19 比特」答案的運算后,模型回到該矛盾點(第 65 句),最終解釋為何「20 比特」答案是錯誤的(第 66 句)。這可視為一個初步的思維鏈回路:兩個相互沖突的結論產生矛盾,進而促使模型解決該矛盾。

在這個大跨度框架中,還存在驗證先前計算的更深層依賴關系。具體表現為:模型先完成 66666_16 轉換為十進制值 419,430 的計算(第 32 句),隨后決定核驗該轉換結果(第 46 句),最終確認原始值正確(第 59 句)。這可視作思維鏈回路的進一步體現。

作者基于論文前面提到的注意力抑制矩陣識別出這些關鍵連接,該矩陣在這些關聯位置呈現局部最大值(12→43、43→65、12→66;32→46、32→59)。值得注意的是,注意力抑制技術定位的多數句子與接收頭(receiver heads)高度關注的句子存在重疊。相較于接收頭的結論,注意力抑制技術還展示了信息是如何在這些構建推理軌跡的關鍵句子之間流動的。

更多細節請參見原論文。

責任編輯:張燕妮 來源: 機器之心
相關推薦

2024-10-16 12:51:56

2025-10-09 09:15:11

2025-07-08 08:38:09

推理錨點LLM大模型

2024-10-21 08:00:00

2024-05-14 09:22:51

模型技術

2025-02-13 09:00:00

2025-03-13 11:18:14

2024-12-12 09:00:00

2025-02-10 13:00:00

模型訓練AI

2025-02-07 16:07:39

2025-02-08 17:00:11

2024-11-11 11:05:00

大語言模型系統

2025-10-10 02:00:00

2024-08-12 09:40:00

模型數據

2025-02-10 09:35:00

2020-11-20 14:59:06

區塊鏈數據物聯網

2022-06-15 15:14:02

網絡安全網絡攻擊

2025-05-21 09:02:20

2018-08-03 10:25:53

區塊鏈大數據比特幣

2018-08-30 18:30:19

區塊鏈思維中心化
點贊
收藏

51CTO技術棧公眾號

久久久精品一区二区三区| 色综合色综合色综合| 午夜精品免费在线| 最新欧美日韩亚洲| 日韩欧美在线中字| 日韩一区在线视频| h片在线免费| 免费在线黄网| 久久久精品影视| 一区二区在线观看网站| 亚洲香蕉av| 91大神在线播放精品| 爱情电影网av一区二区| 色777狠狠综合秋免鲁丝 | 国产另类第一区| 国产v日韩v欧美v| 91黄视频在线观看| 蜜桃臀av在线| 国产精品1区2区| 国产精品免费一区二区三区| 中文在线播放一区二区 | 欧美日韩国产亚洲沙发| 中文字幕不卡三区| 1069男同网址| 久久精品男人的天堂| 久久久久久久久久久久91| 国产99久久久国产精品| 亚洲人成无码www久久久| 不卡的av网站| 99精品免费在线观看| 91在线看国产| 97在线观看| **性色生活片久久毛片| 成人3d漫画免费无遮挡软件| 国产精品乱码久久久久久| 免费男同深夜夜行网站| 亚洲一区在线观看视频| 天堂中文av| 亚洲涩涩av| 日日噜噜噜夜夜爽亚洲精品 | 在线视频日韩| 日本免费一区二区三区| 亚洲在线国产日韩欧美| 一区二区三区av在线| 国产乱码字幕精品高清av| 麻豆中文字幕在线观看| 国内久久精品视频| 特级西西人体www高清大胆| 久久青草国产手机看片福利盒子| 国产男女激情视频| 岛国av一区二区三区| 一区二区三区视频在线观看视频| 欧美人与z0zoxxxx视频| 美女日批视频在线观看| 日韩精品视频在线免费观看| 成人精品毛片| 国产精品视频久久久久| 久久精品国产一区二区三 | 超碰超碰在线观看| 精品久久久久久久久久久久| 可以在线观看的av网站| 欧美一区二区三区婷婷月色| 另类中文字幕国产精品| 午夜精品一区二区三区视频免费看| 亚洲香蕉av| 日韩免费三级| 91亚洲精华国产精华精华液| 国产黄色影视| 欧美三级在线播放| 亚洲**毛片| 99久久99久久| 久久九九久精品国产免费直播| 中文在线a在线| 国产一区二区动漫| 神马影视一区二区| 四虎影视永久免费在线观看一区二区三区| www.亚洲国产| 成人黄色激情网站| 欧美日韩免费视频| 欧美精品国产白浆久久久久| 欧美日韩一区二区视频在线观看| 午夜激情电影在线播放| 一本色道久久88亚洲精品综合| 国产精品理论片在线观看| 日本欧美高清| 91黄色国产视频| 99久久久久免费精品国产| av五月婷婷| 日韩精品在线一区二区| 日韩在线视频一区二区三区| 久久亚洲综合av| 污污网站免费观看| 欧美又粗又大又爽| 日本午夜精品久久久久| 91精品国产91久久久久久吃药| 在线综合视频| 成人3d动漫一区二区三区| 欧美在线一区二区| 久久99高清| 欧美在线观看黄| 日韩欧美国产精品一区| 国产a久久精品一区二区三区| 日韩av综合在线观看| 欧美日韩国产天堂| 第一社区sis001原创亚洲| 妞干网在线播放| 精品国产伦一区二区三区观看方式| 天天躁日日躁狠狠躁欧美巨大小说| 亚洲一区二区三区四区中文| 欧美精品一二三| 亚洲精品国模| 一本色道久久亚洲综合精品蜜桃| 亚洲日本久久| 视频在线不卡| 91精品91久久久久久| 26uuu久久综合| 俄罗斯一级**毛片在线播放| 久久久久无码国产精品一区| 亚洲午夜在线电影| 精品国产一级毛片| av网址在线观看免费| 色狠狠av一区二区三区香蕉蜜桃| 一区二区三区福利| 无遮挡的视频在线观看| 青青在线视频一区二区三区| 久久久一区二区| 美女搞黄视频在线观看| 亚洲精品一品区二品区三品区| 日韩欧美国产高清91| 一区二区三区国产精华| av手机在线看| 国产精品一区二区三区久久| 中文字幕中文字幕一区二区| 欧美巨大xxxx| 一区二区xxx| 色噜噜狠狠色综合网图区| 老司机免费视频一区二区| 久草在线视频福利| 精品日本一区二区三区在线观看| 欧洲激情一区二区| 色偷偷综合网| 韩国中文字幕2020精品| 国产一区二区丝袜| 日韩欧美在线第一页| 欧美视频免费| 成人精品电影在线观看| 超碰在线cao| 欧美日韩另类综合| 色哟哟精品一区| 欧美在线三区| 蜜桃传媒九九九| 欧亚精品中文字幕| 一二三四区精品视频| 精品免费av| 在线观看中文字幕| 91久久国产精品91久久性色| 亚洲黄色录像片| 91精品综合久久久久久久久久久| 中日韩免费毛片| 欧美精品亚洲| 亚洲男子天堂网| 国产精品久久久久久一区二区三区| 7777精品| av在线资源站| 亚洲日本精品一区| 久久精品国产亚洲精品| 国产午夜精品久久久久久久| 成人激情诱惑| 91xxx在线观看| 福利视频一二区| 欧美激情手机在线视频 | 久久99精品久久久久久久青青日本 | 久久久久久香蕉| 国产精品xxxxx| 色综合久久久久久久久久久| 国产精品久久久久毛片大屁完整版| 免费日本一区二区三区视频| 国产传媒久久久| 97色在线播放视频| 欧美精选一区二区| 国模少妇一区二区三区| 在线看成人短视频| 黄色片视频在线观看| 视频在线99re| 久久中文字幕国产| 自拍偷拍亚洲激情| 色婷婷综合网| 2020国产在线视频| 99热这里只有精品在线播放| 国产一级精品aaaaa看| 免费av在线一区| 欧美一区二区三区小说| 国产精品久久久久久妇女6080| 天堂资源av| 国产专区一区二区| 高清欧美性猛交xxxx| 亚洲第一级黄色片| 日韩欧美中文第一页| 久久久久久久久久久久久女国产乱| 99热精品在线|