国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

DeepSeek推理最高提速6倍!開源研究:加裝「思維進度條」,計算量減少30%

人工智能 新聞
來自特拉維夫大學的研究團隊開發出了一種新方法,可以監控和控制LLM中的思考路徑長度。

DeepSeek推理要詳細還是要迅速,現在可以自己選了?

來自特拉維夫大學的研究團隊開發出了一種新方法,可以監控和控制LLM中的思考路徑長度。

給LLM的推理任務裝上進度條,還能控制推理的深度、調整推理速度。

加速后的模型和原模型相比,使用的token數減少了近6倍,且都得出了正確答案。

圖片

LLMs在顯示結構化推理時,會隱式跟蹤其在思考階段的相對位置,并通過隱藏狀態編碼這一信息。

而論文提出了一種“思維進度向量”(Thinking Progress Vector, TPV),可用于實時預測模型在推理階段的相對位置,并通過可視化進度條展示模型的推理動態。

圖片

通過干預TPV,可以加速或減速模型的推理過程,實現“超頻”(overclocking)和“降頻”(downclocking)。

超頻能夠減少不必要的推理步驟,使模型更快地得出結論,同時避免因過度推理導致的性能下降。

該模型已在gitHub上開源。

方法:實時監控并控制推理深度

在有效推理學習過程中,模型必須隱式地學習跟蹤其思考階段進度,并保持對例如距離最終答案有多近的估計。

由于進度跟蹤依賴于輸入,這類信息不能存儲在模型的靜態權重中,而必須動態編碼在層間傳遞的隱藏表示中。

為此,論文的研究團隊選擇從最終隱藏層提取信息。

研究團隊專注于執行顯式結構化推理的模型,這種模型的特點是具有一個由<think>和</think>標記明確界定且連續的推理階段,如DeepSeek-R1。

由此可以通過根據每個標記的相對位置精確地用介于零和一之間的插值值進行標記,來量化模型在推理階段的進展。

形式上,通過以下方式構建數據集??:

圖片

其中圖片是第k個思考軌跡中第j個詞的隱藏表示,圖片是該詞在其思考序列中的相對位置 。K表示采樣軌跡的數量,??中的總樣本數為圖片。

在此基礎上優化一個進度提取函數圖片,將隱藏表示映射為其相對位置,形式為一個回歸任務圖片。

使用參數為圖片的線性回歸器作為函數圖片來進行擬合進度屬性圖片,將參數向量??稱為稱為“思考進度向量”(TPV)。

為了提高預測效果,利用模型的自回歸特性,并對預測歷史應用指數平滑以減少噪聲。在Math-500測試集中進行TPV預測,結果如下圖所示:

圖片

其中圖(a)展示了多個思考軌跡的數據點的匯總視圖,圖 (b, c)則展示了Math-500測試集中單個問題的思考軌跡上的TPV預測和平滑預測。

可以看到,兩種方法都成功預測了相對位置,而后者產生了更精確的結果,可用于創建更清晰、更易于解釋的進度條。

受此啟發,為了更好地利用進度條預測任務的時序結構,使用可訓練的序列模型替換指數平滑,即使用與??相同的訓練樣本,只是將相對位置序列作為輸入,而不是進行單步預測:

圖片

通過這種方法,就可以實現推理進度的可視化。

一個關鍵問題是,TPVs是否反映了模型用來跟蹤其推理進度的基本機制,或者它們是否僅僅是與進度相關但不起因果作用計算的殘余物?

為解決這一疑惑,對TPY進行干預:通過投影向量??的方向將隱藏表示??移動量α,即圖片,修改后的表示具有新的預測值圖片。

通過在所有注意力層執行此干預,就可以干預下一個詞的預測,并避免編輯在連續解碼步驟中緩存和使用的表示值。

在實驗中,將α視為決定干預強度的超參數。設置α=0會導致沒有干預,保留原始計算。 α的正值會導致超頻。

實驗證明,超頻將加速模型的推理階段,使其更短、更果斷:

圖片

上圖比較了DeepSeek-R1-Distill-Qwen-32B模型生成的兩種思考序列——干預前和干預后。

原始序列表現出猶豫和冗長,而TPV加速版本則顯著更簡潔,使用的token數量減少了近6倍。

并且,兩條軌跡最終都得到了正確的答案。

效果:最高提速近6倍,準確率不降反升

在DeepSeek-R1-Qwen-32B和DeepSeek-R1-LLaMA-8B上測量TPV的有效性,結果如下所示:

圖片

實驗結果揭示了四個顯著趨勢:

1、α 的影響:增加α從5到100,無論是否使用基于指令的加速,都會增加模型生成的完成、結束和正確答案的數量,證明TPV的干預方法影響了思考長度。

2、將加速基線與基礎模型進行比較:基線(ii)和(iii)通過提示響應和基于溫度的集成來加速基礎模型。在大多數情況下,這兩種方法都提高了所有三個指標,證明它們是評估TPV超頻方法的強基線。

3、與基線方法的比較:盡管基線方法表現優異,且基于溫度的基線方法需要大約五倍的計算資源,但TPV的方法通過產生更多正確答案和更明確的響應,在性能上超越了它們。

在計算預算較低(如256或512個token)的情況下,TPV的方法增加了80%的正確答案,并且這些正確答案的增加并未以增加錯誤率為代價,錯誤率保持不變。這表明,TPV方法縮短了推理過程而不增加錯誤,促進了更明確的思考。

對于大于512的計算預算,通常遵循相同趨勢,在大多數情況下正確答案數量有所提升,而錯誤率并未增加。

4、互補性貢獻:盡管實證研究結果證實TPV方法比基線方法更有效,但仍有該方法落后于基于提示的方法(記為“指令”)的情況。一個突出的例子是在 Math 500 上使用 2048個token 預算的機制,其中指令基線正確回答的比例比TPV方法高出10%。

這一觀察引發了這樣的問題:這些改進是正交的還是相互競爭的?

將基于指令的提示技術與TPV的干預方法相結合,并與每種方法單獨進行比較。結果如表中最后兩行所示:這種混合方法在大多數情況下始終表現出最佳性能,平均提高了66% ,最高提高了285% ;相對于基礎模型平均提高了223% ,最高提高了1416% 。

這些發現表明TPV方法與提示策略相輔相成,可以有效地與其他加速技術相結合。

圖片

對Math-500和GSM8K數據集進行一系列干預實驗,通過改變干預參數α來超頻模型的思考階段。

結果顯示,增加α可以持續縮短思考階段的長度,使推理過程更加高效。

這些發現支持TPV在模型內部計算中充當一種主動控制的信號,而不是被動相關。

當使用提示策略(基線 iii)在GSM8K數據集上對 DeepSeek-R1 LLaMA模型應用TPV方法時,平均 token 數量從大約500減少到不到350,計算量減少了30%。

此外,所有α的正值都相對于基線( α=0 )持續加速思考階段,并提高了其有效性。

為進一步評估TPVs在估計模型在其推理過程中位置時的可靠性,研究團隊還在兩種附加條件下測試了它們的性能:

  • (i) 不同的提示策略
  • (ii) 不同的推理序列長度

圖(a-d) 顯示TPVs在各種指令中仍然有效,這與訓練期間使用的原始提示不同。

圖(e) 顯示在不同思考序列長度分箱中測試損失始終較低,表明對推理深度的變化具有魯棒性。

更多內容可見論文詳細。

參考鏈接:https://royeisen.github.io/OverclockingLLMReasoning-paper/

代碼:https://github.com/royeisen/reasoning_loading_bar

論文:https://arxiv.org/abs/2506.07240

責任編輯:張燕妮 來源: 量子位
相關推薦

2015-07-31 11:19:43

數字進度條源碼

2025-05-09 08:30:00

2011-07-05 15:16:00

QT 進度條

2024-08-06 14:29:37

2012-01-17 13:58:17

JavaSwing

2023-12-11 17:15:05

應用開發波紋進度條ArkUI

2009-06-06 18:54:02

JSP編程進度條

2024-06-13 08:15:00

2025-02-24 12:22:13

DeepSeek開源模型

2022-07-18 17:37:27

字節跳動人工智能AI模型

2015-01-12 12:13:03

Android進度條ProgressDia

2009-08-17 14:41:47

C#進度條實現

2009-12-25 17:58:12

WPF進度條

2009-08-18 09:49:00

C# listview

2009-08-17 15:48:47

C# WinForm進

2021-09-06 14:57:24

AI 數據人工智能

2024-06-24 18:17:07

2015-01-12 09:30:54

Android進度條ProgressDia

2013-03-12 10:35:06

CSS 3
點贊
收藏

51CTO技術棧公眾號

国产美女视频一区二区 | 国产婷婷色一区二区三区| 欧美无砖专区免费| 天天操天天综合网| 亚洲综合久久久久| 欧美成人一区二区三区在线观看| 日韩精品在线观看一区| 国产精品女人网站| www精品久久| 一二三区在线观看| 新片速递亚洲合集欧美合集| av免费在线一区| 亚洲一级二级| 美女91精品| 亚洲午夜精品久久久久久久久| 在线视频国内自拍亚洲视频| 精品国产露脸精彩对白| 欧美床上激情在线观看| 国产www免费| 成人羞羞网站| 亚洲男人的天堂一区二区| 在线观看日韩av| 中文字幕成人一区| 久久精品视频观看| 四虎国产精品免费久久5151| 国产在线视频一区二区| 色噜噜狠狠色综合欧洲selulu| 久久激情视频久久| 亚洲AV无码成人精品一区| 在线看福利影| 日韩欧美一区二区三区在线视频| 国产一区二区电影| 欧美日韩国产高清视频| av资源种子在线观看| 日韩精品欧美大片| 欧美在线观看视频一区二区三区| 日本中文字幕久久看| 亚洲男人网站| 美日韩一区二区三区| 亚洲午夜久久久久久久| 丰满人妻一区二区三区53号| 日韩精品黄色| 国产自产视频一区二区三区| av不卡在线免费观看| 久久亚洲二区三区| 欧美一级成年大片在线观看 | 99久久精品一区二区成人| 国产成人在线看| 亚洲网址你懂得| 亚洲精品进入| 色婷婷激情一区二区三区| 六十路精品视频| 日韩黄色三级| 国产精品久久久久av免费| av网站大全在线| 久久亚洲国产精品| 久久亚洲天堂| 欧美在线中文字幕| 天堂中文最新版在线中文| 一区二区三区中文字幕电影| 国产精品.com| 精品在线网站观看| 欧美高清视频一二三区| 97香蕉久久| 国产精品影音先锋| 欧美一区二区三区四区夜夜大片 | 中文字幕国内精品| 黄色网页在线免费观看| 国产69精品99久久久久久宅男| 久久精品视频观看| 999精品视频一区二区三区| 丝袜连裤袜欧美激情日韩| 青青草综合视频| 精品电影一区二区三区| 丝袜国产日韩另类美女| 91精品国产综合久久久久久丝袜| 色天下一区二区三区| 国产一区 在线播放| 国产一区二区三区在线观看免费| 黄网站在线观看| 欧美优质美女网站| 98精品久久久久久久| 92看片淫黄大片欧美看国产片 | 日韩精品一级二级| 99re资源| 欧美日韩激情视频8区| 天天干夜夜干| 色综合久久久久久久久| а√中文在线天堂精品| 国产suv精品一区二区三区88区| 午夜伦理福利在线| 一级黄色录像免费看| 精品国产乱码久久久久久久久| 久色成人在线| 国产高清视频在线| 欧美一区二区三区视频在线| 最新亚洲人成网站在线观看| 欧美日韩在线影院| 成人三级小说| 色综合久久久888| 宅男深夜国产| 999久久久| 欧美日韩一区在线| 自拍偷拍亚洲| 97视频国产在线| 亚洲午夜精品一区 二区 三区| 91av福利视频| 欧美精品99| 久久精品一二三区| 国产欧美日韩卡一| 77导航福利在线| 8x拔播拔播x8国产精品| 欧美日韩性视频在线| 久久99精品久久久久久国产越南 | 国产黄色激情视频| 另类少妇人与禽zozz0性伦| 性做久久久久久免费观看欧美| 高清毛片aaaaaaaa**| 在线观看视频一区二区欧美日韩| 天天操综合网| 亚洲精品一二三四五区| 色综合夜色一区| 国v精品久久久网| 你懂得在线网址| 欧美理论片在线观看| 精品电影在线观看| 中文字幕一区视频| 成人影院在线免费观看| 在线播放中文字幕| 全黄性性激高免费视频| 亚洲tv在线观看| 国产精品自在| 国产日韩精品综合网站| 国产精品久久福利| 成人手机在线视频| 国产精品扒开腿做爽爽爽视频软件| 国产日韩一区在线| 欧美激情亚洲国产| 成人午夜在线视频| 丝袜亚洲另类欧美| 91精品国产乱码久久久竹菊| 日本一区二区黄色| 中文字幕亚洲欧美在线 | 98精品在线视频| 久久久av网站| 尤物99国产成人精品视频| 欧美女孩性生活视频| 综合久久久久久| 精品欧美午夜寂寞影院| 日韩精品免费观看视频| 黄色网页在线观看| 浪潮av一区| av官网在线播放| 伊人手机在线| 成人福利片在线| 精品伊人久久| 四虎av网址| 国产精品v片在线观看不卡| 国产福利精品在线| 成人免费福利在线| 在线综合+亚洲+欧美中文字幕| 国产一区二区三区四区老人| 成人免费观看在线观看| 国产又粗又长又爽视频| 国产女大学生av| 久久久亚洲国产天美传媒修理工| 久久亚洲国产精品| 欧美制服第一页| 欧美一区二区高清在线观看| 欧美精品久久96人妻无码| 日韩一级完整毛片| 国产精品无圣光一区二区| 首页欧美精品中文字幕| 久久久久久久久久久久久夜| 一本色道69色精品综合久久| 国产精品一国产精品| 国产91精品在线| 国产精品av久久久久久麻豆网| 成人午夜电影小说| 日本高清免费不卡视频| 亚洲国产精品成人一区二区| 亚洲视频在线一区观看| 一区二区三区国产在线| 国产精品久av福利在线观看| 制服诱惑一区二区| 99国产精品免费网站| 久久久精品网| 婷婷久久综合九色综合绿巨人| 最近2019中文字幕在线高清| 欧美日韩久久不卡| 久久久一区二区三区| 91精品国产一区二区三区| 国产精品视频久久久| 妞干网在线观看视频| 超碰caoporn久久| 四虎永久在线| 日本大片免费看| 2021av在线| 欧美视频一区| 日韩欧美在线观看视频|