国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

未來將出現(xiàn)一個完全可解釋的GPT-3!OpenAI 華人一作重磅突破:首次揭秘AI內(nèi)部的“微觀機制”,電路越小,模型越可解釋

原創(chuàng)
人工智能
大家都知道,如今GPT、Claude等LLM越來越強大,寫文章、生成代碼、做推理,樣樣不在話下。但是,模型內(nèi)部是如何“思考”的?這一直是一個黑箱問題。

編輯 | 聽雨

出品 | 51CTO技術(shù)棧(微信號:blog51cto)

就在幾個小時前,OpenAI發(fā)布了一篇重磅的最新研究,構(gòu)建了一個實驗性的大語言模型,并且提出稀疏訓(xùn)練+剪枝+橋接的新方法,讓原本黑箱的LLM內(nèi)部機制可視化了。

大家都知道,如今GPT、Claude等LLM越來越強大,寫文章、生成代碼、做推理,樣樣不在話下。但是,模型內(nèi)部是如何“思考”的?這一直是一個黑箱問題。

打個比方,傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的工作方式就像一堆糾纏在一起的電線:每個神經(jīng)元與成千上萬個神經(jīng)元相連,信號在其中不斷流動、疊加。這些連接雖然能讓模型學(xué)習(xí)復(fù)雜模式,但也形成了人類難以解讀的、高度密集的連接網(wǎng)絡(luò)。

圖片圖片

解釋 Transformer 的一個主要難點在于:其激活與權(quán)重并不直接可理解。例如,神經(jīng)元會以難以預(yù)測的方式激活,這些激活模式往往并不對應(yīng)于人類可理解的概念。

而OpenAI的最新研究,通過對語言模型進行極度稀疏權(quán)重訓(xùn)練,“解開”了模型內(nèi)部的機制。他們構(gòu)建了一個權(quán)重稀疏的 Transformer模型,比 GPT-5、Claude 或 Gemini等主流模型要小得多。論文第一作者Leo Gao表示,它的性能大致相當(dāng)于2018年的GPT-1。

相對于常規(guī)模型來說,更透明的模型有助于揭示語言模型為何會出現(xiàn)幻覺、行為不可預(yù)測,或在關(guān)鍵情況下做出不可靠的判斷。

圖片圖片

論文相關(guān)代碼已公開:https://github.com/openai/circuit_sparsity/

一、稀疏訓(xùn)練:從“電線堆”到清晰電路

OpenAI提出對Transformer模型進行“稀疏訓(xùn)練”方法,其核心思路在于:絕大多數(shù)權(quán)重設(shè)為零,讓每個神經(jīng)元只連接少數(shù)節(jié)點,這樣網(wǎng)絡(luò)內(nèi)部的信號不再在成千上萬個節(jié)點之間糾纏,而是沿著少量路徑傳遞。

他們首先在標(biāo)準(zhǔn) Transformer 架構(gòu)( GPT?2 風(fēng)格)上訓(xùn)練模型,并強制絕大多數(shù)權(quán)重為 0(L0 范數(shù)很?。屆總€神經(jīng)元只連接少數(shù)其他神經(jīng)元。

圖片圖片

二、電路可解釋性:AI任務(wù)的“微觀機制”

為了驗證稀疏訓(xùn)練的效果,研究者設(shè)計了一些簡單任務(wù),讓模型完成特定操作,例如:

  1. Python引號閉合任務(wù):輸入 "hello,模型要輸出匹配的引號 "hello";

圖片圖片

  1. 列表嵌套深度計數(shù):輸入 [ [ ] ],模型需要正確預(yù)測列表結(jié)束的符號;

圖片圖片

  1. 變量類型追蹤:跟蹤變量 current 是字符串還是集合類型。

圖片圖片

為了評估模型的可解釋性,研究者使用一種新型剪枝(Pruning)方法,以隔離關(guān)鍵電路:對每個任務(wù),刪除模型中非必要的神經(jīng)元/通道/權(quán)重,只保留完成任務(wù)所必需的最小子網(wǎng)絡(luò)。剪枝方法會通過“均值屏蔽”(mean-ablating)凍結(jié)被刪除節(jié)點的激活,保證任務(wù)行為仍然由剩下的電路完成。

圖片圖片

結(jié)果發(fā)現(xiàn),每個任務(wù)對應(yīng)一個最小電路(Minimal Circuit),只包含少量神經(jīng)元和注意力通道,足以完成任務(wù):

  • 剪掉電路之外的神經(jīng)元,模型就會失敗;
  • 只保留這些神經(jīng)元,模型就能正常完成任務(wù)。

這意味著,這些電路不僅可用,而且必要且充分——正是模型執(zhí)行任務(wù)的核心“機制”。

舉個例子,閉合引號任務(wù)的電路只用到兩個MLP神經(jīng)元和一個注意力頭,就能判斷字符串是單引號還是雙引號,然后正確閉合。

此外,研究者還發(fā)現(xiàn)電路越小、越獨立,模型行為就越可解釋。

他們比較了一個稀疏模型和一個在預(yù)訓(xùn)練損失相同的稠密模型。通過調(diào)節(jié)目標(biāo)損失,測量每個模型在完成該損失時所需的最小電路規(guī)模,并對任務(wù)進行平均。結(jié)果顯示,在任意給定損失下,稀疏模型的電路大約比稠密模型小16倍。

圖片圖片

三、能力與可解釋性的權(quán)衡

稀疏訓(xùn)練還有一個亮點:可調(diào)控性。

  • 增加稀疏度:權(quán)重越少,電路越小,模型越可解釋,但能力略有下降。
  • 擴大模型規(guī)模:在保持稀疏度的情況下,增加神經(jīng)元數(shù)量,可以同時提升能力和可解釋性。

研究者將這個關(guān)系繪制成“帕累托前沿”,顯示能力與可解釋性的權(quán)衡。在總參數(shù)量固定的情況下,提高模型稀疏度(即減小權(quán)重的L0 范數(shù))會在能力和可解釋性之間產(chǎn)生權(quán)衡:能力下降,但可解釋性提升。

圖片圖片

四、橋接方法:擴展到已有大模型

稀疏模型雖然易解釋,但訓(xùn)練成本高,難以直接替代像GPT-3這樣的前沿大模型。為了解決這個問題,研究者又提出了橋接方法(Bridges)。通過橋接,把稀疏模型與已有密集模型關(guān)聯(lián),實現(xiàn)對已有模型行為的可解釋性分析。

圖片圖片

“橋接”就是一系列線性映射,用于在稀疏模型和稠密模型的表示之間轉(zhuǎn)換——從而確保通過稀疏層與稠密層混合的所有路徑在預(yù)訓(xùn)練任務(wù)上仍能保持良好性能。

五、未來將訓(xùn)練出一個完全可解釋的 GPT-3

在論文最后,研究者提到,稀疏訓(xùn)練非常有前景,但仍有不少挑戰(zhàn):

  1. 效率低:稀疏模型訓(xùn)練和推理開銷是同等能力稠密模型的100–1000倍;
  2. 多語義特征:一些神經(jīng)元仍同時參與多個任務(wù),完全單語義化還需要改進;
  3. 規(guī)模挑戰(zhàn):解釋復(fù)雜任務(wù)或更大模型時,電路會非常龐大,需要自動化可解釋性方法輔助。

論文第一作者Leo Gao也表示:

“我們還沒有完全解決可解釋性問題,仍有很大的改進空間,許多電路仍然比較復(fù)雜。但我們?nèi)匀荒軐W(xué)到很多——例如,在檢查閉合嵌套列表的電路時,我們發(fā)現(xiàn)了一種對模型的對抗攻擊,這是我們原本不會想到的?!?/p>

ImageImage

對于未來的研究方向,研究團隊表示,他們對擴展這一技術(shù)感到非常興奮。

“雖然不太可能將其擴展到最前沿的規(guī)模,但一個令人激動的目標(biāo)是訓(xùn)練出一個完全可解釋的 GPT-3。這樣的‘模型生物體’將教會我們關(guān)于 AI 工作原理的重要經(jīng)驗,這些經(jīng)驗可能會遷移到最前沿的模型上?!?/p>

可以預(yù)見,可解釋性將是未來大模型發(fā)展的關(guān)鍵方向。在不遠(yuǎn)的將來,我們有望真正理解“AI是怎么思考的”,而不是僅僅看它的輸出。

參考鏈接:

https://openai.com/index/understanding-neural-networks-through-sparse-circuits/

https://cdn.openai.com/pdf/41df8f28-d4ef-43e9-aed2-823f9393e470/circuit-sparsity-paper.pdf

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2022-06-06 07:52:41

反欺詐技術(shù)AI

2024-05-28 08:00:00

人工智能機器學(xué)習(xí)

2023-02-14 08:10:14

Python人工智能XAI

2023-08-11 13:54:31

AI因果

2019-03-28 09:26:26

數(shù)據(jù)科學(xué)模型機器學(xué)習(xí)

2019-08-29 18:07:51

機器學(xué)習(xí)人工智能

2023-09-20 11:42:44

人工智能AI

2024-11-04 14:33:04

機器學(xué)習(xí)SHAP黑盒模型

2022-07-29 15:28:45

人工智能Python框架

2025-01-23 08:23:12

2025-07-15 10:29:17

2022-01-06 10:21:56

自動駕駛數(shù)據(jù)人工智能

2022-10-20 15:58:51

人工智能研究

2020-08-19 09:20:00

機器學(xué)習(xí)人工智能Python

2024-11-05 14:10:00

神經(jīng)網(wǎng)絡(luò)AI

2020-08-25 10:30:59

TensorFlow數(shù)據(jù)機器學(xué)習(xí)

2025-01-13 08:13:18

2021-01-08 10:47:07

機器學(xué)習(xí)模型算法

2024-09-18 05:25:00

可解釋性人工智能AI

2022-04-13 15:10:22

AI決策
點贊
收藏

51CTO技術(shù)棧公眾號

成人在线免费观看视频| 亚洲美女啪啪| 美女写真久久影院| 激情内射人妻1区2区3区| 日韩电影一区| 456亚洲影院| 天然素人一区二区视频| 欧美精品一卡二卡| 欧美美女搞黄| 天天综合色天天综合色h| 国产美女玉足交| 国产婷婷一区二区| a√天堂在线观看| 成人91在线观看| 精品人妻大屁股白浆无码| 奇米888四色在线精品| 久久99国产精品| 午夜一区二区三区不卡视频| 国产伦精品一区二区三区高清版| 99精品在线观看| 91色精品视频在线| 激情视频一区二区三区| 国内精品国语自产拍在线观看| 欧美日韩专区| 四虎影视精品永久在线观看| 欧美三区在线| 亚洲一区二区三区在线视频| 国产成人三级| 国产色婷婷国产综合在线理论片a| 亚洲精品进入| 国产精品激情av电影在线观看| 精品国产一区二区三区久久久蜜臀| 日韩av电影手机在线观看| 日本妇女一区| 成人欧美一区二区三区在线湿哒哒| 综合久久一区| 欧美成人免费在线| 国内精品写真在线观看| 黄色一级视频在线播放| 国产拍揄自揄精品视频麻豆| 最新黄色片网站| 7878成人国产在线观看| 345成人影院| 日韩有码在线电影| 亚洲成人教育av| 91亚洲精品国产| 久久先锋影音av| 中出福利视频| 欧美一激情一区二区三区| 婷婷六月国产精品久久不卡| 久久久成人的性感天堂| 欧美91在线| www.久久久| 黄色小说综合网站| 成人在线观看a| 精品国产91久久久| 丁香影院在线| 欧美激情综合色综合啪啪五月| 日韩欧美视频在线播放| 蜜桃av色综合| 91蜜桃在线免费视频| 亚洲欧洲闷骚av少妇影院| 亚洲а∨天堂久久精品喷水 | 欧美成人免费视频| 自拍偷拍一区| 欧美美乳视频网站在线观看| 97视频国产在线| 中文字幕有码在线观看| 在线精品高清中文字幕| 日韩av网址大全| 精品欧美一区二区精品久久| 国产91丝袜在线播放0| 日日噜噜夜夜狠狠视频| 亚洲成人a**站| 精品亚洲成人| 蜜桃视频成人在线观看| 亚洲色欲色欲www在线观看| 国产视频在线播放| 久久久久久九九九| 奇米影视一区二区三区小说| 免费h片在线观看| 日韩电影免费观看中文字幕 | 九一国产精品视频| 欧美日韩在线一区| 日日夜夜天天综合| 欧美专区福利免费| 亚洲午夜免费视频| 第四色男人最爱上成人网| 91网站在线看| 国产性天天综合网| 亚洲七七久久综合桃花剧情介绍| 97在线观看视频| 精品一区二区三区影院在线午夜| 影音先锋电影在线观看| 欧美成人激情在线| 久久国产精品无码网站| 能在线看的av| 91高潮精品免费porn| 国产精品一区一区| 国产一二区在线| 91精品国产综合久久香蕉最新版| 97久久精品人人做人人爽50路 | 国产伦精品一区二区三| 中文字幕一区二区三区在线播放| 夜鲁夜鲁夜鲁视频在线播放| 波多野结衣精品久久| 亚洲欧美一区二区三区孕妇| 欧美电影网站| 日韩偷拍一区二区| 毛片av在线播放| 蜜臀久久久久久久| 视频一区二区在线播放| 色综合老司机第九色激情| 精品在线观看视频| 麻豆网站视频在线观看| 91久久精品一区二区别| 国产精品全国免费观看高清| 成人国产精品入口免费视频| 一区二区三区在线视频看| 欧美视频中文一区二区三区在线观看| 高清日韩中文字幕| 欧美在线观看www| 亚洲日本成人女熟在线观看| 免费一级欧美片在线观看| 在线免费观看黄色网址| 91在线短视频| 在线视频你懂得一区二区三区| 欧美日韩精品在线一区| 日本一二区视频| 青草在线视频| 国内久久久精品| 99综合电影在线视频| 深夜视频一区二区| 亚洲精品蜜桃久久久久久| 亚洲女成人图区| 国产毛片精品国产一区二区三区| 蜜桃麻豆影像在线观看| 亚洲午夜精品福利| 国产视频精品xxxx| 国产盗摄女厕一区二区三区 | 亚洲电影一二三区| 欧美mv日韩mv| 奇米四色…亚洲| 国产伦子伦对白在线播放观看| 亚洲欧洲国产日韩精品| 亚洲免费一级电影| eeuss鲁片一区二区三区在线观看| a屁视频一区二区三区四区| 欧美污视频网站| 欧美综合在线第二页| 午夜精品免费在线| 欧美影视一区| 成人在线高清视频| 欧美在线激情| 亚洲午夜激情免费视频| 78精品国产综合久久香蕉| 成人免费网站视频| 日本男女交配视频| 精品国产一区二区三区久久狼5月| 99久久99久久免费精品蜜臀| 成人自拍视频| 国产精品久久久毛片| 国产精品视频区| 日韩一区二区免费在线电影| 精品一区二区三区影院在线午夜| yw.尤物在线精品视频| 日本黄大片一区二区三区| 国产欧美精品在线播放| 欧美日本在线看| 国产成人av自拍| 蜜桃视频欧美| 九色porny丨首页在线| 福利在线一区二区| 日本国产精品视频| 69久久夜色精品国产69蝌蚪网| 韩国欧美国产一区| 五月天亚洲一区| 免费av网站在线观看| 精品人妻一区二区三区四区在线| 国产精品久久视频| 黄色www网站| 欧美日韩国产系列| 国产91富婆露脸刺激对白| 亚欧洲精品视频在线观看| 黄页在线免费看| 欧美不卡福利| 欧美激情一区二区三区在线视频观看| 亚洲成av人片一区二区| 精品在线免费观看| 欧美系列电影免费观看| wwwwxxxx在线观看| 久草.com| 好吊色视频988gao在线观看| 69av在线播放| 亚洲电影在线观看| 亚洲午夜一区二区| 成人av动漫在线| 欧美在线免费| 色妞ww精品视频7777| 黄色网在线播放|