国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

架構瓶頸原則:用注意力probe估計神經網絡組件提供多少句法信息

開發 新聞
本文中,劍橋和 ETH Zurich 的研究者從一個新的角度探討了 probing,不關心模型編碼了多少信息,而是關心它的組件可以提取多少信息。

預訓練語言模型在各種自然語言處理任務上的驚人表現,引起了人們對其分析的興趣。Probing 是進行此類分析所采用的最普遍的方法之一。在典型的 probing 研究中,probing 是一個插在中間層的淺層神經網絡,通常是一個分類器層。其有助于探查不同層捕獲的信息。使用輔助任務對 probing 進行訓練和驗證,以發現是否捕獲了此類輔助信息。

一般來講,研究者首先凍結模型的權重,然后在模型的上下文表示的基礎上訓練probe,從而預測輸入句子的屬性,例如句法解析(其對句子結構進行分析,理清句子中詞匯之間的連接規則)。不幸的是,關于如何設計此類 probe 的最佳實踐仍然存在爭議。

一方面,有研究者傾向于使用簡單的 probe,這樣就可以將 probe 與 NLP 任務區分開來;另一方面,一些人認為需要復雜的 probe 才能從表示中提取相關信息。此外,還有一些人考慮折中的方法,主張將復雜性 - 準確性帕累托曲線上的 probe 考慮在內。

本文中,來自劍橋大學、蘇黎世聯邦理工學院的研究者提出架構瓶頸原則 (ABP,architectural bottleneck principle) 作為構建有用 probe 的指南,并試圖測量神經網絡中的一個組件可以從饋送到它的表示中提取多少信息。為了估計給定組件可以提取多少信息,該研究發現 probe 應該與組件完全相同。根據這一原理,該研究通過注意力 probe 來估計有多少句法信息可用于 transformer。

圖片

論文地址:https://arxiv.org/pdf/2211.06420.pdf

舉例來說,該研究假設 transformer 的注意力頭是其使用句法信息的瓶頸,因為這是 transformer 中唯一可以同時訪問多個 token 的組件。根據 ABP,該研究提出注意力 probe,就像注意力頭一樣。該 probe 回答了這樣一個問題:transformer 在計算其注意力權重時可以使用多少句法信息?

結果表明,大多數(盡管不是全部)句法信息都可以通過這種簡單的注意力頭架構提取:英語句子平均包含 31.2 bit 的句法樹結構信息,而注意力 probe 可以提取 28.0 bits 信息。更進一步,在 BERT、ALBERT 和 RoBERTa 語言模型上,一個句子的語法樹大部分是可以被 probe 提取的,這表明這些模型在組成上下文表示時可以訪問句法信息。然而,這些模型是否真的使用了這些信息,仍然是一個懸而未決的問題。

注意力 Probe 

目前,有許多方法用來設計有效的 probe,分類原則大致包括:線性原則、最大信息原則、易提取原則,此外還包括本文提出的 ABP 原則。

可以說 ABP 將前三個原則聯系起來。最重要的是,ABP 泛化了線性原則、最大信息原則,此外,ABP 還通過限制 probe 的容量來隱式控信息制提取的難易程度。

該研究重點關注 transformer 注意力機制。此前研究人員曾斷言,在計算注意力權重時,transformer 會使用句法信息。此外,注意力頭是 transformer 中唯一可以同時訪問多個單詞的組件。因此,在注意力頭的背景下探索 ABP 是一個自然的起點。具體而言,根據 ABP,我們可以研究 transformer 的注意力頭可以從輸入表示中提取多少信息。

實驗結果

對于數據,研究者使用了通用依賴(UD)樹庫。他們分析了四種不同類型的語言,包括巴斯克語、英語、泰米爾語和土耳其語。此外,研究者將分析重點放在未標記的依賴樹上,并注意到 UD 使用特定的句法形式,這可能會對結果造成影響。

對于模型,研究者探討了以上四種語言的多語言 BERT 以及僅支持英語的 RoBERTa 和 ALBERT。根據 ABP,他們保持 probe 的隱藏層大小與 probed 架構中的相同。最后,他們還將一個具有與 BERT 相同架構的未訓練 transformer 模型作為基線。

下圖 1 展示了主要結果。首先,研究者的 probe 估計大多數句法信息可以在中間層提取。其次,大量句法信息在饋入注意力頭的表示中進行編碼。雖然他們估計使用英語、泰米爾語和巴斯克語句子編碼的信息接近 31 bits,但使用土耳其句子編碼的信息約為 15 bits。研究者懷疑這是因為土耳其語在語料庫中的句子最短。

圖片

研究者還發現,句子中的幾乎所有句法信息都可用于考慮中的基于 transformer 的模型。例如在英語中,他們發現信息量最大的層在 BERT、RoBERTa 和 ALBERT 中的 V 系數分別為 90%、82% 和 89%,具體如下表 1 所示。這意味著這些模型可以訪問一個句子中約 85% 的句法信息。不過未訓練的 BERT 表示并不適合這種情況。

圖片

最后,研究者將 BERT 的注意力權重(通過其預訓練的注意力頭計算)直接插入到原文公式 (8) 并分析產生的未標記附件分數。英語相關的 BERT 結果如下圖 2 所示。簡言之,雖然注意力頭可以使用大量的句法信息,但沒有一個實際的頭可以計算與句法樹非常相似的權重。

但是,由于 BERT 有 8 個注意力頭,因此可能以分布式方式使用句法信息,其中每個頭依賴該信息的子集。

圖片

責任編輯:張燕妮
相關推薦

2020-09-17 12:40:54

神經網絡CNN機器學習

2017-07-07 15:46:38

循環神經網絡視覺注意力模擬

2024-07-16 14:15:09

2025-02-25 09:40:00

模型數據AI

2011-07-07 13:12:58

移動設備端設計注意力

2023-07-30 15:42:45

圖神經網絡PyTorch

2024-09-19 10:07:41

2018-02-25 11:31:06

句法敏感神經網絡關系抽取

2018-08-26 22:25:36

自注意力機制神經網絡算法

2023-10-07 07:21:42

注意力模型算法

2025-10-31 16:00:45

AI模型架構

2025-04-15 06:13:46

2017-01-10 17:25:59

深度學習框架神經網絡

2018-07-03 16:10:04

神經網絡生物神經網絡人工神經網絡

2021-02-02 14:47:58

微軟PyTorch可視化

2017-10-15 21:43:36

2025-10-22 08:52:23

2017-06-20 14:41:12

google神經網絡

2025-06-09 09:05:00

AI模型數據

2025-02-25 10:50:11

點贊
收藏

51CTO技術棧公眾號

91天堂在线视频| 99久久99久久精品国产片果冻 | 成人福利在线视频| 亚洲精品视频网上网址在线观看 | 秋霞电影一区二区| 国产va免费精品观看精品视频| 欧美激情成人动漫| 99热在线免费播放| 亚洲欧美日产图| 国产精品99久久久久久久久久久久 | 黄网址在线播放免费| 中日韩在线视频| 91精品美女在线| 久久久久999| 56国语精品自产拍在线观看| 欧美激情一区二区三区全黄| 久久一区中文字幕| 日本一本不卡| 亚洲午夜免费| 蜜桃视频www网站在线观看| 污网站免费在线观看| 岳毛多又紧做起爽| 日韩hmxxxx| 91精品久久久久久久久青青| 色在人av网站天堂精品| 日韩欧美亚洲国产另类| 亚洲一二三四区| 91丨porny丨蝌蚪视频| 亚洲男女自偷自拍| 日韩大片在线| 红杏aⅴ成人免费视频| 免费成人动漫| 亚洲小说区图片| 免费黄色片在线观看| 国外亚洲成av人片在线观看| 凹凸国产熟女精品视频| 宅男一区二区三区| 美女被啪啪一区二区| 国产裸体写真av一区二区 | 亚洲欧美日韩网| 欧美一区二区在线观看| 婷婷夜色潮精品综合在线| 欧美国产日韩一二三区| 国产精品一二三四区| 久久精品动漫| 欧美三级第一页| 国产精品99久久| 精品国产aⅴ| 欧美日韩麻豆| 国产日韩中文在线中文字幕| 欧美成人app| 高清不卡av| 日本黄色免费在线| 午夜小视频在线观看| 五月天婷婷在线视频| 精品av中文字幕在线毛片 | 91午夜国产| 日本免费观看网站| 中国丰满人妻videoshd| www.18av.com| 一区不卡字幕| 亚洲午夜精品一区二区| 日韩一区国产在线观看| 日韩精彩视频| 性欧美大战久久久久久久免费观看| 国产伦精品一区二区三区视频黑人 | 国产精品调教视频| 91成人小视频| 欧美成人高清视频在线观看| 日韩三区免费| 三级成人在线| 欧美日韩在线精品一区二区三区激情综合 | 欧美精品tushy高清| 欧美日韩免费一区二区三区视频| 欧美日韩亚洲激情| 色综合天天综合给合国产| 日韩欧美精品网站| 欧美在线综合视频| 欧美另类久久久品| 日韩欧美中文字幕制服| 精品国产精品一区二区夜夜嗨| 日韩欧美色电影| 精品亚洲一区二区三区在线播放 | 国模吧一区二区| 91a在线视频| 国产精品久久激情| 91久久久在线| 国产伦精品一区二区三区四区免费| 国产日韩在线一区二区三区| 麻豆久久久av免费| 亚洲午夜精品久久久中文影院av| 潘金莲一级淫片aaaaa免费看| www.一区二区.com| 欧美精品无码一区二区三区| 亚洲另类第一页| 亚洲美女主播视频免费观看| 你懂的在线观看| 制服丝袜中文字幕在线| 欧美少妇精品| 麻豆一区在线| 欧洲视频一区| 亚洲少妇在线| 国产毛片精品国产一区二区三区| 99久久婷婷国产综合精品电影| 国产精品欧美一区二区三区| 精品久久香蕉国产线看观看gif| 欧美精品久久99久久在免费线| 日韩av在线免费播放| 久久国产精品偷| 国产精品电影在线观看| 国外成人在线视频网站| 亚洲综合五月天| 超碰影院在线观看| 美女网站在线观看| 成人黄视频在线观看| а√天堂资源国产精品| 日韩中出av| 亚洲精品美女91| 成人午夜碰碰视频| 亚洲色图欧洲色图婷婷| 欧美影片第一页| 亚洲欧美日韩一区二区三区在线| 欧美交受高潮1| 亚洲一区二区三区成人在线视频精品 | 国产精品国产精品国产专区不卡| 日本高清不卡一区二区三| 成人一级生活片| 女生裸体视频网站免费观看| 女女色综合影院| 色综合久久久| 99精品美女| 狠狠色狠狠色综合系列| 国产精品乱码一区二区三区软件| 色噜噜夜夜夜综合网| 亚洲国产日韩欧美在线图片| 美女黄色丝袜一区| 亚洲精品日韩激情在线电影| 亚洲综合激情五月| 在线视频xx| 午夜av在线免费观看| 成人台湾亚洲精品一区二区| 亚洲青色在线| 久久理论电影网| 欧美综合在线视频| 日韩在线视频播放| 亚洲一区中文字幕| 黄色大片在线免费看| 久久久久久女乱国产| 91p九色成人| 综合一区在线| 99久久婷婷国产综合精品| 色婷婷亚洲一区二区三区| 中文字幕欧美精品日韩中文字幕| 国产精品欧美在线| 懂色av一区二区三区四区五区| 国产字幕中文| 特黄毛片在线观看| 色综合久久网| 粉嫩一区二区三区在线看| 色一区在线观看| 久久中文精品视频| 免费av一区二区三区| gogo人体高清视频| 涩涩在线视频| 欧美69视频| 国产婷婷色一区二区三区在线| 欧美日韩高清一区二区不卡 | 视频在线观看入口黄最新永久免费国产| 福利电影一区| 免费观看日韩电影| 偷窥少妇高潮呻吟av久久免费| 中文字幕日韩精品有码视频| 亚洲伊人久久大香线蕉av| 黄色片在线免费| 91超碰在线免费| 午夜免费一区| 久久久久久久综合日本| 亚洲第一区在线观看| 国产精品一二三视频| www黄色日本| 尤物网在线观看| 羞羞答答一区二区| 成人中文字幕电影| 欧美一区二区在线看| 国产色视频一区| 国产成人黄色片| 成入视频在线观看| 伊人久久婷婷| 亚洲人成网站影音先锋播放| 在线观看国产精品91| 麻豆一区区三区四区产品精品蜜桃| 日本福利视频| 秋霞午夜一区二区三区视频| 久久精品av麻豆的观看方式| 欧美性色黄大片手机版| 国产91精品最新在线播放| 欧美成人免费高清视频| 高潮一区二区| 奇米一区二区三区| 91超碰这里只有精品国产|