国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

在預訓練NLP模型上測量性別相關性

人工智能
在過去的幾年中,自然語言處理(NLP)取得了長足的進步,諸如BERT,ALBERT,ELECTRA和XLNet等預訓練語言模型在各種任務中均取得較高的準確性。預訓練語言模型以Wikipedia這樣的大型文本語料庫為訓練集,通過遮掩一些單詞并對它們進行預測來學習嵌入表示,即遮掩語言建模。

在過去的幾年中,自然語言處理(NLP)取得了長足的進步,諸如BERT,ALBERT,ELECTRA和XLNet等預訓練語言模型在各種任務中均取得較高的準確性。預訓練語言模型以Wikipedia這樣的大型文本語料庫為訓練集,通過遮掩一些單詞并對它們進行預測來學習嵌入表示,即遮掩語言建模。實驗結果表明,通過這樣的方式,可以對不同概念(如外科醫生和手術刀)間的豐富語義信息進行編碼。訓練完成后,經過微調就可使模型適用特定任務的訓練數據,通過預訓練嵌入實現分類等特定任務。鑒于這樣的預訓練表示在不同NLP任務中得到廣泛采用,作為從業者,我們需要了解預訓練模型如何對信息編碼以及學習到怎樣的相關性,這些又會怎樣影響下游應用性能,這樣才不至于偏離我們的AI原則。

在“Measuring and Reducing Gendered Correlations in Pre-trained Models”,我們對BERT及精簡版的ALBERT進行實例研究,討論了性別相關性,并為預訓練語言模型的實踐應用提供參考。我們在學術任務數據集進行實驗,并將結果與一些常用模型做了對比,以驗證模型實用性,并為進一步的研究提供參考。我們后續會發布一系列checkpoints,從而可以在保持NLP任務準確性的情況下減少性別相關性。

相關性衡量

為了解預訓練表征中的相關性如何影響下游任務,可以使用多種評估指標來研究性別表征。在這里,我們采用共指消解討論測試結果,該方法旨在使模型能夠理解句子中給定代詞的正確先行詞, 例圖示句子中,模型要識別出他指護士而不是患者。

OntoNotes(Hovy等,2006)是最常用得標準驗證數據集,同時F1分數用來衡量模型在共指消解中的準確性(Tenney等。2019)。由于OntoNotes僅表示一種數據分布,因此我們還使用WinoGender基準測試,該基準提供了一些其他數據,通過該基準可以判別性別和職業何時會產生錯誤的共指消解。WinoGender的得分較高(接近1),表明模型基于性別與職業間的關聯(如將護士與女性而不是男性關聯)進行決策;當性別和職業之間沒有一致的關聯時(得分為零),此時模型決策基于句子結構或語義等其他信息。

 

BERT和ALBERT在OntoNotes(準確性)和WinoGender(性別關聯)上的表現。WinoGender的值越低,表示模型在推理中較少關注性別信息。

 

研究發現,BERT或ALBERT在WinoGender上都沒有零得分,而在OntoNotes上獲得了極高的準確性(接近100%)。實驗表明,在一些情況下,模型在推理決策中會考慮性別相關性。這符合我們的預期,模型可以使用多種線索來理解文本,可以只采用其中的一種或是選擇全部線索。當然,在實際應用中我們還是要謹慎,不能寄希望于模型根據先驗的性別相關性進行預測,其他可用信息對于預測也非常重要。

實踐指南

鑒于預訓練模型嵌入中的隱式關聯有可能影響下游任務,因此在開發新的NLP模型時,我們要考慮可以采取哪些措施來減輕這種風險?

  • 隱式相關性的衡量非常重要:雖然可以使用準確性度量來評估模型質量,但是這樣度量方式僅從單一角度評估模型,在測試數據與訓練數據分布相同時其不足尤為顯著。例如,BERT和ALBERT檢查點的準確度相差1%以內,但使用性別相關性進行共指解析的相對偏差為26%。這意味著,對于某些任務,這樣的差異尤為重要。在處理一些反固定思維的文本時(如男護士),選擇WinoGender分數較低的模型更加合理。
  • 更改任何模型配置時都要謹慎,哪怕看似影響不大:神經網絡模型訓練由許多超參數控制,一般通過選擇合理的超參數以最大化訓練目標。盡管某些參數選擇看似不會對模型產生什么影響,但我們卻發現,它們可能會導致性別相關性發生重大變化。例如,Dropout正則化用于避免模型的過度擬合,當我們在BERT和ALBERT訓練過程中增大Dropout參數,即使進行微調,性別相關性還是會顯著降低。這意味著微小的配置更改就可以影響訓練模型,從而降低相關性風險,但同時也表明,在對模型配置進行任何更改時,我們應該謹慎行事、仔細評估。

 

在BERT和ALBERT訓練過程中增大Dropout參數的影響

 

相關性的緩解:前文以介紹了Dropout對性別相關性的影響,據此,我們進一步推論得到通過這樣的方式可能減少額外的相關性:通過增加dropout參數,我們可以改進模型對WinoGender的推理方式,而無需手動指定任何內容,甚至不需要更改微調階段。然而,隨著dropout的增加,OneNotes的準確性也會開始下降(見BERT的結果),但我們認為可以在預訓練階段避免這種情況,通過更改dropout改進模型,而無需針對特定任務進行更新。在論文中,我們基于反事實數據增強,提出了另一種具有差異化權重的緩解策略。

展望

我們認為,以上這些實踐指南為開發強大的NLP系統提供了參考,從而使其適用于更廣泛的語言和應用范圍。當然,由于技術本身的不足,難以捕獲和消除所有潛在的問題。因此,在現實環境中部署的任何模型都應經過嚴格測試,即嘗試不同方法,并通過一些保護措施以確保符合道德規范,如Google的AI原則。我們期待評估框架與數據取得更進一步的發展,使語言模型適用于各種任務,為更多人提供優質服務。

致謝

本文的合作者包括Xuezhi Wang,Ian Tenney,Ellie Pavlick,Alex Beutel,Jilin Chen,Emily Pitler和Slav Petrov。同時感謝Fernando Pereira,Ed Chi,Dipanjan Das,Vera Axelrod,Jacob Eisenstein,Tulsee Doshi和James Wexler等人。

責任編輯:未麗燕 來源: 雷鋒網
相關推薦

2020-03-17 09:42:00

谷歌開源機器學習

2025-02-11 08:11:56

大型語言模型神經網絡機器學習

2019-04-01 14:55:58

NLP模型自然語言處理

2017-08-09 10:02:12

NMT神經網絡自然語言處理

2020-08-10 15:25:00

人工智能機器學習技術

2013-05-22 14:02:34

2024-08-19 11:52:24

機器學習模型h-stat

2021-08-10 15:51:55

谷歌模型技術

2021-09-09 09:29:03

AI 數據模型

2022-07-07 11:27:14

技術搜索模型

2022-07-07 14:06:39

LiBai模型庫

2025-06-13 09:29:51

2025-11-04 01:22:00

2024-05-27 07:21:43

2017-11-21 08:42:23

災難恢復計劃

2020-07-08 15:10:11

Python數據分析代碼

2021-11-26 10:18:37

AI 數據機器學習

2009-07-17 16:21:26

社交相關性排序算法

2021-07-16 14:24:08

網絡犯罪加密貨幣網絡攻擊

2014-05-29 17:11:59

優化鏈接
點贊
收藏

51CTO技術棧公眾號

亚洲成av人乱码色午夜| 国产一区二区三区四区五区加勒比 | 国产日韩欧美亚洲一区| 人人九九精品视频| 欧美成人vr18sexvr| 日本视频三区| 99久久精品99国产精品| 欧美少妇一区| 伊人青青综合网| 久久免费国产视频| 不卡视频在线看| 欧美一区二区三区四区在线观看地址 | 国产精品乱战久久久| 国产精品17p| 99精品国产一区二区三区不卡| 国产精品三级视频| 欧美精品一区二区三区在线播放| 婷婷无套内射影院| 亚洲欧美一区二区三区孕妇| 黄色国产一级视频| 91大神在线观看线路一区| 亚洲丝袜av一区| 国产欧美精品久久| 日韩精品专区| 91精品视频在线播放| 国产欧美一区二区精品性色| 中文字幕不卡| 一区二区高清视频在线观看| 日本一卡二卡四卡精品| 欧美日韩国产片| 视频二区欧美| 色多多国产成人永久免费网站 | av在线天堂| 日韩一区二区三区电影在线观看| 在线中文资源天堂| 欧美成人激情在线| 黄色网页在线播放| 日本在线精品视频| 91最新地址在线播放| 国产视频三级在线观看播放| 婷婷精品国产一区二区三区日韩| 韩国国内大量揄拍精品视频| 久久亚洲捆绑美女| 欧美激情成人动漫| 久久91精品国产| 野花国产精品入口| 一本色道久久亚洲综合精品蜜桃| 欧美人xxxx| 91精品一久久香蕉国产线看观看| 欧美大片在线看| 国产黄大片在线观看| 亚洲精品xxxx| 日韩精品三级| 熟女视频一区二区三区| 精品久久中文字幕| 国产三级精品三级在线观看国产| 国产亚洲精品久久久久久久| 日韩av在线看| 人人超碰91尤物精品国产| 清纯唯美一区二区三区| 精品免费在线观看| 欧美成人午夜77777| wwwwww99| 国产日韩欧美成人| 欧美日韩一区二区在线观看| 色88888久久久久久影院| 女人天堂av手机在线| 久久精彩免费视频| 欧美少妇bbb| 久久精品99国产精品| 免费网站成人| 欧美亚洲一级片| 精品亚洲免费视频| 色在线中文字幕| 最近中文字幕免费mv| xxxxx91麻豆| 韩国成人福利片在线播放| 久久久久久人妻一区二区三区| 国产亚洲精品精华液| 欧美视频一区二区在线观看| 精品成人久久| 污污的网站在线看| 伊人情人网综合| 欧美激情18p| 日韩美一区二区三区| 老牛精品亚洲成av人片| 久久久久久久久久久久久久国产| 国内精品400部情侣激情| 成人免费一区二区三区视频| 性感少妇一区| 国产精品一在线观看| 青青视频在线观| 欧美亚州一区二区三区| 亚洲激情自拍视频| 清纯唯美日韩| 手机在线观看av| 国产美女精品在线观看| 亚洲va欧美va天堂v国产综合| 久久99久久久久| 北条麻妃一区二区三区在线观看| 超碰一区二区| 羞羞视频在线免费看| 正在播放国产精品| 91精品国产91久久久久久吃药| 日韩女优av电影| 一本一道久久综合狠狠老 | 色久视频在线播放| 不卡的av电影| 国产系列在线观看| 久久久久亚洲精品| 免费成人在线影院| 日日噜噜噜夜夜爽爽狠狠| 亚洲成人动漫在线播放| 精品国精品国产自在久国产应用| 国产激情片在线观看| 一本久久精品一区二区| 成人台湾亚洲精品一区二区 | 在线观看亚洲| juliaann成人作品在线看| 精品久久久久久久久久久久久久久久久| 老司机凹凸av亚洲导航| 福利在线小视频| 欧美日韩综合一区| 精品大片一区二区| www.国产区| 亚洲欧美制服第一页| 国语精品一区| 中文字幕2018| 九九九久久久久久| 国产99久久久久| 免费男女羞羞的视频网站在线观看| 亚洲va码欧洲m码| 一区二区三区四区乱视频| 国产一区二区三区免费观看在线| 三年中文高清在线观看第6集| 欧美三级电影在线看| 国产成人三级| www.激情小说.com| www.午夜精品| 国产成人自拍在线| 三级在线观看视频| 欧美下载看逼逼| 欧美中文字幕一二三区视频| 国产一区二区精品久| 牛夜精品久久久久久久| 久久色精品视频| 成人av电影免费在线播放| 欧洲一区二区三区精品| 久久视频在线| 午夜精品美女久久久久av福利| 国产日韩一区二区在线观看| 亚洲五月天综合| 精品国产一区二区三区麻豆免费观看完整版 | 色婷婷精品国产一区二区三区| 欧美午夜美女看片| 91久久国产| 一不卡在线视频| 成人国产精品一区二区| 亚洲欧美另类久久久精品| 日韩有码中文字幕在线| 777永久免费网站国产| 欧美性做爰毛片| 亚洲欧美日韩人成在线播放| 高清一区二区| 一本不卡影院| 日韩av密桃| 寂寞少妇一区二区三区| 在线视频91p| 欧美大香线蕉线伊人久久| 欧美成人一区二区三区在线观看| 日韩在线一二三区| 日本成人三级电影| 91视频最新入口| 欧美性在线观看| 亚洲一区二区美女| 国产精品vip| 番号集在线观看| 欧美精选一区二区三区| 欧美电影院免费观看| 亚洲一区二区三区精品在线| 7m第一福利500精品视频| 欧美日韩伊人| 麻豆精品视频| 亚洲变态欧美另类捆绑| 国产不卡视频在线观看| 亚洲大奶少妇| 中文视频在线| 精品中文字幕人| 亚洲国产天堂久久综合网| 国产精品一区二区在线观看不卡 | 久久久久久18| 伊人婷婷欧美激情| 欧美日韩视频一区二区三区| 男人天堂亚洲天堂| www.99热这里只有精品| 亚洲区综合中文字幕日日| 日本一区高清在线视频| 中文精品99久久国产香蕉| 一区免费观看视频| 一本色道精品久久一区二区三区|