国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

如何寫一篇不水的機器學習論文?

新聞 機器學習
還在學師階段的研究生以及從業新手們,想在機器學習研究中少走彎路嗎?或許本篇論文可以幫到你。

 [[417825]]

本文經AI新媒體量子位(公眾號ID:QbitAI)授權轉載,轉載請聯系出處。

還在學師階段的研究生以及從業新手們,想在機器學習研究中少走彎路嗎?

或許下面這篇論文可以幫到你:

《如何避免機器學習研究中的陷阱?一本給學術研究人員的指南》

如何寫一篇不水的機器學習論文?

作者是英國赫瑞-瓦特大學數學與計算機科學學院的副教授,同時也是愛丁堡機器人中心的成員,博士畢業已經十多年,這篇17頁的論文主要介紹了機器學習學術研究中的一些常犯錯誤,以及如何避免。

[[417826]]

指南共涵蓋了機器學習過程的五大方面:建模前如何準備,如何建出可靠的模型,如何穩健地評估模型,如何公平地比較模型以及如何報告結果。

如何寫一篇不水的機器學習論文?

一位已經從業的機器學習研究員稱贊該論文很有價值,因為文中提到的所有錯誤他在博士學習和工作期間中都遇到很多次。他準備讓后面所有新入職的工程師都好好看看。

如何寫一篇不水的機器學習論文?

不少人則認為該指南的意見可能并不受歡迎,因為很多都是研究人員本該知道的基本常識,比如多次重復實驗并報告平均值和方差進行嚴格比較,但他們就是為了方便或者讓數據更好看而選擇性忽視

如何寫一篇不水的機器學習論文?

下面就詳細看看作者都提了哪些常見錯誤。

建模前的準備

為了得到符合預期用途的模型、可以順利發表論文的結果,建模之前你需要做好以下6點準備:

1、確保花時間研究你要用的數據集,來源可靠、質量有保證。

2、但不要查看測試數據,防止先入為主做出某些假設導致最終模型通用性差

3、保證數據量足夠大,當然保證不了也是常有的事兒,解決辦法:

比如評估模型時交叉驗證數據、采用數據擴充技術(數據集中某類數據不夠時也可采用)。

但總的來說,數據不夠模型就不能設計得太復雜,不然分分鐘給你過擬合。

4、要和相關領域專家談談,防止研究脫離實際,并且他們也可以幫助你向最合適的期刊/受眾發表。

5、搜遍相關文獻,雖然發現別人已經研究過了很沮喪,但是寫論文時你該怎么解釋為什么要覆蓋相同的領域

6、一定要提前考慮模型部署的問題:大部分學術研究最終都是要落地吧?好好考慮落地場景的資源、時間限制等問題來設計模型。

如何建出可靠的模型

1、不要讓測試數據參與到訓練過程中(這點前面也已強調過)。

2、嘗試不同的ML模型,別套用,具體問題具體分析找出最適合解決你的問題的那個。

“湊合”的例子包括將期望分類特征的模型應用于由數字特征組成的數據集、將假定變量之間沒有依賴關系的模型應用于時間序列數據,或者只相信最新的模型(舊的不一定不合適)。

3、一定要優化模型的超參數。使用某種超參數優化策略比較好,這樣在寫論文時也好整。除了數據挖掘實踐之外,可以使用AutoML技術優化模型及其超參數的配置。

4、在執行超參數優化和特征選擇要小心:防止測試集“泄漏”,不要在模型訓練開始之前對整個數據集進行特征選擇。理想情況下應使用與訓練模型所用數據完全相同的數據。

實現這一點的常用技術是嵌套交叉驗證(也稱為雙交叉驗證)。

如何穩健地評估模型

對模型進行不公平的評估,很容易讓學術研究的水變渾濁

作者一共提了5點:

1、一個模型在訓練集上的表現幾乎毫無意義,保證測試集與訓練集之間的獨立

2、在連續迭代多個模型,用前面的數據指導下一個的配置時使用驗證集,千萬不要讓測試集參與進來。可以根據驗證集對模型進行測量:當分數開始下降時,停止訓練,因為這表明模型開始過擬合。

3、對模型多次評估,防止低估/高估性能。十次交叉驗證是最標準的做法,對很小的數據類進行層化也很重要;需要報告多個評估的平均值和標準偏差;也建議保留單個分數記錄,以防以后使用統計測試來比較模型。

4、保留一些測試數據以無偏評估最終的模型實例

5、不要對不平衡的數據集使用準確度(accuracy)指標。這個指標常用于分類模型,不平衡數據集應采用kappa系數或馬修斯相關系數(MCC)指標。

如何公平地比較模型

這是非常重要的一環,但很驚訝的是很多人都比不對,作者表示一定要確保在同一環境中評估不同的模型,探索多個視角,并正確使用統計測試。

1、一個更大的數字不意味著一個更好的模型。應將每個模型優化到同等程度,進行多次評估,然后使用統計測試確定性能差異是否顯著。

2、要想讓人相信你的模型好,一定要做統計測試

3、進行多重比較時進行校正:如果你以95%的置信水平做20個成對測試,其中一個可能會給你錯誤的答案。這被稱為多重性效應。最常見的解決方法是Bonferroni校正

4、不要總是相信公共基準測試的結果

使用基準數據集來評估新的ML模型已變得司空見慣,你以為這會讓結果更透明,實際上:

如果測試集的訪問不受限,你沒法確保別人沒有在訓練過程中使用它;被多次使用的公共測試集上的許多模型可能會與之過度匹配;最終都會導致結果樂觀。

5、考慮組合模型。

如何報告結果

學術研究的目的不是自我膨脹,而是一個貢獻知識的機會。為了有效地貢獻你的想法,你需要提供研究的全貌,包括哪些有效哪些無效。

1、保持你所做所發現的成果透明,這會方便其他人更容易地在你的工作基礎上擴展。共享你的代碼也會讓你在coding的時候更認真。

2、提供多個測試集上的報告,為每個數據集報告多個度量指標(如果你報告F值,請明確這是F1得分還是精度和召回率之間的其他平衡;如果報告AUC,請指出這是ROC曲線下的面積還是PR下的);

3、不要在結果之外泛化,不要夸大,意識到數據的局限性。

4、報告統計顯著性時一定要小心:統計人員越來越多地認為,最好不要使用閾值,而只報告p值,讓讀者來解釋這些值。

除了統計意義之外,另一件需要考慮的事是兩個模型之間的差異是否真正重要。

5、最后,再回過頭完整的看一眼你的模型,除了報告性能指標,看看它能解決多少實際問題。

以上就是所有的內容,作者表示,部分意見可能有爭議,內文也并非詳盡無遺,因此提供了很多參考鏈接供大家進一步參考。

另外理論總是落后于實踐,我們今天認為正確的東西明天可能不正確,因此大家都要以開放的心態面對機器學習,緊跟最新技術進展,謙虛地接受新知識。

更多意見歡迎在評論區補充。

指南地址:
https://arxiv.org/abs/2108.02497

 

 

責任編輯:張燕妮 來源: 量子位
相關推薦

2013-12-10 09:50:03

技術技術博客

2022-11-07 17:26:16

機器學習AI

2022-05-30 21:47:21

技術目標PRD

2022-09-20 10:18:05

論文技術

2025-11-18 08:46:00

大模型強化學習Meta

2022-03-01 15:15:41

AI樂譜論文

2025-11-14 08:37:14

2022-02-28 08:07:17

Java開發

2021-06-16 08:28:25

unary 方法函數技術

2020-10-24 13:04:07

腳本shell命令

2021-09-05 17:22:08

Strview.js工具js

2011-05-26 09:39:53

程序

2023-04-21 08:11:54

KubernetesPod

2017-09-19 14:36:34

機器學習

2017-10-04 06:36:55

機器學習python數據

2017-09-18 20:07:56

數據科學機器學習python

2019-08-01 12:59:21

Bug代碼程序

2019-11-21 15:35:28

機器學習人工智能計算機

2021-06-04 10:18:03

Trie字典樹數據

2021-12-07 08:50:40

字母區間字符串
點贊
收藏

51CTO技術棧公眾號

亚洲精品日韩欧美| 亚洲成在人线免费| 欧美黑人xxx| 182tv在线播放| 亚洲欧美视频在线观看视频| 午夜啪啪福利视频| 在线精品亚洲| 国产精品一区二区三区成人| 久久久精品区| 国产一区二区三区18| 中文国产字幕在线观看| 欧美香蕉大胸在线视频观看 | 国产成人精品一区二区三区视频 | 国产丝袜在线播放| 欧美性高潮在线| 天天看片激情网站| 亚洲天堂2016| www.成人精品免费网站青椒| 中文字幕精品一区| 18禁免费无码无遮挡不卡网站| 精品一区二区在线播放| 亚洲成人av动漫| 日本成人在线视频网站| 欧美日韩中文国产一区发布| 国产精品毛片| 五月婷婷综合色| 久久精品免费观看| 国产午夜精品视频一区二区三区| 国产麻豆精品在线观看| 国产欧美精品aaaaaa片| 国产精品一区二区三区四区 | 色乱码一区二区三区网站| 欧美一区第一页| 深爱激情久久| 91成人在线看| 久久亚洲电影| 国产精品jizz在线观看老狼| 奇米影视一区二区三区| 亚洲一卡二卡三卡| 国产成人综合在线观看| 131美女爱做视频| 国产精品久久看| 永久www成人看片| 欧美色图第一页| 久久av色综合| 久久人人爽人人爽爽久久| 久久综合社区| 国产不卡一区二区在线观看| 日本伊人精品一区二区三区观看方式| 亚洲成人a**址| 91网站黄www| 男人午夜天堂| 欧美三级电影在线观看| av今日在线| 欧美激情第99页| 午夜久久免费观看| 亚洲精品国产一区| 久久综合九色欧美综合狠狠| 中文字幕2018| 精品99999| 6080亚洲理论片在线观看| 国产欧美一区二区三区在线| 亚洲影视综合| 欧美 日本 亚洲| 亚洲永久精品国产| 色女人在线视频| 久久理论片午夜琪琪电影网| 国产精品v日韩精品v欧美精品网站| 一级日韩一区在线观看| 国产欧美日韩麻豆91| 每日更新av在线播放| 日韩激情视频在线| 麻豆成人入口| 久久综合给合久久狠狠色| 99久久精品国产网站| 深夜福利视频一区| 一本大道久久加勒比香蕉| 成人嫩草影院| 欧美日韩一级在线| 亚洲资源中文字幕| 91av亚洲| 99影视tv| 国产视频一区在线播放| 在线a免费看| 国内免费久久久久久久久久久| 亚洲欧美高清| 女同互忝互慰dv毛片观看| 亚洲护士老师的毛茸茸最新章节| 伊色综合久久之综合久久| 欧美日本亚洲| 一区二区久久久久| 国产精品99精品一区二区三区∴| 99久久无色码| 亚洲欧洲色图综合| 成人影院在线视频| 91免费精品视频| 国产日韩欧美a| 久热在线观看视频| 亚洲一区亚洲二区| 久久蜜桃av一区精品变态类天堂 | 日本最新在线视频| 午夜剧场成人观在线视频免费观看| 99av国产精品欲麻豆| 久久综合色播| 日韩视频免费在线观看| 国产美女一区| 在线看黄的网站| 韩国19禁主播vip福利视频| 男男视频亚洲欧美| 高清av在线| 国产激情久久久| 久久婷婷成人综合色| 黄色在线观看www| 精品一区二区视频| 精品久久香蕉国产线看观看亚洲| 911亚洲精品| 霍思燕三级露全乳照| 日韩一区二区三区视频在线观看| 亚洲天堂免费| 色视频www在线播放| 久久免费观看视频| 91麻豆国产福利精品| 是的av在线| 亚洲午夜在线观看| 日韩女同互慰一区二区| 亚洲国产精品第一区二区| 轻轻色免费在线视频| 国产91色在线播放| 国产精品第13页| 999久久精品| 免费在线观看日韩视频| 中文字幕日韩免费视频| 黄页视频在线91| 黄网站在线观| 午夜视频久久久| 波多野结衣的一区二区三区| 日本精品在线观看| 亚洲最大福利视频网| 亚洲天天做日日做天天谢日日欢 | 99久久激情视频| 亚洲老头老太hd| 奇米精品一区二区三区四区| 三区四区在线视频| 日韩成人三级视频| 亚洲精品国产福利| 亚洲一级高清| 日韩欧美中文字幕在线播放| 999国产精品一区| 国产xxxxx在线观看| 亚洲桃花岛网站| 懂色av噜噜一区二区三区av| xx欧美视频| 日本欧美视频在线观看| 精品国产区一区二区三区在线观看| 不卡一区二区三区四区| 日韩成人在线一区| 无码人妻丰满熟妇区96| 欧美成人一二三| 国产精品久久久久aaaa樱花| 香蕉视频一区| 四虎在线免费观看| 精品一区二区三区免费毛片| 欧美mv日韩mv国产网站app| 美女mm1313爽爽久久久蜜臀| 欧美成人h版| 国产精品亚洲a| 国产成人久久精品| 在线观看国产一区二区| 日韩激情视频在线观看| 欧美大胆性生话| 超碰在线播放91| 国产精品看片资源| 欧美日韩在线播| 国产麻豆91精品| 99re6热只有精品免费观看| 情趣网站在线观看| 青青成人在线| 久久色精品视频| 亚洲电影一区二区三区| 香蕉久久夜色精品| 国产精品久久久久久吹潮| 激情五月色综合亚洲小说| 999视频在线免费观看| 精品sm在线观看| 国产欧美日韩在线观看| 亚洲最新色图| 另类中文字幕国产精品| 免费一级淫片| 亚洲精品国产精品国自产| 久久69精品久久久久久久电影好| 亚洲综合丝袜美腿| 日本伊人色综合网| 精品欧美午夜寂寞影院| 麻豆免费在线观看| 精品免费国产一区二区| 超碰97人人人人人蜜桃| 亚洲午夜女主播在线直播| 午夜久久福利影院| 国产·精品毛片| 永久www成人看片|