国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

機器學習研究重現難,難于上青天

人工智能 機器學習
可重現性 / 一致性是計算科學研究的一項基本要求,機器學習也不例外。現有的很多機器學習研究結果要么不可重現,要么難以重現。如何確保研究成果的可靠性和可重現性,是很多機器學習研究者致力于解決的問題。

 [[223551]]

導讀:可重現性 / 一致性是計算科學研究的一項基本要求,機器學習也不例外。

機器學習研究論文毫無疑問是一筆寶貴的資產。這些論文可以用來啟發未來的研究;它們可以成為對學生有用的教學工具;它們可以為工業界的應用研究人員提供指導。也許最重要的是,它們可以幫助我們回答那些有關人類存在的最基本的問題:比如,學習到底是什么意思?人類的存在意味著什么?雖然可重現性在科學研究中并不總能夠做到,但它是提高研究質量的有力標準。如果研究結果可重現,那就證明這個研究結果有可能更穩健、更有意義,至少排除了許多由實驗者帶來的錯誤(比如弄虛作假或偶然得出的結果)。

然而,現有的很多機器學習研究結果要么不可重現,要么難以重現。如何確保研究成果的可靠性和可重現性,是很多機器學習研究者致力于解決的問題。甚至在 2017 年的 ICML 上,還專門組織了一場名為“Reproducibility in Machine Learning”的 Workshop,以探討機器學習研究結果的可重現性和可復制性問題。

為什么機器學習研究重現起來那么難?來看看在谷歌 TensorFlow 團隊研究深度學習的工程師 Pete Warden 怎么說。

Pete Warden 的文章發出后,很多正在研究機器學習的工程師、研究員紛紛表示贊同,包括谷歌大腦研究員、SketchRNN 的爸爸 David Ha(@hardmaru)也默默轉發了他的推文。

 

我有個朋友創辦了一家機器學習初創公司,最近,他碰到了一些麻煩。他們的機器學習模型雜亂無章,當他的團隊想基于這些模型構建一些東西或把它們展示給客戶時,出現了嚴重的問題。有時候,即使是模型原作者都無法正常地運行自己創建的模型,或者得到與之前同樣的結果。他向我求助,希望我給他建議一個解決方案,但我不得不承認,我在工作中也正遭遇著同樣的問題。向不了解機器學習的人解釋這些東西真的很難,我們***還是回到了那個不使用代碼版本控制系統的年代,并從頭開始訓練模型,盡管有時候覺得這樣做簡直糟透了。

 

我從 90 年代中期開始我的代碼生涯,那個時候,微軟的 Visual SourceSafe 是標準的代碼版本控制系統。為了提供良好的體驗,它不支持提交代碼原子操作,所以多個開發者不能同時修改同一個文件。在晚上的時候需要進行掃描和拷貝,避免出現意外的沖突,但即使是這樣,也無法保證在早上的時候數據庫是完整的。只能說我足夠幸運,我所在的團隊準備了一面墻,他們在墻上貼上便條,每張便條對應項目里的一個文件。當某個開發人員想要修改某個文件時,就拿走對應的便條,等改完了再把便條放回去。

可以說,在版本控制系統面前,我是毫無畏懼的。我曾經使用過一些非常糟糕的系統,如果有必要,我甚至可以使用同步工具自己搗鼓出一些解決方案。但即使是這樣,在機器學習開發的變更跟蹤和協作這個問題上,我可以非常坦誠地說,我也是束手無措。

為了解釋這個問題,先來看看典型的機器學習模型生命周期:

  • 研究人員想嘗試一個新的圖像分類架構。
  • 她從之前的項目拷貝了一些代碼用于處理輸入數據集。
  • 數據集存放在網絡上的某個文件目錄下,有可能是從 ImageNet 上下載下來的,但不清楚是哪個目錄。在某個時候,可能有人移除了部分非 JPEG 格式的圖像,或者做了其他一些細微的修改,但沒有留下任何修改歷史。
  • 她想方設法修復 bug,并調整算法。這些變更都發生在她的本地機器上,為了訓練模型,她需要把大量的代碼拷貝到 GPU 集群上。
  • 她反復訓練了幾次模型,并在本地機器上繼續修改代碼,因為訓練一次模型需要幾天甚至幾周的時間。
  • 在訓練接近尾聲時可能出現了 bug,她就在趕緊修改了其中一個文件,并把它拷貝到集群的機器上。
  • 她可能將某一次訓練得到的半成品權重用在了新的訓練上,而新的訓練是基于剛修改過的代碼。
  • 因為時間的關系,她評估了這幾次的訓練結果,并選擇其中一個作為最終要發布的模型,但這個模型有可能是使用不同的代碼訓練出來的。
  • 她把代碼提交到版本控制系統的個人目錄下。
  • 她把代碼和模型發布出來。

這已經是當研究人員足夠小心謹慎時的一種比較樂觀的情況了,但你已經可以想象到,如果換了另外一個人,要重復上面這些步驟,并保證得到同樣的結果,會有多難。上述的每一個步驟都有可能出現不一致,更何況機器學習框架有時候會在性能和數字準確性之間做出權衡,就算真的有人可以按部就班地重復上述的步驟,仍然會出現不一樣的結果。

大多數情況下,研究人員可能沒有記下自己都做了些什么,所以無法生成同樣的模型。即使她記下了所有步驟,并再次執行這些步驟,但因為框架會隨時發生變化,她必須記錄下這個系統的快照,才有可能做到與之前的模型保持一致。我曾經找研究人員幫忙,讓他們重新生成模型,他們很慷慨,但通常需要花上幾個月時間,即使他們是模型的原作者。

為什么一致性這么重要?我有幾個朋友跟我說,他們在寫論文時不知道該如何重現模型。如果他們無法得到與原作者一樣的準確率,那么該如何說服別人自己的新方法是對原有方法的改進呢?如果你沒有辦法為了應對變更的需求或平臺完全重建一個模型,那么重度依賴生產系統已有的模型也是很正常的。在進行研究實驗時,這也是個大問題,因為代碼變更和訓練數據很難進行回滾。在嘗試執行上述的那些步驟時,可能存在更多的風險,這就好比不使用版本控制系統會增加代碼變更所帶來的成本。

當然,事情也不是那么悲觀,社區正在這方面做出努力,以解決模型的一致性問題。其中我最喜歡的是由 Toby Boyd 領導的 TensorFlow Benchmarks 系項目(https://www.tensorflow.org/performance/benchmarks)。這個團隊的使命不僅是要實現如何在多平臺上快速訓練當前的一些主流模型,而且要讓這些模型達到足夠高的準確率。我曾親眼目睹他揮汗如雨地為提高模型準確性而做出努力,因為上述的那些步驟都有可能影響結果,而且沒有簡單的調試方法,即使有模型原作者的幫助也無濟于事。而且這看起來就像是一項無止境的工作,TensorFlow 框架在變化,GPU 驅動器在變化,數據集在變化,這些都會影響到結果。Toby 的團隊可以幫助我們發現和修復因 TensorFlow 的變更引起的 bug,并找出由外部依賴導致的問題,但要把規模擴大仍然很困難。

我也知道有些團隊對于在生產系統中使用機器學習模型非常小心翼翼,他們為了確保訓練模型的一致性花了很多時間和精力,但問題是,這一過程仍然是手動進行的。現在還不存在一種版本控制系統或被大家一致認可的***實踐,可以確保模型在未來仍然可以產出相同的結果。我暫時也想不到更好的辦法,不過在這里拋磚引玉一下,在嘗試解決這個問題時,還是有一些原則可以遵循的:

  • 新想法需要足夠容易被研究人員所理解,不需要研究人員花費太多時間和精力,否則的話,他們可能壓根不愿意使用這些系統。理想情況下,這些系統應該要能幫助他們大大提升效率。
  • 如果某個研究人員不小心被車撞了(大誤,劃掉)出走去搞創業了,需要保證,哪怕是第二天新加入的研究員也能夠重新訓練他們之前創建好的模型,并得到相同的結果。
  • 應該存在某種打包方式,將訓練某個模型所需的元素打成包,這個包可以被共享出來,并且不會露模型作者不希望暴露的歷史細節。
  • 為了重現結果,代碼、訓練數據和整個平臺需要被準確地記錄下來。

我已經看到一些開源社區和初創公司正致力于解決這個問題。我也迫不及待地想要用我的余生來解決這個問題,但在短期內難有完整的解決方案。在訓練模型這件事情上,我們需要一次變革,就像版本控制系統的出現給我們的編碼流程帶來的巨變那樣。

在嘗試重現機器學習研究結果的過程中,你踩過哪些坑?對于機器學習結果難以重現,你是否也想吐槽?歡迎留言分享你的看法。

原文鏈接:https://petewarden.com/2018/03/19/the-machine-learning-reproducibility-crisis/

責任編輯:龐桂玉 來源: AI前線
相關推薦

2018-03-16 08:46:51

2022-07-07 14:06:39

LiBai模型庫

2021-01-13 14:50:02

智能華為云IoT

2013-01-21 13:07:31

傲游云瀏覽器

2012-12-28 16:23:50

2015-09-17 18:53:17

諸葛io

2016-02-02 10:31:03

華三/大安全

2017-04-07 09:32:20

機器學習調試算法

2015-12-09 15:54:09

網絡線路建設華為

2013-08-23 10:34:43

諾基亞Windows Pho塞班之死

2015-12-01 17:16:16

華為

2020-10-28 13:51:45

機器學習化學研發AI

2022-06-28 09:00:00

機器學習人工智能安全

2017-04-11 14:45:22

機器學習學習平臺大數據平臺

2019-10-23 09:41:12

機器學習人工智能計算機

2017-04-10 18:00:11

2020-11-26 18:30:33

機器學習Kubernetes開發

2018-11-05 13:00:04

2019-10-16 11:52:15

MIT機器學習

2018-05-25 19:45:44

企業機器學習研究
點贊
收藏

51CTO技術棧公眾號

青青草免费观看免费视频在线| 中文字幕在线视频免费观看| 美国十次av导航亚洲入口| 亚洲第一福利网站| 视频二区在线| 亚洲欧美日韩国产另类专区| 伊人久久青草| 亚洲欧美日韩一区在线观看| 国产精品美女免费| 欧美色图婷婷| 米奇精品一区二区三区在线观看| 美女精品视频| 欧美日韩一区二区三区免费看| 国外av网站| 欧美极品美女视频| 日本久久久精品视频| 国产91综合一区在线观看| 日本免费一区二区三区| 国产精品99一区二区| 国产精品爽爽爽| 琪琪久久久久日韩精品 | 97人人做人人爽香蕉精品| 精品剧情在线观看| 最爽无遮挡行房视频在线| 91精品国产综合久久香蕉麻豆| 久热av在线| 91福利精品第一导航| 国产一级片在线播放| 欧美日韩成人激情| 久草中文在线| 精品va天堂亚洲国产| 周于希免费高清在线观看| 亚洲最新在线视频| 999色成人| 欧美专区在线观看| 水蜜桃久久夜色精品一区| 91青青草免费观看| 久久经典综合| 中文字幕在线观看一区二区三区| 国产福利91精品一区二区三区| 国产av国片精品| 国产偷国产偷亚洲高清人白洁| 上原亚衣加勒比在线播放| 亚洲成av人片在线| 日本中文字幕在线2020| 亚洲男人天堂古典| 豆花视频一区二区| 91麻豆国产精品| 日韩vs国产vs欧美| 精品国产免费av| 亚洲制服丝袜av| 日本高清中文字幕在线| 亚洲国产美女精品久久久久∴| 欧美色片在线观看| 日本电影亚洲天堂| 亚洲一区二区伦理| 免费成人午夜视频| 亚洲夂夂婷婷色拍ww47| 日本不卡三区| 美女av一区二区| 久久国产影院| 99re99热| 一区二区三区日韩精品| free性欧美hd另类精品| 欧美成在线视频| 国产专区一区| 国产一级做a爰片久久毛片男| 亚洲免费观看视频| 国产黄色大片在线观看| 57pao成人永久免费视频| 久久高清一区| 成人三级av| 亚洲成人中文字幕| 精品国产一级毛片| 黄色污污在线观看| 疯狂欧美牲乱大交777| 久久人体大尺度| 成人网欧美在线视频| 国产+成+人+亚洲欧洲自线| 中文字幕在线永久在线视频| 亚洲人在线视频| 婷婷综合久久| 欧美这里只有精品| 日韩欧美精品网址| 99精品在线观看视频| 成人美女视频在线观看18| 在线看的黄色网址| 在线不卡一区二区| 国产精品日本一区二区不卡视频| 国产欧美精品在线| 丁香婷婷综合网| 三区在线观看| 日韩在线观看免费全| 国内精品福利| av五月天在线| 91麻豆精品91久久久久同性| 黄色成人美女网站| 亚洲乱码一区二区三区三上悠亚| 中文字幕在线观看不卡| 成人激情春色网| 欧美一级片在线观看| 欧美oldwomenvideos| 香蕉视频在线播放| 亚洲一区亚洲二区| 婷婷六月综合| 国模吧无码一区二区三区| 欧美精品乱人伦久久久久久| 福利欧美精品在线| 五月天在线免费视频| 久久网站热最新地址| 污视频免费在线看| 欧美富婆性猛交| 热久久免费视频| 九色蝌蚪在线| 88国产精品欧美一区二区三区| 精品一区二区久久久| 午夜视频在线观看网站| 国产精品久久久久999| 成人一区二区三区视频在线观看 | 亚洲欧美日韩电影| 成人免费91| 日韩一区二区高清视频| 日韩美女视频一区二区在线观看| 91精品一区二区三区综合| 九九99九九精彩| 欧美成人自拍视频| 久久人人97超碰com| 99re8精品视频在线观看| 丰满人妻一区二区三区53号 | 1024日韩| shkd中文字幕久久在线观看| 成人黄色中文字幕| 欧美午夜www高清视频| 99成人超碰| 色猫av在线| 7777奇米亚洲综合久久| 一本色道综合亚洲| 黄色欧美成人| 天堂中文8资源在线8| 久久久久久草| 欧美一二三区在线| 免费高清成人在线| 成人性生活视频| 强开小嫩苞一区二区三区网站 | 成年人午夜视频在线观看| 亚洲片av在线| 国产成人精品三级| 久久久国产精品网站| www国产精品内射老熟女| 欧美精品中文字幕一区| 亚洲国产精品激情在线观看| 林ゆな中文字幕一区二区| 1pon在线| 成人精品一区二区三区| 91国产视频在线观看| 国产欧美日韩一级| 僵尸再翻生在线观看| 丰满的少妇愉情hd高清果冻传媒| 中文字幕av一区中文字幕天堂 | 特级毛片在线观看| 亚洲aⅴ日韩av电影在线观看| 欧美无人高清视频在线观看| 久热综合在线亚洲精品| 成人在线网站| 男女羞羞视频网站| 91精品久久久久久| 91精品综合久久久久久| 国产福利91精品一区二区三区| 欧美h版在线观看| 中文av在线播放| 亚洲高清乱码| 欧美美女18p| 欧美视频免费在线| 精品一区二区三区免费视频| 51亚洲精品| 国产98在线| www.av91| 国产欧美日韩丝袜精品一区| 欧美成人精品3d动漫h| 国产午夜亚洲精品羞羞网站| 经典一区二区| 美女91在线| 鲁一鲁一鲁一鲁一av| 国产伦精品一区二区三区| 中文字幕9999| 欧美性20hd另类| 国产一区二区三区久久悠悠色av| 国内精品偷拍| sm国产在线调教视频| 国产三级三级三级看三级| 99精品在线直播| 国产亚洲视频中文字幕视频| 亚洲资源中文字幕| 国产尤物一区二区| 99精品小视频| 在线成人视屏| 三区四区电影在线观看| 激情综合色综合啪啪开心| 久久精品久久久| 123成人网|