国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

新聞 人工智能
人們口口聲聲擔心「人工智能的推斷不可靠」,實則連個數據泄露的問題都敢忽略。

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

人們常會提到,當今流行的深度學習模型是黑箱狀態——給它一個輸入,模型就會決策出一個結果,其中的過程不為人所知。人們無法確切知道深度學習的決策依據以及結果是否可靠。近年來,越來越多的新研究面向構建可信的機器學習方法獲得了成果。

然而最近發生的一件事情告訴我們,很多時候被廣泛應用的機器學習模型出問題的原因,壓根就不會深入到算法層面。一點數據上的紕漏就會造成讓人啼笑皆非的結果,而且最重要的是,這樣的事比所謂「模型不可解釋」造成的損失還要多出不少。

上個星期,美國賓夕法尼亞州歷史保護官員和交通部門之間發送了大量郵件,其中內容混合了悲傷、困惑和沮喪的情緒。這一丑聞造成的影響仍在繼續,在官方做出回應之前,我們還不能了解更多情況(盡管此事在當地考古學家之間已經人盡皆知了)。

一個價值 36.5 萬美元的機器學習模型打了水漂。

發生甚么事了?

五年前,一些人帶著創意拜訪了賓州交通部,提出為史前考古遺址創建一個全州范圍預測模型。最終,政府部門選擇與一家大型工程公司合作,后者一直在考古調查方面花錢。

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

從合同中我們可以看到,這家公司花費了納稅人 36.59 萬美元,承諾提供一款最強大的模型,該模型還整合了 GIS(地理信息系統)疊加分析,其結果可供考古學家們使用。

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

從那以后直到今天,絕大多數賓夕法尼亞州交通部門的項目和所有需要進行文化資源調查的項目,在進行前都使用了這個機器學習模型的推斷結果。

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

從數據準備、模型選擇再到性能測試,這一項目原本看起來有模有樣,然而錯誤一旦被人揭穿,情況就變得不忍直視了。

他們將待預測區域當做負樣本

從 2013 年中到 2015 年,項目承包商花了一年半左右的時間向賓州交通部門交付了一個模型和 7 冊文檔。

不幸的是,到目前為止,似乎沒有人閱讀過該文檔。模型似乎會輸出一些毫無意義的數字,而背后原因非常神奇。

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

咨詢公司將未調研的土地用作負樣本數據集,但是,這些土地不就是模型將要預測的那部分嗎?一個花費了 30 多萬美元的模型,卻真實地包含了這樣的錯誤。

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

無論如何,在一個(混合了回歸和隨機森林的)模型中使用 null 數據都是不合適的,這些本不應該作為負樣本數據而出現。即使這些 null 數據存在于自變量中,而不是因變量,它們依舊能夠對模型的推理結果造成嚴重破壞。

他們檢查項目時沒有使用數據處理的最佳實踐

可為什么開發團隊的數據科學家們辛苦工作了一年半,也沒有意識到他們在第一步中就犯了錯?這與他們檢查項目的方式有關。

一般來說,檢查的金標準是留出一部分隨機選擇的部分。此時,只要你訓練了模型,就可以知道該模型在給到真實數據時是否 work。

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

顯然,在這件事中,相關研究人員未曾進行這樣的驗證。也許他們使用了一些神秘的統計方法?這就不得而知了。

他們將已知地點視為隨機采樣的結果

眾所周知,即使在一個項目區域內,也并非所有土地的采樣率都相同。僅使用鏟測試坑(Shovel Test Pit),并假設你有 100 英畝的土地,其中 50 英畝是高概率,50 英畝是低概率,并以不同的間隔(常見的有 15 米、30 米)對其進行測試。這意味著你有 80% 的測試是在高概率土地上進行的,因為你可以在一英畝土地上以 15 米的間隔進行 16 次鏟土測試,以 30 米的間隔進行約 4 次測試。因此你需要在高概率部分上找到 80% 的站點。

因此我們有一些已知的站點,這些站點并不是從隨機采樣的土地中發現的,而是從人們認為能夠找到它們的位置發現的。

直覺上,大多數考古學家都知道這一點。這很重要,因為已知的正樣本數據集的自變量分布已用于這些統計測試。這種分布是有偏置的,數據科學家不知道如何解釋這些偏置。

因此,我們需要留出一部分數據。

項目管理,沒有管理?

花費 36.5 萬美元,并不意味著簡單地讓承包商派一個人過來,在辦公室角落里搗鼓幾年,而無需他人管理。

追溯到 2014 年初,這個項目在交付給賓州交通部門的第三卷文檔中,已經犯了致命的錯誤(使用 null 數據作為負樣本數據)。難道這個項目無人監督嗎?為什么在向賓州交通部門收取數十萬美元之前,這個融合了 GIS 和機器學習的模型不值得其他人(無論是同事還是上級)關注?

交通部門盡到職責了嗎?

交付文檔之后,賓州交通部門中誰閱讀過這些文檔?作者猜測可能沒人閱讀,也沒人能理解這些文檔。不過這純粹是猜測了,我們更愿意相信文檔被讀過,只是讀地不仔細。

針對該模型中最大的錯誤而言,任何上過大學統計學課程的人都應該能夠解決這個問題。但是正如有人指出的那樣,考古學家很少學習這些數學課程,因此可能不會有考古學家來指出這些錯誤。

教訓

這一錯誤浪費了納稅人 36.5 萬美元,顯示了美國交通部門和售賣該模型的公司在質量控制方面的漫不經心,同時也表明,一些有問題的模型目前仍在某些重要的大型項目中使用。

老實說,如果想要一個預測模型,你拿出這個項目 3–5% 的經費就夠了。把模型做得簡單一點,這樣你就能自己對它進行更新、測試。即使這個模型沒有大量的質量控制問題,復雜的數學模型也不比簡單的性能要好。

揭露此事的人,Medium 博主 Archaic Inquiries 表示,他目前還在等待 SHPO 和 DOT 的回復。他特別強調,他既不在這個州工作,近期也沒有這個打算,寫這篇批評文章也沒拿到什么報酬。他的動機很簡單:看到這個模型由于缺乏監管而用于政策指導,作為一名專業人員的他為自己的領域感到尷尬。

模型花費幾十萬刀,指導無數項目,才發現負樣本用的是null?

機器學習的推斷結果出錯造成的損失有大有小,在這里可能意味著不少古人類遺跡被忽略,但最可怕的地方在于,在機器學習技術被廣泛應用的今天,這樣的錯誤其實屢見不鮮。

在社交網絡上,賓州算法事件被機器學習圈的人廣泛討論,有人表示:「我遇到的大多數數據科學家,都完全沒有意識到這種錯誤推理的問題(數據泄露),而且因為對于機器學習的無條件信任,甚至相信算法,更甚于相信自己的領域知識。」

「我認識一個政府機構的數據科學家,有很多次,我不得不向他解釋一些數據科學領域中的基本概念。我不會點明他在哪個機構,但當美國人的生命受到威脅時,它會是人們首先想要求助的那個部門。」在 Reddit 上,用戶 Stereoisomer 說道。

不知此類在技術上沒有什么解決難度的問題,以后會不會越來越少。

 

責任編輯:張燕妮 來源: 機器之心Pro
相關推薦

2019-12-11 10:14:23

Kafka吞吐量架構

2022-09-10 18:54:14

Kafka零拷貝磁盤

2012-06-18 09:29:38

2024-01-12 21:18:22

負樣本大模型蒸餾

2020-04-28 14:50:30

短視頻運營實戰

2022-01-03 07:19:47

Google漏洞Chrome

2014-10-22 09:52:48

用友HCM

2024-04-29 07:00:00

大模型AIGC人工智能

2025-06-09 08:28:00

2023-04-09 23:25:30

Java注解元注解

2017-12-21 07:54:23

JavaPHP程序員

2012-10-09 10:16:35

創業投資項目

2025-01-27 00:57:43

2023-12-15 12:52:32

模型數據

2021-10-25 11:08:51

AI 數據人工智能

2023-06-21 10:33:16

2025-04-30 08:49:32

2018-08-14 08:43:17

服務器命令CCS系統

2024-03-04 00:00:00

數組every條件

2018-09-30 09:21:01

優音通信客戶關懷中心企業通信
點贊
收藏

51CTO技術棧公眾號

99精品国产一区二区| 欧美破处大片在线视频| 天天影视欧美综合在线观看| 国产在线精品自拍| 久久久久久久综合色一本| 国产视频一区二区视频| 免费的成人av| 91人成网站www| 99精品在线免费观看| 色琪琪综合男人的天堂aⅴ视频| 国产香蕉精品| 性色av一区二区三区红粉影视| www.久久热.com| 欧美蜜桃一区二区三区| 成人亚洲综合| 中文字幕日韩电影| 丰乳肥臀在线| 国产午夜精品麻豆| 91国内外精品自在线播放| 欧美一区二区三区不卡| 91精品专区| 国产欧美一区视频| 久久精品国产sm调教网站演员| 欧美日韩蜜桃| 日本免费在线视频观看| 久久93精品国产91久久综合| 日韩一区二区三区视频| 成人性生交大片免费看午夜| 中文字幕免费不卡| 国产美女主播在线播放| 精品一区二区精品| 美乳中文字幕| 亚洲欧美在线免费| 日本精品在线| 97久久久免费福利网址| 欧美国产高潮xxxx1819| 欧美麻豆久久久久久中文 | 精品无码国模私拍视频| 亚洲影院免费观看| 久草在线视频福利| 视频在线精品一区| 亚洲素人在线| 国产色a在线| 深夜成人在线观看| 成人片免费看| 午夜精品理论片| 亚洲男女av一区二区| 成人综合色站| 日韩电影在线观看完整免费观看| 偷拍一区二区三区| 青草视频在线免费直播| 欧美激情视频一区二区| 国际精品欧美精品| 国产高清一区视频| 国产人成一区二区三区影院| www在线观看免费| 99久久综合狠狠综合久久| 中文字幕一区免费| 亚洲成av人片一区二区三区| 国产第一页在线| 国产一区二区三区四区hd| 国产精品入口麻豆九色| 三级在线电影| 国产日本欧美视频| 日韩专区一卡二卡| 7878视频在线观看| 日韩女优在线播放| 国内黄色精品| www.国产在线播放| 五月天丁香久久| 国产精品91一区二区三区| 一本色道无码道dvd在线观看| 欧美岛国在线观看| 日韩成人精品在线观看| 天天综合视频在线观看| 国产欧美在线视频| 亚洲国产日日夜夜| 国产精品videosex性欧美| 国产一级粉嫩xxxx| 国产视频久久网| 国产一二三精品| 日韩精品一区二区三区| 在线一区亚洲| 一本一道久久a久久精品逆3p | 青青草原在线亚洲| 羞羞在线观看网站| 国产精品扒开腿爽爽爽视频| 一区二区三区国产豹纹内裤在线| 成人av在线播放| 中文字幕乱码免费| 日韩在线视频免费观看高清中文| 大陆成人av片| 亚洲裸色大胆大尺寸艺术写真| 中国黄色在线视频| 伊人久久青草| 69av在线视频| 欧美日韩视频在线第一区 | 亚洲黄色免费三级| 韩国成人精品a∨在线观看| 中文字幕www| 国产精品二区三区四区| 亚洲精品色婷婷福利天堂| 久久精品欧美一区二区三区不卡| 最新精品国偷自产在线| 亚洲卡一卡二| 北条麻妃在线视频| 亚洲午夜av久久乱码| 一区二区三区在线观看欧美| 欧美日韩一本| 18在线观看的| 欧美日韩在线高清| 精品欧美一区二区久久| 国产不卡在线视频| 日韩激情一区| av国产精品| 春暖花开成人亚洲区| 国产aaa免费视频| 国产91精品视频在线观看| 717成人午夜免费福利电影| √…a在线天堂一区| 国产成人精品亚洲日本在线桃色 | 91在线免费看网站| 久久久精品国产亚洲| 精品国一区二区三区| 亚洲综合视频在线| 国产成人亚洲精品狼色在线| 中文乱码免费一区二区三区下载| 国产高清视频一区二区| 韩国版免费三体| 国产欧美综合一区| 欧美日韩一区在线播放| 国产精品普通话| 国模gogo一区二区大胆私拍| 日韩精品一区二| 欧美视频一区二区在线观看| 一区2区3区在线看| 亚洲欧洲国产日本综合| 国产农村妇女精品| av一二三不卡影片| 国产伦理精品不卡| 国产91精品入口| 国产亚洲午夜| 欧美独立站高清久久| 国产精品视频首页| 国产成人精品亚洲日本在线观看| 青春草免费在线视频| 成人av毛片| h片在线观看| 丝袜美腿一区| 成人永久在线| 久久99精品久久| 成人精品一区二区三区校园激情| 免费在线稳定资源站| 男女激情无遮挡| 九9re精品视频在线观看re6| 亚洲天堂影视av| 成人av在线资源网| 午夜精品毛片| 日本一区二区高清不卡| 丁香花在线观看完整版电影| 亚洲免费资源| 在线观看日韩欧美| 亚洲国产综合在线观看| yiren22亚洲综合伊人22| 亚洲国产高清一区二区三区| 超碰在线图片| 亚洲最新视频在线播放| 77成人影视| 久久精品国产精品亚洲综合| 精品日本美女福利在线观看| 综合亚洲自拍| 亚洲搞黄视频| 国产欧美日韩另类一区| 亚洲成av人电影| av成人免费| 久久婷婷国产综合国色天香| 91传媒视频在线观看| 亚洲成在人线在线播放| h视频久久久| 怡红院成人在线| 综合在线影院| 蜜桃久久久久| 亚洲7777| 欧美精品激情视频| mm131午夜| 精精国产xxxx视频在线中文版 | 国产欧美一区二区三区久久| 久久久97精品| 在线国产精品网| 免费亚色电影在线观看| 亚洲精品在线影院| 成人一二三区视频| 国产三级一区二区| 国产一区二区伦理| 亚洲二区在线| 久久99在线观看| 成人激情综合网站| 国产精品的网站| 欧美日韩在线播放三区四区| 91精品国产91热久久久做人人|