国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

CatBoost:比XGBoost更優秀的GBDT算法

譯文
人工智能 深度學習 算法
互聯網的算法有很多應用場景,包括推薦系統、計算廣告和金融反欺詐等。許多互聯網的機器學習和數據挖掘問題都可以轉化為分類問題。在處理這一類分類問題的時候,最常用的方法包括邏輯回歸、GBDT和深度學習等。

[[242113]]

【51CTO.com快譯】互聯網的算法有很多應用場景,包括推薦系統、計算廣告和金融反欺詐等。許多互聯網的機器學習和數據挖掘問題都可以轉化為分類問題。在處理這一類分類問題的時候,最常用的方法包括邏輯回歸、GBDT和深度學習等。其中邏輯回歸因為算法效率高,能有效處理大規模的數據,在深度學習還沒有流行之前就被廣泛的應用于大型的互聯網公司。

深度學習是自 2012 年由百度首先成立深度學習實驗室之后在國內掀起的人工智能大潮。然而由于深度學習目前還處于蓬勃發展的階段,并且處理大規模數據時對于機器的經費的要求都比較高,因此在很多應用場景下大家選擇的并不是機器學習。GBDT 自問世以來便在諸多機器學習問題上取得了良好的效果,不僅在工業界,而且在 Kaggle 比賽上取得了非常優秀的成績。

針對 GBDT 算法,在學術界和工業界有許多開源的算法包。著名的包括 University of Washington 的陳天奇開發的 XGBoost ,微軟的 LightGBM ,還有 Yandex 公司開發的 CatBoost 。XGBoost 被廣泛的應用于工業界,LightGBM 有效的提升了 GBDT的計算效率, 而 Yandex 的 CatBoost 號稱是比 XGBoost 和 LightGBM 在算法準確率等方面表現更為優秀的算法。本文主要通過介紹 Yandex 2017 年發表的一篇題為 CatBoost: Unbiased Boosting with Categorical Features 的論文給大家介紹 CatBoost 算法。

CatBoost 算法的設計初衷是為了更好的處理 GBDT 特征中的 categorical features 。在處理 GBDT 特征中的 categorical features 的時候,最簡單的方法是用 categorical feature 對應的標簽的平均值來替換。在決策樹中,標簽平均值將作為節點分裂的標準。這種方法被稱為 Greedy Target-based Statistics , 簡稱 Greedy TBS,用公式來表達就是: 

CatBoost: 比XGBoost更優秀的GBDT算法

這種方法有一個顯而易見的缺陷,就是通常特征比標簽包含更多的信息,如果強行用標簽的平均值來表示特征的話,當訓練數據集和測試數據集數據結構和分布不一樣的時候會出問題(條件偏移問題)。

一個標準的改進 Greedy TBS的方式是添加先驗分布項,這樣可以減少噪聲和低頻率數據對于數據分布的影響:

CatBoost: 比XGBoost更優秀的GBDT算法 

其中 P 是添加的先驗項,a 通常是大于 0 的權重系數。

為了解決條件遷移問題,常用的方法例如可以將數據集合分為兩部分,在***個部分上對數據的特征進行類似 Greedy TBS 的處理,而在第二個數據集合上進行訓練。CatBoost 參考了在線學習的方法,首先對訓練書進行了隨機的重排列,然后選擇   作為訓練樣本,而整個的數據集合做為測試樣本。

類似的,在GBDT的模型訓練階段,同樣會因為訓練數據與測試數據分布不同的問題產生預測偏移(Prediction Shift)和殘差偏移(Residual Shift)的問題。為了解決相應的問題,CatBoost 作者采用了排序提升(Ordered Boosting)的方式,首先對所有的數據進行隨機排列,然后在計算第 i 步殘差時候的模型只利用了隨機排列中前 i-1 個樣本。

CatBoost 針對于原始 GBDT 的各種偏移問題進行改進之后的算法偽代碼如下:

CatBoost: 比XGBoost更優秀的GBDT算法 

CatBoost: 比XGBoost更優秀的GBDT算法 

CatBoost: 比XGBoost更優秀的GBDT算法

CatBoost 和 XGBoost 以及 LightGBM 在一些知名的數據集合上的測試效果如下表所示,評測指標為 Logloss 和 Zero-one Loss 。

CatBoost: 比XGBoost更優秀的GBDT算法

CatBoost 的基本原理是解決原始 GBDT 中的各種數據偏移問題。在一些開源的機器學習和數據挖掘的算法包里有現成的模塊可以調用。CatBoost 自從 2017 年被 Yandex ***提出以來得到了廣泛的關注。希望本文的介紹能給大家帶來幫助。

汪昊,恒昌利通大數據部負責人/資深架構師,美國猶他大學本科/碩士,對外經貿大學在職MBA。曾在百度,新浪,網易,豆瓣等公司有多年的研發和技術管理經驗,擅長機器學習,大數據,推薦系統,社交網絡分析等技術。在 TVCG 和 ASONAM 等國際會議和期刊發表論文 8 篇。本科畢業論文獲國際會議 IEEE SMI 2008 ***論文獎。

[[242116]]

【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】

責任編輯:龐桂玉 來源: 51CTO
相關推薦

2022-03-16 17:01:35

React18并發的React組件render

2018-05-07 08:54:34

GolangPython語言

2021-10-29 19:00:30

監控系統數據庫

2015-08-03 09:09:20

程序員腦子快

2023-10-08 16:22:37

XGBoost算法

2012-05-03 11:12:28

HP激光打印機

2013-06-07 10:07:28

開發者優秀開發者

2016-03-28 10:01:45

優秀程序員關鍵閱讀

2020-08-18 17:26:11

機器學習XGBoost人工智能

2021-06-17 13:42:40

AI 數據機器學習

2021-09-18 10:59:08

大數據家庭成績

2023-08-25 13:18:35

思維訓練

2020-02-05 14:30:36

MacWindows 10Linux

2017-10-22 16:16:03

程序員編程代碼

2016-03-04 11:06:20

更優秀程序員

2012-12-28 09:58:50

程序員代碼編程

2021-08-16 15:42:37

Windows 11Snipping To截圖

2019-09-16 08:33:50

TCP協議UDP

2014-08-05 09:15:55

程序員

2014-08-08 10:24:37

程序員
點贊
收藏

51CTO技術棧公眾號

亚洲女成人图区| 蜜桃免费在线视频| 精品国产午夜| 在线观看亚洲区| 色戒汤唯在线| 欧美一区二区黄色| 第三区美女视频在线| 亚洲国产综合人成综合网站| aaaaaa亚洲| 91免费小视频| 欧美日韩国产精品激情在线播放| 精品一区在线看| 日韩精品一线二线三线| 久久最新视频| 亚洲一区二区在线观| 蜜桃视频在线观看一区| 日韩一区二区电影在线观看| 日韩电影一二三区| 日韩电影免费观| 亚洲制服欧美中文字幕中文字幕| 国内外成人免费激情在线视频| 国产69精品久久| 欧美疯狂xxxx大交乱88av| 91综合久久爱com| 成人区精品一区二区| 大桥未久在线视频| 欧美精品xxxxbbbb| 第一视频专区在线| 亚洲男人的天堂在线播放| 视频一区欧美日韩| wwwwww.欧美系列| 国产福利在线免费| 99久久这里只有精品| 欧美女人性生活视频| 一本久道久久综合中文字幕| 怡红院在线观看| 2018国产精品视频| 亚洲热av色在线播放| 久久久久久久久久av| 日本免费精品| 亚洲国产精品一区在线观看不卡 | 日本激情一区| 日本国产精品视频| 亚洲一区中文| 日本欧美亚洲| 一二三四社区欧美黄| 毛片在线不卡| 久久人人爽人人爽人人片亚洲| 亚洲国产三级网| 久久er热在这里只有精品66| 久久狠狠亚洲综合| 综合网日日天干夜夜久久| 一区二区三区在线资源| 国产一区二区三区在线看麻豆| 4444在线观看| 国产精品视频一二| 男人久久精品| 久久都是精品| 色大师av一区二区三区| 99re热这里只有精品免费视频| 九色porny自拍| 色综合咪咪久久网| 成人免费网站在线观看| 免费在线观看成人| 天天色综合4| 国产一级久久| 明星裸体视频一区二区| 91香蕉视频在线| 夜色激情一区二区| 国产福利成人在线| 亚洲精品国模| 日韩一级完整毛片| 超级碰碰久久| 久久先锋资源网| 欧美巨乳在线观看| 亚洲精品中文字幕99999| 欧美性猛交久久久乱大交小说| 免费网站在线观看人| 国产精品污污网站在线观看 | 美女毛片在线看| 看黄网站在线观看| 青青草国产成人a∨下载安卓| 日韩三区免费| av丝袜在线| 狠狠久久亚洲欧美| 国产精一品亚洲二区在线视频| 欧美videos大乳护士334| 日韩写真欧美这视频| 中文字幕精品www乱入免费视频| 久久精品人人做人人爽人人| 九九热视频这里只有精品| 最新中文字幕在线视频| heyzo一区| xxxx影院| 91资源在线观看| 亚洲人成网站精品片在线观看| 久久精品国产精品青草色艺 | 欧美整片在线观看| 国产一区二区美女诱惑| 三级黄视频在线观看| 欧美黄色性视频| 成人视屏免费看| 波多野结衣精品| 国产精品三区四区| 婷婷综合在线观看| 天堂在线精品| 午夜免费高清视频| 最近2019年好看中文字幕视频| 久久久久久婷| 国产天堂素人系列在线视频| 国产成人精彩在线视频九色| 国产清纯白嫩初高生在线观看91 | 4438x成人网最大色成网站| 国内精品久久久久久99蜜桃| 国产日产欧美视频| 亚洲视频axxx| 天堂精品中文字幕在线| 91caoporn在线| 成人在线一区二区| 亚洲国产一区二区a毛片| 久久综合五月婷婷| 超碰在线97免费| 欧美日韩成人在线视频| 久久久蜜桃精品| 久久久久久爱| 国产日韩成人内射视频 | 国产精品专区h在线观看| 亚洲欧美另类小说| 综合色就爱涩涩涩综合婷婷| 成人免费视频77777| 欧美极品美女电影一区| 日本一二三不卡| 巨人精品**| 特级毛片在线观看| 成人久久精品视频| 在线中文字幕一区二区| 国产欧美一级| 中国av在线播放| 一区二区三区日韩视频| 国产一区二区三区日韩欧美| 岛国精品在线观看| 精品中文在线| www.99色| 国产在线一区二区三区| 色悠悠久久综合| 午夜综合激情| 国模精品视频| 成人一区二区免费视频| 欧美高清第一页| 午夜伊人狠狠久久| 亚洲综合激情| 欧美日韩美女| 成年美女网站| 成人欧美一区二区| 亚洲第一中文字幕在线观看| av在线一区二区| 精品福利久久久| 麻豆影院在线| cao在线观看| 欧美综合在线观看| 欧美日韩精品福利| 激情综合网天天干| 精品麻豆剧传媒av国产九九九| 日本福利视频| 日韩久久久久久久| 精品中文字幕视频| 日本国产一区二区| 国产一区在线观看麻豆| 成人涩涩网站| 91免费在线| 又粗又黑又大的吊av| 国产精品爽黄69| 精品日本一线二线三线不卡| 26uuu久久综合| 综合日韩在线| 成人免费看视频网站| 久久久久久77777| 欧美亚洲爱爱另类综合| 久久视频在线免费观看| 日本乱码高清不卡字幕| 99久久精品国产网站| 欧美电影免费| 性欧美videohd高精| 动漫h在线观看| 特色特色大片在线| 国产精品自拍偷拍| 亚洲欧美日韩在线一区| 亚洲一区二区三区激情| 久久成人免费网| 成人久久久久| 日本在线一区二区| 95在线视频| sihu成人| 黄色一级片网址| 91亚洲国产成人久久精品网站| 少妇久久久久久| 欧美剧情电影在线观看完整版免费励志电影| 91美女片黄在线观看| 天堂久久一区二区三区| 免费成人av|