国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

機器學習:不要低估樹模型的威力

人工智能 機器學習
樹模型和神經網絡,像一枚硬幣的兩面。在某些情況下,樹模型的性能甚至優(yōu)于神經網絡。

?由于神經網絡的復雜性,它們常常被認為是解決所有機器學習問題的「圣杯」。而另一方面,基于樹的方法并未得到同等重視,主要原因在于這類算法看起來很簡單。然而,這兩種算法看似不同,卻像一枚硬幣的正反面,都很重要。

樹模型 VS 神經網絡

基于樹的方法通常優(yōu)于神經網絡。本質上,將基于樹的方法和基于神經網絡的方法放在同一個類別中是因為,它們都通過逐步解構來處理問題,而不是像支持向量機或 Logistic 回歸那樣通過復雜邊界來分割整個數據集。

很明顯,基于樹的方法沿著不同的特征逐步分割特征空間,以優(yōu)化信息增益。不那么明顯的是,神經網絡也以類似的方式處理任務。每個神經元監(jiān)視特征空間的一個特定部分(存在多種重疊)。當輸入進入該空間時,某些神經元就會被激活。?

神經網絡以概率的視角看待這種逐段模型擬合 (piece-by-piece model fitting),而基于樹的方法則采用確定性的視角。不管怎樣,這兩者的性能都依賴于模型的深度,因為它們的組件與特征空間的各個部分存在關聯(lián)。

包含太多組件的模型(對于樹模型而言是節(jié)點,對于神經網絡則是神經元)會過擬合,而組件太少的模型根本無法給出有意義的預測。(二者最開始都是記憶數據點,而不是學習泛化。)

要想更直觀地了解神經網絡是如何分割特征空間的,可閱讀這篇介紹通用近似定理的文章:https://medium.com/analytics-vidhya/you-dont-understand-neural-networks-until-you-understand-the-universal-approximation-theory-85b3e7677126。

雖然決策樹有許多強大的變體,如隨機森林、梯度提升、AdaBoost 和深度森林,但一般來說,基于樹的方法本質上是神經網絡的簡化版本。

基于樹的方法通過垂直線和水平線逐段解決問題,以最小化熵(優(yōu)化器和損失)。神經網絡通過激活函數來逐段解決問題。

基于樹的方法是確定性的,而不是概率性的。這帶來了一些不錯的簡化,如自動特征選擇。

決策樹中被激活的條件節(jié)點類似于神經網絡中被激活的神經元(信息流)。

神經網絡通過擬合參數對輸入進行變換,間接指導后續(xù)神經元的激活。決策樹則顯式地擬合參數來指導信息流。(這是確定性與概率性相對應的結果。)

圖片

信息在兩個模型中的流動相似,只是在樹模型中的流動方式更簡單。

樹模型的 1 和 0 選擇 VS 神經網絡的概率選擇

當然,這是一個抽象的結論,甚至可能是有爭議的。誠然,建立這種聯(lián)系有許多障礙。不管怎樣,這是理解基于樹的方法何時以及為什么優(yōu)于神經網絡的重要部分。

對于決策樹而言,處理表格或表格形式的結構化數據是很自然的。大多數人都同意用神經網絡執(zhí)行表格數據的回歸和預測屬于大材小用,所以這里做了一些簡化。選擇 1 和 0,而不是概率,是這兩種算法之間差異的主要根源。因此,基于樹的方法可成功應用于不需要概率的情況,如結構化數據。

例如,基于樹的方法在 MNIST 數據集上表現(xiàn)出很好的性能,因為每個數字都有幾個基本特征。不需要計算概率,這個問題也不是很復雜,這就是為什么設計良好的樹集成模型性能可以媲美現(xiàn)代卷積神經網絡,甚至更好。

通常,人們傾向于說「基于樹的方法只是記住了規(guī)則」,這種說法是對的。神經網絡也是一樣,只不過它能記住更復雜的、基于概率的規(guī)則。神經網絡并非顯式地對 x>3 這樣的條件給出真 / 假的預測,而是將輸入放大到一個很高的值,從而得到 sigmoid 值 1 或生成連續(xù)表達式。

另一方面,由于神經網絡非常復雜,因此使用它們可以做很多事情。卷積層和循環(huán)層都是神經網絡的杰出變體,因為它們處理的數據往往需要概率計算的細微差別。

很少有圖像可以用 1 和 0 建模。決策樹值不能處理具有許多中間值(例如 0.5)的數據集,這就是它在 MNIST 數據集上表現(xiàn)很好的原因,在 MNIST 中,像素值幾乎都是黑色或白色,但其他數據集的像素值不是(例如 ImageNet)。類似地,文本有太多的信息和太多的異常,無法用確定性的術語來表達。

這也是神經網絡主要用于這些領域的原因,也是神經網絡研究在早期(21 世紀初之前)停滯不前的原因,當時無法獲得大量圖像和文本數據。神經網絡的其他常見用途僅限于大規(guī)模預測,比如 YouTube 視頻推薦算法,其規(guī)模非常大,必須用到概率。

任何公司的數據科學團隊可能都會使用基于樹的模型,而不是神經網絡,除非他們正在建造一個重型應用,比如模糊 Zoom 視頻的背景。但在日常業(yè)務分類任務上,基于樹的方法因其確定性特質,使這些任務變得輕量級,其方法與神經網絡相同。

在許多實際情況下,確定性建模比概率建模更自然。例如,預測用戶是否從某電商網站購買一樣商品,這時樹模型是很好的選擇,因為用戶天然地遵循基于規(guī)則的決策過程。用戶的決策過程可能看起來像這樣:

  1. 我以前在這個平臺上有過愉快的購物經歷嗎?如果有,繼續(xù)。
  2. 我現(xiàn)在需要這件商品嗎?(例如,冬天我應該買太陽鏡和泳褲嗎?)如果是,繼續(xù)。
  3. 根據我的用戶統(tǒng)計信息,這是我有興趣購買的產品嗎?如果是,繼續(xù)。
  4. 這個東西太貴嗎?如果沒有,繼續(xù)。
  5. 其他顧客對這個產品的評價是否足夠高,讓我可以放心地購買它?如果是,繼續(xù)。

一般來說,人類遵循基于規(guī)則和結構化的決策過程。在這些情況下,概率建模是不必要的。

結論

  • 最好將基于樹的方法視為神經網絡的縮小版本,以更簡單的方式進行特征分類、優(yōu)化、信息流傳遞等。
  • 基于樹的方法和神經網絡方法在用途的主要區(qū)別在于確定性(0/1)與概率性數據結構。使用確定性模型可以更好地對結構化(表格)數據進行建模。
  • 不要低估樹方法的威力。?
責任編輯:華軒 來源: 小白學視覺
相關推薦

2019-05-30 09:46:14

2019-04-23 10:30:23

機器學習人工智能計算機

2017-10-18 14:11:20

機器學習決策樹隨機森林

2012-03-05 11:23:52

2019-10-22 10:12:45

機器學習模型人工智能

2022-04-13 18:12:37

TypeScriptPython開發(fā)

2017-11-21 13:00:20

機器學習決策樹可視化

2017-08-25 14:05:01

機器學習算法模型

2017-07-13 10:12:58

機器學習

2020-09-22 14:59:52

機器學習人工智能計算機

2022-07-14 10:33:20

XGBoost機器學習

2024-02-19 09:38:58

2022-06-25 21:32:45

AI模型

2022-12-21 14:39:35

機器學習案發(fā)決策樹

2017-05-10 15:41:29

機器學習算法數據

2022-07-18 11:35:01

物聯(lián)網智慧城市數據

2020-05-15 07:47:01

機器學習模型漂移模型

2021-01-25 09:00:00

機器學習人工智能算法

2014-07-01 09:30:54

機器學習

2020-07-13 14:50:51

機器學習模型算法
點贊
收藏

51CTO技術棧公眾號

91精品xxx在线观看| 国产精品蜜月aⅴ在线| 久久国产精品第一页| 色偷偷噜噜噜亚洲男人的天堂| 国产xxxxx18| 国产精品1区2区3区| 亚洲伊人第一页| 精品久久ai| 在线欧美激情| 日韩av123| 日p在线观看| 欧美激情综合网| 国产综合网站| 久久精品久久久久| 秋霞影院午夜丰满少妇在线视频| aaa亚洲精品| 欧美精品一区二区视频 | 免费在线观看一区二区| 亚洲婷婷影院| 欧美www在线| 亚洲欧洲日本韩国| 7777女厕盗摄久久久| 午夜影院免费| 国产日韩精品一区| 黄色大片中文字幕| 国产在线精品视频| 日韩欧美第二区在线观看| 欧美 日韩 国产 一区| 国产91精品不卡视频| 四虎国产精品永久在线国在线| 日韩av在线网站| 在线中文字幕-区二区三区四区| 福利微拍一区二区| 最色在线观看| 狠狠久久五月精品中文字幕| 国产毛片视频| √…a在线天堂一区| 亚洲综合色在线观看| 99久久精品国产一区二区三区 | 中文有码在线观看| 亚洲激情六月丁香| 羞羞视频立即看| 亚洲同性同志一二三专区| 国产成人a亚洲精v品无码| 成人夜色视频网站在线观看| 日韩在线视频在线| 国产最新精品免费| 可以免费看的黄色网址| 国产精品主播直播| 一区中文字幕在线观看| 黑人精品欧美一区二区蜜桃| 天天爱天天做天天操| 国产一区在线看| 女人帮男人橹视频播放| 国产酒店精品激情| 男女高潮又爽又黄又无遮挡| 久久精品一区二区三区不卡牛牛 | 91久久国产自产拍夜夜嗨| 国产精品久久久久一区二区三区厕所 | 亚洲视频高清| 久久国产精品亚洲va麻豆| 一本久道久久综合狠狠爱| 麻豆精品视频| 国产麻豆欧美日韩一区| 女人扒开屁股爽桶30分钟| 中文字幕一区二区三区视频| 91免费版在线观看| 欧美一级黄色大片| 久久久加勒比| 国产精品吹潮在线观看| 99精品国产在热久久婷婷| 日韩最新中文字幕| 国产精品久久久久婷婷二区次| 日本视频在线观看一区二区三区 | 日本十八禁视频无遮挡| 国产亚洲欧美一区在线观看| 最新av电影| 欧美大片拔萝卜| 国产精品亚洲综合在线观看| 97在线免费观看| 亚洲香蕉网站| 青青草精品视频在线| 艳妇臀荡乳欲伦亚洲一区| 国产欧美黑人| 精品少妇一区二区30p| 欧美va久久久噜噜噜久久| 中文字幕欧美日韩一区二区三区 | 女囚岛在线观看| 蜜臀av性久久久久蜜臀aⅴ流畅 | 国产九一精品| 国产精品久在线观看| 亚洲毛片av在线| 亚洲精品666| xxav视频| 日本最黄视频| 91免费国产网站| 国产一区二区三区综合| а√天堂资源地址在线下载| 亚洲伦理在线精品| 欧美极品一区二区| 国产米奇在线777精品观看| 精品伊人久久大线蕉色首页| 精品在线一区二区三区| 91香蕉视频污版| 欧美亚洲尤物久久| 国产美女精品视频免费播放软件| 国产区精品视频| 久久精品国产**网站演员| 妞干网2018| 制服丝袜亚洲精品中文字幕| 日韩精品第二页| 国产欧美日韩伦理| 蜜桃999成人看片在线观看| 色婷婷亚洲精品| 风间由美性色一区二区三区四区| 国产91精品网站| 1204国产成人精品视频| 成人观看高清在线观看免费| 神马影视一区二区| 精品国产区在线| 日本道色综合久久| www在线看| 97视频在线观看亚洲| 婷婷五月色综合香五月| 国产精品h在线观看| 国产精品亚洲片在线播放| 欧美极品视频一区二区三区| 伊人久久久大香线蕉综合直播| 一卡二卡3卡四卡高清精品视频| 色综合久久66| 久久99影视| 88xx成人免费观看视频库 | 亚洲国产精品久久久久秋霞影院| 日韩av黄色| 一级黄色av| 欧美韩国日本在线观看| 日本一级黄视频| 欧美日韩亚洲国产综合| 色先锋久久影院av| 成年人网站大全| 国产亚洲激情视频在线| 日本不卡一二三区黄网| 在线日本视频| 99在线观看视频网站| 亚洲成人一区在线| 蜜桃成人av| 97影院理论午夜| 欧美高清性猛交| 成人美女视频在线看| 美女搞黄视频在线观看| 日韩欧美一区二区在线观看| 91久久免费观看| 亚洲网站啪啪| 蜜桃av在线免费观看| 国产欧美欧洲| 欧美日韩aaaaaa| 久久综合影视| а_天堂中文在线| 影音先锋欧美资源| 亚洲欧美日韩一区二区在线| 国产麻豆视频一区二区| 亚洲一二三四| 日本男女交配视频| 中文字幕亚洲欧美日韩高清| 91一区在线观看| 精品国产导航| 91短视频在线观看| 91人人爽人人爽人人精88v| 亚洲aaa精品| 欧美一区影院| a视频在线播放| 青青在线免费视频| 日韩在线观看免费| 久久精品人人做人人综合 | 777色狠狠一区二区三区| 最新国产拍偷乱拍精品| 黄色网址在线免费播放| 亚洲二区三区四区| 日韩中文字幕视频在线观看| 国产欧美一区二区精品性色超碰| 人妖一区二区三区| 你懂的好爽在线观看| 色女人综合av| 精品国模在线视频| 亚洲午夜一二三区视频| 99精品国产99久久久久久福利| 波多野结衣中文在线| 国产h视频在线播放| 欧美自拍大量在线观看| 欧洲av在线精品| 久久99精品久久久久久国产越南| 亚洲最大网站| 成人漫画网站免费| 国内精品久久国产| 久久精品国产一区| 日韩欧美在线免费观看| 国产最新精品精品你懂的| 久久国产精品免费精品3p| 超碰免费在线| 毛片在线播放视频|