国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

經驗之談:如何為你的機器學習問題選擇合適的算法?

開發 開發工具 算法
隨著機器學習越來越流行,也出現了越來越多能很好地處理任務的算法。本文介紹了如何依靠已有的方法(模型選擇和超參數調節)去指導你更好地去選擇算法。

隨著機器學習越來越流行,也出現了越來越多能很好地處理任務的算法。但是,你不可能預先知道哪個算法對你的問題是***的。如果你有足夠的時間,你可以嘗試所有的算法來找出***的算法。本文介紹了如何依靠已有的方法(模型選擇和超參數調節)去指導你更好地去選擇算法。本文作者為華盛頓大學 eScience Institute 和 Institute for Neuroengineering 的數據科學博士后 Michael Beyeler。

如何為你的機器學習問題選擇合適的算法?

步驟一:了解基本知識

在我們深入學習之前,我們先重溫基礎知識。具體來說,我們應該知道機器學習里面三個主要類別:監督學習,無監督學習和強化學習。

機器學習里面三個主要類別

1. 在監督學習(supervised learning)中,每個數據點都會獲得標注,如類別標簽或與數值相關的標簽。一個類別標簽的例子:將圖片分類為「貓」或「狗」;數值標簽的例子如:預測一輛二手車的售價。監督學習的目的是通過學習許多有標簽的樣本,然后對新的數據做出預測。例如,準確識別新照片上的動物(分類)或者預測二手車的售價(回歸)。

2. 在無監督性學習(unsupervised learning)中,數據點沒有相關的標簽。相反,無監督學習算法的目標是以某種方式組織數據,然后找出數據中存在的內在結構。這包括將數據進行聚類,或者找到更簡單的方式處理復雜數據,使復雜數據看起來更簡單。

3. 在強化學習(reinforcement learning)中,算法會針對每個數據點來做出決策(下一步該做什么)。這種技術在機器人學中很常用。傳感器一次從外界讀取一個數據點,算法必須決定機器人下一步該做什么。強化學習也適合用于物聯網應用。在這里,學習算法將收到獎勵信號,表明所做決定的好壞,為了獲得***的獎勵,算法必須修改相應的策略。

步驟二:對問題進行分類

接下來,我們要對問題進行分類,這包含兩個過程:

1. 根據輸入數據分類:如果我們的數據有標簽,這就是一個監督學習問題;如果數據沒有標簽而且我們想找出數據的內在結構,那這就是無監督學習;如果我們想通過與環境交互來優化目標函數,這是強化學習。

2. 根據輸出結果分類:如果模型輸出結果是一個數值,這是回歸問題;如果輸出結果是一個類別,這是分類問題;如果輸出結果是一組輸入數據,那這是聚類問題。

就是這么簡單!

更一般地說,我們可以詢問我們自己:我們的算法要實現什么目標,然后以此來找到正確的算法類別。

算法類別

上面的描述包括了幾個我們還沒有提到的專業術語:

  • 分類(classification):當使用數據來預測類別時,監督學習也被叫做分類。比如將含有「貓」或「狗」的圖片識別出來,分類為「貓」或「狗」,這就是二分類問題(two-class or binomial classification)。當存在更多類別時(例如預測下一屆諾貝爾物理學家的獲得者是誰),這就是所謂的多分類問題(multi-class classification)。
  • 回歸(regression):當要預測數值時(比如預測股價),監督學習也被稱為回歸。
  • 聚類(clustering):聚類或聚類分析(cluster analysis)是無監督學習中最常見的方法之一。聚類是將一組對象以某種方式分組,使得同一組中的數據比不同組的數據有更多的相似性。
  • 異常檢測(Anomaly detection):有時我們需要找出數據點中的異常點。例如,在欺詐檢測中,任何極不尋常的信用卡消費都是可疑的;欺詐具有大量不同的形式,而訓練樣本又非常少,使得我們不可能完全了解欺詐活動應該是什么樣。異常檢測所采取的方法就是了解正常情況下的表現行為(使用非欺詐交易的歷史數據),并識別出顯著不同的表現行為。

步驟三:尋找可用的算法

現在我們已經將問題進行了分類,我們就可以使用我們所掌握的工具來識別出適當且實用的算法。

Microsoft Azure 創建了一個方便的算法列表,其展示了哪些算法可用于哪種類別的問題。雖然該表單是針對 Azure 軟件定制的,但它具有普遍的適用性(該表單的 PDF 版本可查閱 http://suo.im/3Ss2zW ):

Microsoft Azure 創建了一個方便的算法列表

一些值得注意的算法如下:

1. 分類:

  • 支持向量機(SVM)可用于找到盡可能寬的分類的邊界。當兩個分類不能被清楚地分開時,該算法會找到其所能找到的***邊界。其真正的亮點在于處理特征密集的數據,比如文本或者基因組(特征數量> 100)。在這些情況下,除了僅需要適量的記憶外,支持向量機(SVM)能夠比其它大多數算法更快且更少過擬合地進行分類。
  • 人工神經網絡是涵蓋二分類、多分類和回歸問題的腦啟發式學習算法。它們有***的種類,包括感知器和深度學習。它們需要很長時間來訓練,但已知其在多種應用領域都實現了當前***的表現。
  • logistic 回歸:即便名字中有著「回歸」,但 logistic 回歸實際上是一種可用于二分類和多分類問題的強大工具。它快速且簡單。事實上,它使用「S」形曲線而非直線,所以它自然適合用于數據分組。logistic 回歸可以給出線性分類邊界,所以如果你要使用它,你一定要確保你能接受線性的近似。
  • 決策樹和隨機森林:決策森林(decision forests)(回歸、二分類、多分類),決策叢林(decision jungles)(二分類和多分類)和提升決策樹(boosted decision trees)(回歸和二分類)都基于決策樹。這是一個基本的機器學習概念。決策樹有許多不同的變體,但它們都在做同樣的事情—將特征空間(feature space)細分為具有大致相同標簽的區域。這些區域可以是一致的類別或者恒定值,具體取決于你進行的是分類還是回歸。

2. 回歸:

  • 線性回歸是將一條線(或平面、或超平面)擬合到一個數據集上。這是一種主要的工具,簡單且快速,但對于一些問題而言,它可能過于簡單。
  • 貝葉斯線性回歸有著非常理想的特性:它可以避免過擬合。貝葉斯方法通過事先對答案的可能分布做出一些假設來做到這一點。這種方法的另一個副產品是它們具有非常少的參數。
  • 提升決策樹回歸(Boosted decision tree regression):如上所述,提升決策樹(回歸和二分類)均基于決策樹,并通過將特征空間細分為具有大致相同標簽的區域發揮效用。提升決策樹通過限制其可以細分的次數以及每個區域中所允許的最少數據點來避免過擬合。該算法會構造一個樹的序列,其中每棵樹都會學習彌補之前的樹留下來的誤差。這能得到一個會使用大量的內存的非常精確的學習器。

3. 聚類:

  • 層次聚類(Hierarchical Clustering)的目標是構建聚類的層次結構,它有兩種形式。聚集聚類(agglomerative clustering)是一種「自下而上」的方法,其中每個觀察(observation)在其自己的聚類中開始,隨著其在層次中向上移動,成對的聚類會進行融合。分裂聚類(divisive clustering)則是一種「自上而下」的方法,其中所有的觀察都從一個聚類開始,并且會隨觀察向下的層次移動而遞歸式地分裂。整體而言,這里的融合和分裂是以一種激進的方式確定的。層次聚類的結果通常表示成樹狀圖(dendrogram)的形式。
  • k-均值聚類(k-means clustering)的目標是將 n 組觀測值分為 k 個聚類,其中每個觀測值都屬于其接近的那個均值的聚類——這些均值被用作這些聚類的原型。這會將數據空間分割成 Voronoi 單元。

4. 異常檢測:

  • k 最近鄰(k-nearest neighbors / k-NN)是用于分類和回歸的非參數方法。在這兩種情況下,輸入都是由特征空間中與 k 最接近的訓練樣本組成的。在 k-NN 分類中,輸出是一個類成員。對象通過其 k 最近鄰的多數投票來分類,其中對象被分配給 k 最近鄰中最常見的類(k 為一正整數,通常較小)。在 k-NN 回歸中,輸出為對象的屬性值。該值為其 k 最近鄰值的平均值。
  • 單類支持向量機(One-class SVM):使用了非線性支持向量機的一個巧妙的擴展,單類支持向量機可以描繪一個嚴格概述整個數據集的邊界。遠在邊界之外的任何新數據點都是非正常的,值得注意。

步驟四:實現所有適用的算法

對于任何給定的問題,通常有多種候選算法可以完成這項工作。那么我們如何知道選擇哪一個呢?通常,這個問題的答案并不簡單,所以我們必須反復試驗。

原型開發***分兩步完成。在***步中,我們希望通過最小量的特征工程快速且粗糙地實現一些算法。在這個階段,我們主要的目標是大概了解哪個算法表現得更好。這個步驟有點像招聘:我們會盡可能地尋找可以縮短我們候選算法列表的理由。

一旦我們將列表減少至幾個候選算法,真正的原型開發開始了。理想情況下,我們會建立一個機器學習流程,使用一組經過仔細選擇的評估標準來比較每個算法在數據集上的表現。在這個階段,我們只處理一小部分的算法,所以我們可以把注意力轉到真正神奇的地方:特征工程。

步驟五:特征工程

或許比選擇算法更重要的是正確選擇表示數據的特征。從上面的列表中選擇合適的算法是相對簡單直接的,然而特征工程卻更像是一門藝術。

主要問題在于我們試圖分類的數據在特征空間的描述極少。利如,用像素的灰度值來預測圖片通常是不佳的選擇;相反,我們需要找到能提高信噪比的數據變換。如果沒有這些數據轉換,我們的任務可能無法解決。利如,在方向梯度直方圖(HOG)出現之前,復雜的視覺任務(像行人檢測或面部檢測)都是很難做到的。

雖然大多數特征的有效性需要靠實驗來評估,但是了解常見的選取數據特征的方法是很有幫助的。這里有幾個較好的方法:

  • 主成分分析(PCA):一種線性降維方法,可以找出包含信息量較高的特征主成分,可以解釋數據中的大多數方差。
  • 尺度不變特征變換(SIFT):計算機視覺領域中的一種有專利的算法,用以檢測和描述圖片的局部特征。它有一個開源的替代方法 ORB(Oriented FAST and rotated BRIEF)。
  • 加速穩健特征(SURF):SIFT 的更穩健版本,有專利。
  • 方向梯度直方圖(HOG):一種特征描述方法,在計算機視覺中用于計數一張圖像中局部部分的梯度方向的 occurrence。

更多算法請參考:https://en.wikipedia.org/wiki/Visual_descriptor

當然,你也可以想出你自己的特征描述方法。如果你有幾個候選方法,你可以使用封裝好的方法進行智能的特征選擇。

1. 前向搜索:

  • 最開始不選取任何特征。
  • 然后選擇最相關的特征,將這個特征加入到已有特征;計算模型的交叉驗證誤差,重復選取其它所有候選特征;***,選取能使你交叉驗證誤差最小特征,并放入已選擇的特征之中。
  • 重復,直到達到期望數量的特征為止!

2. 反向搜索:

  • 從所有特征開始。
  • 先移除最不相關的特征,然后計算模型的交叉驗證誤差;對其它所有候選特征,重復這一過程;***,移除使交叉驗證誤差***的候選特征。
  • 重復,直到達到期望數量的特征為止!
  • 使用交叉驗證的準則來移除和增加特征!

步驟六:超參數優化

***,你可能想優化算法的超參數。例如,主成分分析中的主成分個數,k 近鄰算法的參數 k,或者是神經網絡中的層數和學習速率。***的方法是使用交叉驗證來選擇。

一旦你運用了上述所有方法,你將有很好的機會創造出強大的機器學習系統。但是,你可能也猜到了,成敗在于細節,你可能不得不反復實驗,***才能走向成功。

原文:http://www.askaswiss.com/2017/02/how-to-choose-right-algorithm-for-your-machine-learning-problem.html

【本文是51CTO專欄機構機器之心的原創譯文,微信公眾號“機器之心( id: almosthuman2014)”】

 

戳這里,看該作者更多好文

責任編輯:趙寧寧 來源: 51CTO專欄
相關推薦

2009-12-23 10:07:57

學習WPF

2009-11-09 17:06:38

WCF選擇綁定

2010-04-30 14:31:58

Unix系統

2020-01-10 18:25:00

Go語言JavaScript編程語言

2024-05-23 16:48:42

機器學習算法人工智能

2010-08-09 14:28:04

職業生涯

2022-03-17 17:08:05

機器學習算法類型

2012-05-23 09:43:59

Linux升級經驗

2017-05-25 13:37:46

機器學習算法神經網絡

2017-05-25 11:14:21

機器學習算法神經網絡

2020-05-26 18:35:00

機器學習人工智能AI

2010-07-26 15:36:59

CCNP

2012-07-06 15:31:29

Linux系統

2010-04-29 12:09:42

Unix服務器

2023-11-28 12:08:56

機器學習算法人工智能

2009-12-17 18:12:31

Ruby框架應用

2010-05-10 18:18:46

Unix系統

2009-12-09 16:58:03

PHP strtoti

2010-03-02 17:48:35

WCF尋址報頭

2018-08-03 10:30:16

算法回歸機器學習
點贊
收藏

51CTO技術棧公眾號

国产精品三级av在线播放| 91精品91久久久久久| 欧美高清性xxxxhd| 亚洲天天影视| 禁久久精品乱码| 91高清视频免费看| 国产日韩欧美自拍| 免费人成在线观看网站| 伊人久久亚洲美女图片| 欧美一级淫片007| 一区二区免费在线视频| 擼擼色在线看观看免费| 日本不卡一区二区| 欧美一级日韩一级| 中文字幕乱码免费| 91成人短视频在线观看| 久久99精品久久久久久动态图| 精品久久久久久综合日本欧美| 亚洲日本一区二区三区在线不卡| yw193.com尤物在线| 91中文字幕精品永久在线| 亚洲成人综合网站| 国产精品视频入口| 亚洲人体视频| 成人免费视频caoporn| 欧美精品电影在线| aaaaaaa大片免费看| 神马影视一区二区| 制服丝袜av成人在线看| 日本一级淫片演员| 国产亚洲精品美女久久| 福利视频导航一区| 亚洲精品日韩成人| 国产一区二区三区| 色综合久久中文综合久久牛| 自拍偷拍亚洲在线| 精品少妇一区二区三区在线| 久久嫩草精品久久久久| 欧美精品一区二区三区国产精品| 不卡的av中文字幕| 亚洲黑丝一区二区| 欧美一区二区网站| 丰满女人性猛交| 亚洲永久av| 国产精品欧美一区喷水| 国产精品99一区| 中文天堂av| 国产成人久久精品77777最新版本| 色青青草原桃花久久综合| 四色成人av永久网址| 国产69精品久久久久777| 国产精品视频公开费视频| 国产在线88av| 一个色综合网站| 亚洲已满18点击进入在线看片| 日本超碰一区二区| 日日摸夜夜添夜夜添亚洲女人| 色阁综合伊人av| 黄色一级二级三级| 激情婷婷欧美| 国产精品视频自在线| 色999韩欧美国产综合俺来也| 日韩一区二区三区在线观看| 亚洲人成电影| 国产精品国产三级国产aⅴ入口| 亚洲精品少妇一区二区| 亚洲激情婷婷| 国产精品国产三级国产aⅴ浪潮 | 亚洲精品国产精品国产自| 91伦理视频在线观看| 精品日韩美女的视频高清| 白浆爆出在线观看| 欧美国产激情一区二区三区蜜月| 黄色大片在线免费看| 国产精品自拍在线| 久久久久久久久影视| 欧美aⅴ一区二区三区视频| 久久综合色一本| 亚洲美女91| 欧美精品123| 亚洲欧美日韩国产综合精品二区| 国产精品一区二区三区四区五区 | 亚洲天堂第一区| 久久电影网电视剧免费观看| 九九九九精品九九九九| 免费看黄裸体一级大秀欧美| 永久免费在线看片视频| 国产毛片精品国产一区二区三区| www日韩在线观看| 亚洲视频综合在线| 日本一区视频| 欧美一区二区在线播放| 91九色美女在线视频| 日韩精品免费在线| 巨胸喷奶水www久久久| 欧美性视频在线| 99精品久久| 女人帮男人橹视频播放| 综合欧美国产视频二区| 亚洲一级一级97网| 99热在线免费播放| 日韩av一区二| 欧美一二三区| 国产精品一级黄| 欧美性猛交xxx乱久交| 92精品国产成人观看免费| 69国产精品| 亚洲特黄一级片| bdsm精品捆绑chinese女| 7777精品伊人久久久大香线蕉最新版| 黄色成人在线看| 国产成人在线视频播放| 久久精品成人一区二区三区蜜臀 | 久久激情五月激情| 国产精品久久久久av福利动漫| 久久久久久久久国产一区| 欧美激情第6页| 好看的中文字幕在线播放| 欧美日韩一二区| caopen在线视频| 日韩欧美中文字幕公布| 欧美卡一卡二| 亚洲深夜福利网站| 亚洲一区导航| 久久久久久久久电影| 成人涩涩网站| 欧美在线一级va免费观看| 天天躁日日躁成人字幕aⅴ| 91国产在线精品| 亚洲裸色大胆大尺寸艺术写真| 日韩女在线观看| 日本不卡免费一区| 91中文字幕在线观看| 国产一区亚洲| 亚洲午夜精品一区二区三区| 国产成人综合在线播放| 三年中国国语在线播放免费| 中文字幕在线不卡| 中文字幕不卡免费视频| 亚洲国产欧美在线人成| 色av男人的天堂免费在线| 欧美一区欧美二区| 亚洲午夜天堂| 97在线视频免费播放| 欧美gvvideo网站| 日韩av电影免费观看| 国产成人在线免费| 日韩精品视频一二三| 色婷婷综合久久久中文字幕| 欧美巨大xxxx做受沙滩| 亚洲一区av在线播放| 亚洲午夜免费| 国产一区高清视频| 91丨九色丨蝌蚪富婆spa| 国产一级二级在线| 精品视频1区2区3区| 99久久伊人| 国产免费一区二区三区在线观看 | 艳母动漫在线免费观看| 国产欧美亚洲一区| 冲田杏梨av在线| 在线观看欧美黄色| 国产一区二区三区91| 日韩精品免费播放| 亚洲精品在线免费观看视频| 五月久久久综合一区二区小说| 亚洲高清不卡一区| 午夜电影久久久| 精品一区二区三区免费看| 性欧美videosex高清少妇| 一本高清dvd不卡在线观看 | 亚洲乱码av中文一区二区| 在线精品一区二区| 欧美三级午夜理伦三级富婆| 亚洲成人激情图| 蜜臀99久久精品久久久久久软件| 色老头视频在线观看| 国产一区二区精品免费| 正在播放亚洲一区| 亚洲欧洲一区| 高清欧美精品xxxxx在线看| 欧美激情欧美激情| 成人精品高清在线| 偷拍精品精品一区二区三区| 国产 国语对白 露脸| 欧美军同video69gay| 色婷婷狠狠五月综合天色拍| 亚洲欧洲日本精品| 欧美精品在线观看91| 国产女人18水真多18精品一级做| 亚洲码欧美码一区二区三区| 九九九九免费视频| 久久久精品日本| 一级中文字幕一区二区| 欧美区国产区| 懂色aⅴ精品一区二区三区| 好吊色视频988gao在线观看| 久久精品国产69国产精品亚洲| 亚洲天堂精品视频| 青青草精品视频|