国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

LightGBM實戰+隨機搜索調參:準確率96.67%

人工智能
在機器學習領域,梯度提升機(Gradient Boosting Machines, GBMs)是一類強大的集成學習算法,它們通過逐步添加弱學習器(通常是決策樹)來最小化預測誤差,從而構建一個強大的模型。

大家好,我是Peter~

今天給大家分享一下樹模型的經典算法:LightGBM,介紹算法產生的背景、原理和特點,最后提供一個基于LightGBM和隨機搜索調優的案例。

LightGBM算法

在機器學習領域,梯度提升機(Gradient Boosting Machines, GBMs)是一類強大的集成學習算法,它們通過逐步添加弱學習器(通常是決策樹)來最小化預測誤差,從而構建一個強大的模型。

在大數據時代,數據集的規模急劇增長,傳統的GBMs由于其計算和存儲成本高昂,難以有效地擴展。

  • 例如,對于水平分割的決策樹生長策略,雖然可以生成平衡的樹,但往往會導致模型的區分能力下降;而對于基于葉子的生長策略,雖能提高精度卻容易過擬合。
  • 此外,大多數GBM實現在每次迭代中都需要遍歷整個數據集來計算梯度,這在數據量巨大時效率低下。因此,需要一個既能高效處理大規模數據又能保持模型準確度的算法。

為了解決這些問題,Microsoft在2017年推出了LightGBM(Light Gradient Boosting Machine),一個更快速、更低內存消耗、更高性能的梯度提升框架。

官方學習地址:https://lightgbm.readthedocs.io/en/stable/

LightGBM的原理

1、基于直方圖的決策樹算法:

  • 原理:LightGBM使用直方圖優化技術,將連續的特征值離散化成特定的bin(即直方圖的桶),減少了在節點分裂時需要計算的數據量。
  • 優點:這種方法可以在減少內存使用的同時,提高計算速度。
  • 實現細節:對于每個特征,算法都維護一個直方圖,記錄該特征在不同分桶中的統計信息。在進行節點分裂時,可以直接利用這些直方圖的信息,而不需要遍歷所有數據。

2、帶深度限制的leaf-wise樹生長策略:

  • 原理:與傳統的水平分割不同,leaf-wise的生長策略是每次從當前所有葉子節點中選擇分裂收益最大的節點進行分裂。
  • 優點:這種策略可以使得決策樹更加側重于數據中的異常部分,通常可以得到更好的精度。
  • 缺點:容易導致過擬合,特別是當數據中有噪聲時。
  • 改進措施:LightGBM通過設置最大深度限制來防止過擬合。

3、單邊梯度采樣(GOSS):

  • 原理:對于數據集中的大梯度樣本,GOSS算法只保留數據的一部分(通常是大梯度的樣本),減少計算量同時保證不會損失太多的信息。
  • 優點:這種方法可以在不顯著損失精度的情況下加快訓練速度。
  • 應用場景:特別適用于數據傾斜嚴重的情況。

4、互斥特征捆綁(EFB):

  • 原理:EFB是一種減少特征數量,提高計算效率的技術。它將互斥的特征(即從不同時為非零的特征)進行合并,以減少特征維度。
  • 優點:提高了內存的使用效率和訓練速度。
  • 實現細節:通過特征的互斥性,算法可以在同一時間處理更多的特征,從而減少了實際處理的特征數。

5、支持并行和分布式學習:

  • 原理:LightGBM支持多線程學習,能夠利用多個CPU進行并行訓練。
  • 優點:顯著提高了在多核處理器上的訓練速度。
  • 擴展性:還支持分布式學習,可以利用多臺機器共同訓練模型。

6、緩存優化:

  • 原理:優化了對數據的讀取方式,可以使用更多的緩存來加快數據交換的速度。
  • 優點:特別是在大數據集上,緩存優化可以顯著提升性能。

7、支持多種損失函數:

  • 特點:除了常用的回歸和分類的損失函數外,LightGBM還支持自定義損失函數,滿足不同的業務需求。

8、正則化和剪枝:

  • 原理:提供了L1和L2正則化項來控制模型復雜度,避免過擬合。
  • 實現:實現了后向剪枝的策略來進一步防止過擬合。

9、模型解釋性:

  • 特點:由于是基于決策樹的模型,LightGBM具有良好的模型解釋性,可以通過特征重要性等方式理解模型的決策邏輯。

LightGBM的特點

高效性

  • 速度優勢:通過直方圖優化和 leaf-wise 生長策略,LightGBM 在保證精度的同時大幅提升了訓練速度。
  • 內存使用:相比于其他GBM實現,LightGBM 需要的內存更少,這使得它能夠處理更大的數據集。

準確性

  • 最佳優先的生長策略:LightGBM 采用的 leaf-wise 生長策略可以更緊密地擬合數據,通常可以得到比水平分割更好的精度。
  • 避免過擬合的方法:通過設置最大深度限制和后向剪枝,LightGBM 能夠在提升模型精度的同時避免過擬合。

可擴展性

  • 并行和分布式學習:LightGBM 的設計支持多線程和分布式計算,這使得它能夠充分利用現代硬件的計算能力。
  • 多平臺支持:LightGBM 可以在 Windows、macOS 和 Linux 等多種操作系統上運行,支持 Python、R、Java 等多種編程語言。

易用性

  • 參數調優:LightGBM 提供了豐富的參數選項,方便用戶根據具體問題進行調整。
  • 預訓練模型:用戶可以從預訓練的模型開始,加速自己的建模過程。
  • 模型解釋工具:LightGBM 提供了特征重要性評估工具,幫助用戶理解模型的決策過程。

導入庫

In [1]:

import numpy as np

import lightgbm as lgb
from sklearn.model_selection import train_test_split, RandomizedSearchCV
from sklearn.datasets import load_iris
from sklearn.metrics import accuracy_score
import warnings
warnings.filterwarnings("ignore")

加載數據

加載公開的iris數據集:

In [2]:

# 加載數據集
data = load_iris()
X, y = data.data, data.target
y = [int(i) for i in y]  # 將標簽轉換為整數

In [3]:

X[:3]

Out[3]:

array([[5.1, 3.5, 1.4, 0.2],
       [4.9, 3. , 1.4, 0.2],
       [4.7, 3.2, 1.3, 0.2]])

In [4]:

y[:10]

Out[4]:

[0, 0, 0, 0, 0, 0, 0, 0, 0, 0]

劃分數據

In [5]:

# 劃分訓練集和測試集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2)

同時創建LightGBM數據集:

In [6]:

lgb_train = lgb.Dataset(X_train, label=y_train)

參數設置

In [7]:

# 設置參數范圍
param_dist = {
    'boosting_type': ['gbdt', 'dart'],  # 提升類型  梯度提升決策樹(gbdt)和Dropouts meet Multiple Additive Regression Trees(dart)
    'objective': ['binary', 'multiclass'],  # 目標;二分類和多分類
    'num_leaves': range(20, 150),  # 葉子節點數量
    'learning_rate': [0.01, 0.05, 0.1],  # 學習率
    'feature_fraction': [0.6, 0.8, 1.0],  # 特征采樣比例
    'bagging_fraction': [0.6, 0.8, 1.0],  # 數據采樣比例
    'bagging_freq': range(0, 80),  # 數據采樣頻率
    'verbose': [-1]  # 是否顯示訓練過程中的詳細信息,-1表示不顯示
}

隨機搜索調參

In [8]:

# 初始化模型
model = lgb.LGBMClassifier()


# 使用隨機搜索進行參數調優
random_search = RandomizedSearchCV(estimator=model,
                                   param_distributinotallow=param_dist, # 參數組合
                                   n_iter=100, 
                                   cv=5, # 5折交叉驗證
                                   verbose=2, 
                                   random_state=42, 
                                   n_jobs=-1)
# 模型訓練
random_search.fit(X_train, y_train)
Fitting 5 folds for each of 100 candidates, totalling 500 fits

輸出最佳的參數組合:

In [9]:

# 輸出最佳參數
print("Best parameters found: ", random_search.best_params_)
Best parameters found:  {'verbose': -1, 'objective': 'multiclass', 'num_leaves': 87, 'learning_rate': 0.05, 'feature_fraction': 0.6, 'boosting_type': 'gbdt', 'bagging_freq': 22, 'bagging_fraction': 0.6}

使用最佳參數建模

In [10]:

# 使用最佳參數訓練模型
best_model = random_search.best_estimator_
best_model.fit(X_train, y_train)

# 預測
y_pred = best_model.predict(X_test)
y_pred = [round(i) for i in y_pred]  # 將概率轉換為類別

# 評估模型
print('Accuracy: %.4f' % accuracy_score(y_test, y_pred))
Accuracy: 0.9667

責任編輯:武曉燕 來源: 尤而小屋
相關推薦

2022-02-17 10:34:21

神經網絡識別驗證碼

2023-10-19 08:30:56

模型搜索

2018-11-14 10:01:30

谷歌開源機器學習

2023-03-03 18:31:23

網絡承運商路由

2019-01-29 10:27:27

量子計算機芯片超算

2020-10-18 12:27:35

人工智能人臉識別技術

2011-05-23 09:21:42

2020-10-09 08:31:00

AI

2023-10-26 08:40:15

模型隱私推理

2022-09-14 09:55:32

人工智能AI解碼技術

2023-05-04 09:39:16

AI模型

2018-06-12 07:15:18

阿里巴巴技術語音識別

2023-06-21 09:15:30

AI 技術神經網絡

2023-08-08 13:54:15

2023-08-15 14:55:57

2020-11-20 17:03:11

AI 數據人工智能

2019-01-03 09:04:04

谷歌系統機器

2017-09-28 09:40:36

圖像分類準確率
點贊
收藏

51CTO技術棧公眾號

一本色道无码道dvd在线观看| 欧美激情奇米色| 欧美猛男超大videosgay| 国产午夜精品一区二区三区 | 另类的小说在线视频另类成人小视频在线| 成人自拍视频在线观看| 欧美丰满少妇xxxxx高潮对白| 26uuu久久噜噜噜噜| 欧美a v在线播放| 久草在线国产| 欧美理伦片在线播放| 亚洲成aⅴ人片久久青草影院| 欧美欧美天天天天操| 国产69精品久久久久毛片| 一区二区欧美国产| 亚洲精品aⅴ中文字幕乱码| 亚州成人av在线| 影音先锋欧美在线| 日本女优北野望在线电影| 波多野结衣精品| 欧美日韩国产免费观看视频| 国产在线播放一区三区四| 激情av一区二区| 最好看的2019年中文视频| 99国产高清| 天天碰免费视频| 亚洲精品88| 欧美91精品| 成人欧美一区二区三区在线播放| 亚洲国产福利在线| 成人动漫视频在线观看完整版| 偷窥自拍亚洲色图| 99热这里有精品| 亚洲青涩在线| 国产婷婷色综合av蜜臀av| 2020久久国产精品| 91青青草免费在线看| 91丨九色丨国产| 欧美日韩精品免费| 91xxxxx| 天天综合入口| 韩国日本一区| 中文字幕不卡的av| 婷婷四房综合激情五月| 亚洲第一二三区| 亚洲福利精品在线| 男人j进女人j| 国产真实生活伦对白| 美女av免费在线观看| 免费黄色在线网站| 澳门av一区二区三区| 国际精品欧美精品| 日韩中文字幕不卡| 又紧又大又爽精品一区二区| 亚洲精品99999| 国产日本欧美一区二区三区| 92国产精品久久久久首页 | 天天人人精品| 日本不卡123| 国产欧美日韩小视频| 欧美成在线视频| 成人久久18免费网站漫画| 福利视频午夜| 欧美日韩性在线观看| 亚洲二区在线观看| 亚洲影院在线看| 欧美精品少妇| 欧美gay男男猛男无套| 亚洲一二三区不卡| 午夜精品免费视频| xxxx69视频| 亚洲无线观看| 久久久久久久性| 青青草原成人在线视频| 熟女少妇精品一区二区| 国产精品原创视频| 久久精品午夜| 亚洲片国产一区一级在线观看| 欧美这里只有精品| 久久精品福利| 欧美日韩一区二区在线| 热re99久久精品国99热蜜月| 国产精品专区免费| 中文一区二区在线观看| 国产精品日韩电影| av成人 com a| 日本一区二区成人在线| av色综合网| 日韩黄色三级在线观看| 亚洲一二三级电影| 黄色网zhan| 一个色综合网| www.日本久久久久com.| 福利网址在线| 韩国成人福利片在线播放| 日本成人在线视频网址| 男女羞羞视频在线观看| 九九九伊在线综合永久| 国产清纯在线一区二区www| 国产一区二区视频在线免费观看| 自拍偷自拍亚洲精品被多人伦好爽| 麻豆精品久久久| 日本老师69xxx| 天堂av中文在线观看| 色综合色综合色综合| 91午夜在线观看| √天堂资源地址在线官网| 日韩午夜精品| 国产91久久婷婷一区二区| 国产精品一区二区av影院萌芽| 国产精品嫩草久久久久| 日本不卡一区| 亚洲一级黄色| 欧美亚洲国产成人精品| www.com.cn成人| 性欧美疯狂xxxxbbbb| 蜜臀av无码一区二区三区| 日韩成人影院| 亚洲精品日韩在线| 91精品国产91久久久久游泳池| 日本一区二区三区四区在线视频 | 日韩最新av在线| 秋霞在线午夜| 欧美日韩一区视频| 四虎精品成人免费网站| 亚洲最快最全在线视频| 97视频免费| 日韩欧美亚洲成人| 精品久久久久久中文字幕2017| 一区二区三区视频播放| 亚洲精品写真福利| 国产精品91在线观看| 午夜免费看视频| 哺乳一区二区三区中文视频| 国产日韩三级在线| 91黑丝在线观看| 亚洲免费资源| 日韩中文字幕在线看| 日韩欧美另类一区二区| 日韩一区二区三区视频在线 | 国产日韩亚洲| 成人免费观看a| 日韩一区二区久久| 茄子视频成人在线| 欧美中文字幕一区二区| av日韩中文字幕| 成人一区不卡| 国产精品xxxx| 亚洲精品三级| 中文字幕一区二区三区最新 | 丁香六月激情婷婷| 中文字幕成人av| 中文字幕国产在线| 制服丝袜亚洲色图| 图片一区二区| 国产精品三级在线| 91久久夜色精品国产按摩| 国产日韩欧美中文| 国产农村妇女精品一区二区| 一区二区在线高清视频| 91在线国产福利| 日日噜噜噜夜夜爽爽狠狠| 日韩视频免费直播| 国产精品一区二区三区av| 欧美极度另类性三渗透| 国产精品99一区二区三区| 亚洲图片都市激情| 中文字幕日本不卡| 免费在线稳定资源站| 日韩av网站导航| 第四色中文综合网| 国产视频一区二区不卡| 99精品在线观看视频| 一级在线免费观看| 另类视频在线观看| 亚洲天天影视| 欧美精品tushy高清| 日韩精选视频| 99国产盗摄| 国产日韩三级在线| 深夜国产在线播放| 热久久99这里有精品| 久久蜜桃精品| 奇米影音第四色| 亚洲精品二三区| 成人免费在线观看av| 一区二区三区在线视频111| 亚洲欧美日韩人成在线播放| 成人在线视频亚洲| 国产精品女人久久久久久| 99久久国产综合精品麻豆| 国产精品秘入口| 亚洲石原莉奈一区二区在线观看| 久久婷婷蜜乳一本欲蜜臀| 成人在线播放网址| 欧美日韩dvd在线观看| 同性恋视频一区| 少妇人妻在线视频| 日韩精品视频在线播放| 国产在线不卡|