国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

重采樣技術(shù)在數(shù)據(jù)科學(xué)中的應(yīng)用

譯文 精選
開發(fā) 前端
本文介紹什么是重采樣以及如何使用重采樣技術(shù)提高模型的整體性能。

譯者 | 崔皓

審校 | 孫淑娟

摘要

本文介紹什么是重采樣以及如何使用重采樣技術(shù)提高模型的整體性能。

在使用數(shù)據(jù)模型時,由于模型的算法不同而導(dǎo)致接受數(shù)據(jù)時有不同的學(xué)習(xí)模式。通過這種直觀的學(xué)習(xí)方式,讓模型通過給定數(shù)據(jù)集的學(xué)習(xí)從而找出其中的規(guī)律,這個過程稱為訓(xùn)練模型。

然后,將訓(xùn)練完畢的模型在測試數(shù)據(jù)集上測試,這些測試數(shù)據(jù)是模型之前沒有見過的。實(shí)際上,我們希望達(dá)到的最佳效果是模型在訓(xùn)練和測試數(shù)據(jù)集上都能產(chǎn)生準(zhǔn)確的輸出,也就是模型在訓(xùn)練集和測試集上的表現(xiàn)一致。

你可能也聽說過驗(yàn)證集的方式。這種方式是將數(shù)據(jù)集分成兩部分:訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集。一部分的數(shù)據(jù)被用來訓(xùn)練模型,而另一部分的數(shù)據(jù)被用來測試訓(xùn)練好的模型。

然而,這種驗(yàn)證集的方法有缺點(diǎn)。

該模型將學(xué)習(xí)訓(xùn)練數(shù)據(jù)集中的所有模式,由于它從來沒有接觸過測試集的數(shù)據(jù),因此它可能遺漏測試數(shù)據(jù)集中的相關(guān)信息。這導(dǎo)致模型失去了提高整體性能的重要信息。

另一個缺點(diǎn)是,訓(xùn)練數(shù)據(jù)集可能面臨數(shù)據(jù)中的異常值或錯誤,而模型將學(xué)習(xí)這些有問題的數(shù)據(jù),并將這些數(shù)據(jù)作為模型知識庫的一部分,然后在第二階段的測試中應(yīng)用。

那么,我們?nèi)绾渭m正上述的缺點(diǎn)呢?答案是:重新采樣。

什么是重采樣?

重采樣是一種方法,包括從訓(xùn)練數(shù)據(jù)集中反復(fù)抽取樣本。然后,這些樣本被用來重新擬合一個特定的模型,以檢索更多關(guān)于擬合模型的信息。其目的是收集更多關(guān)于樣本的信息,提高準(zhǔn)確性并估計(jì)不確定性。

例如,如果你正在研究線性回歸擬合,并想檢查變異性。就可以重復(fù)使用訓(xùn)練數(shù)據(jù)中的不同樣本,并對每個樣本進(jìn)行線性回歸擬合。這將使你能夠檢查結(jié)果在不同樣本上的不同表現(xiàn),從而獲得新的信息。

重新取樣的顯著優(yōu)勢是,你可以從同一群體中反復(fù)抽取小樣本,直到你的模型達(dá)到最佳性能。由于能夠循環(huán)使用同一個數(shù)據(jù)集,你將節(jié)省大量的時間和金錢,而不必去尋找新的數(shù)據(jù)。

欠采樣和過度采樣

 如果你正在處理高度不平衡的數(shù)據(jù)集,重采樣是可以提升模型準(zhǔn)確率的一種技術(shù)。

欠采樣是指從多數(shù)類中移除樣本,以提供更多的平衡。

過度采樣是指由于收集的數(shù)據(jù)不足,從少數(shù)類別中復(fù)制隨機(jī)樣本并充當(dāng)樣本。

然而,上述的兩種方法都存在劣勢,在取樣不足的情況下刪除樣本會導(dǎo)致信息的損失。從少數(shù)類中重復(fù)隨機(jī)樣本會導(dǎo)致過度擬合。

數(shù)據(jù)科學(xué)中經(jīng)常使用兩種重抽樣方法:

  • Bootstrap法(引導(dǎo)法)
  • 交叉驗(yàn)證法

Bootstrap法

這種方法用在一些不遵循典型正態(tài)分布的數(shù)據(jù)集。因此,可以應(yīng)用Bootstrap方法來檢查數(shù)據(jù)集的隱藏信息和分布。

在使用Bootstrap方法時,抽出的樣本會被替換,而不包括在樣本中的數(shù)據(jù)被用來測試模型。它是一種靈活的統(tǒng)計(jì)方法,可以幫助數(shù)據(jù)科學(xué)家和機(jī)器學(xué)習(xí)工程師量化不確定性。

其過程包括如下:

1. 反復(fù)從數(shù)據(jù)集中抽取樣本觀測值

2. 替換這些樣本,以確保原始數(shù)據(jù)集保持在相同的規(guī)模。

3. 一個觀察值可以出現(xiàn)不止一次,也可以完全不出現(xiàn)。

你可能聽說過Bagging,即合集技術(shù)。它是Bootstrap Aggregation的簡稱,它結(jié)合了Bootstrap和聚合來形成一個集合模型。它創(chuàng)建了多個原始訓(xùn)練數(shù)據(jù)集,然后匯總得出最終的預(yù)測結(jié)果。每個模型都會學(xué)習(xí)前一個模型的錯誤。

引導(dǎo)法的一個優(yōu)點(diǎn)是,與上面提到的訓(xùn)練-測試分割法相比,它們的方差較低。

交叉驗(yàn)證法

當(dāng)你重復(fù)地隨機(jī)分割數(shù)據(jù)集時,會導(dǎo)致樣本最終進(jìn)入訓(xùn)練集或測試集。這可能會不幸地對你的模型產(chǎn)生不平衡的影響,使其無法做出準(zhǔn)確的預(yù)測。

為了避免這種情況,你可以使用K-Fold交叉驗(yàn)證法來更有效地分割數(shù)據(jù)。在這個過程中,數(shù)據(jù)被分為k個相等的集合,其中一個集合被定義為測試集,而其余的集合則用于訓(xùn)練模型。這個過程將一直持續(xù)到每個集合都作為測試集,并且所有的集合都經(jīng)過了訓(xùn)練階段。

其個過程包括:

1. 數(shù)據(jù)被分割成k個部分。例如,一個數(shù)據(jù)集被分成10個部分--10個相等的集合。

2. 在第一次迭代中,模型在(k-1)上進(jìn)行訓(xùn)練,并在剩余的一組上進(jìn)行測試。假設(shè)每個數(shù)據(jù)集合都有編號,第一次訓(xùn)練把1-9號數(shù)據(jù)集合作為訓(xùn)練集,把10號集合作為測試集。第二訓(xùn)練把1-8號集合以及10號集合作為測試集,把9號集合作為測試集。第三次把1-7號集合以及9、10號集合作為訓(xùn)練集合,把8號集合作為測試集合。

3. 這個過程不斷重復(fù)(10次),直到所有的集合都作為測試集合進(jìn)行訓(xùn)練為止。

這使每個樣本有平衡的代表性,確保所有的數(shù)據(jù)都被用來改善模型的學(xué)習(xí),以及測試模型的性能。

總結(jié)

 在這篇文章中,你將了解什么是重采樣,以及如何以3種不同的方式對你的數(shù)據(jù)集進(jìn)行采樣:訓(xùn)練-測試分割、bootstrap和交叉驗(yàn)證。

所有這些方法的目標(biāo)是幫助模型以有效的方式吸收盡可能多的信息。確保模型成功學(xué)習(xí)的唯一方法是在數(shù)據(jù)集中的各種數(shù)據(jù)點(diǎn)上訓(xùn)練模型。

重新采樣是預(yù)測性建模階段的一個重要元素;確保準(zhǔn)確的輸出、創(chuàng)建高性能的模型和有效的工作流程。

譯者介紹

崔皓,51CTO社區(qū)編輯,資深架構(gòu)師,擁有18年的軟件開發(fā)和架構(gòu)經(jīng)驗(yàn),10年分布式架構(gòu)經(jīng)驗(yàn)。

原文標(biāo)題:??The Role of Resampling Techniques in Data Science??,作者:Nisha Arya

責(zé)任編輯:華軒 來源: 51CTO
相關(guān)推薦

2016-09-04 15:49:46

科學(xué)方法數(shù)據(jù)中心

2024-09-29 08:40:34

2023-04-06 00:29:01

2019-12-16 14:11:14

數(shù)據(jù)科學(xué)數(shù)據(jù)集數(shù)據(jù)分析

2016-12-30 16:18:36

SDN數(shù)據(jù)中心網(wǎng)絡(luò)

2018-08-23 11:06:15

重刪壓縮存儲

2021-02-22 17:25:19

數(shù)據(jù)科學(xué)數(shù)據(jù)技能可視化

2009-02-12 10:09:00

SNMP協(xié)議網(wǎng)絡(luò)管理

2021-09-02 13:49:37

復(fù)雜事件處理CEP數(shù)據(jù)安全

2021-06-28 09:26:51

數(shù)據(jù)庫LLVM

2021-06-25 15:46:02

代碼數(shù)據(jù)庫技術(shù)

2015-10-29 16:07:39

數(shù)據(jù)中心運(yùn)維ITIL

2023-10-08 07:40:29

2020-08-07 10:33:34

區(qū)塊鏈數(shù)據(jù)中心比特幣

2022-02-18 11:41:55

AI人工智能

2020-12-31 06:18:08

人工智能物聯(lián)網(wǎng)大數(shù)據(jù)

2018-08-24 15:05:53

區(qū)塊鏈數(shù)字油田應(yīng)用

2021-01-15 16:58:59

數(shù)據(jù)中心光纖機(jī)器學(xué)習(xí)

2024-11-13 15:15:46

2020-03-03 19:00:50

C語言數(shù)據(jù)科學(xué)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

一区二区三区精品视频在线观看 | 亚洲国产精品字幕| 国产精品夜夜嗨| 国产亚洲第一伦理第一区| 欧美高清另类hdvideosexjaⅴ| 免费观看成人在线| 91欧洲在线视精品在亚洲| 成人网18入口| 黑人极品ⅴideos精品欧美棵| 国产欧美精品va在线观看| 亚洲精品久久久久久久久久久久久| 成人欧美一区二区三区小说| 日本成人在线不卡视频| 久久成人av| 超碰超碰人人人人精品| 免费观看v片在线观看| 国产精品无码电影在线观看| 亚洲伊人成综合成人网| 欧美日韩xxxxx| 欧美mv日韩mv国产网站| 午夜成人在线视频| 成人av综合在线| 99国产一区| 国产乱码精品一区二区亚洲| 亚洲福利影院| 国产二区视频在线观看| 97秋霞电影网| 男人天堂av片| 欧美三级网色| 国产精品一区二区性色av | 成人亚洲视频在线观看| 欧美一区三区二区在线观看| 国产精品网红福利| 欧美大秀在线观看| 亚洲人成电影网站| 欧美一区二区三区四区久久| 五月天精品一区二区三区| 日本一区二区三区高清不卡| 国产一区二区三区在线观看免费 | 亚洲黄色天堂| 久久中文字幕二区| 亚洲一区二区免费在线观看| 欧美美女日韩| 日韩经典av| 国产女人在线视频| 最近最新中文字幕在线| 日本黄大片一区二区三区| r级无码视频在线观看| 亚洲欧洲日韩精品| 鲁丝一区鲁丝二区鲁丝三区| 亚洲直播在线一区| 国产精品一区久久久| 欧美亚洲国产视频| 欧美大学生性色视频| 这里只有精品视频在线| 亚洲精品ady| 亚洲成人xxx| 日韩色视频在线观看| 欧美写真视频网站| 日韩欧美国产一区二区| 亚洲国产乱码最新视频| 亚洲人成在线播放网站岛国| 国产精品福利av| 中文字幕不卡在线播放| 久久久亚洲综合| 2023国产一二三区日本精品2022| 国产成人亚洲精品青草天美| 精品在线播放午夜| 九色综合国产一区二区三区| 欧美aaaaa成人免费观看视频| 老司机久久99久久精品播放免费| 久久电影一区| 日韩中文字幕区一区有砖一区| 一本色道久久综合亚洲精品不卡| 一区在线视频| 亚洲免费婷婷| 丝袜亚洲另类丝袜在线| 老色鬼精品视频在线观看播放| 久久99精品网久久| 国产精品中文欧美| 99久久综合国产精品| 久久人人97超碰com| 中文字幕欧美国产| 亚洲三级免费观看| 精品福利在线观看| 欧美色综合天天久久综合精品| 欧美影院一区二区三区| 在线成人免费视频| 亚洲第一av在线| 亚洲欧美日韩第一区| 中文在线不卡视频| 精品中文字幕在线2019| 青青青国产精品一区二区| 国产日韩欧美在线| 国产乱码精品一区二区三区日韩精品 | 国产尤物视频在线| 欧美精品videos另类| av片在线观看永久免费| 中文字幕人成乱码在线观看 | 2021中文字幕在线| 奇米777日韩| 亚洲精品大片| 图片婷婷一区| 午夜精品婷婷| 日本亚洲一区二区| 99热这里都是精品| 国产精品国产精品国产专区不蜜 | 久久免费视频3| 色婷婷综合网站| 香蕉自在线视频| 国产二区在线播放| 99久久精品免费看国产小宝寻花| 色成人免费网站| 精品一区二区男人吃奶| 亚洲情侣在线| 捆绑变态av一区二区三区| 91蜜桃在线免费视频| 亚洲伊人色欲综合网| 3d成人h动漫网站入口| 亚洲最大中文字幕| 欧美壮男野外gaytube| 99久久精品免费看国产四区| 丝袜足脚交91精品| 成人免费毛片播放| 国产视频三级在线观看播放| 亚洲免费福利| 欧美人与物videos另类xxxxx| 亚洲人成免费| 91免费在线看| 91激情五月电影| 亚洲男人的天堂在线播放| 欧美激情一区二区三区高清视频| 91视频九色网站| 一区二区日本| 成人高清在线观看免费| 拍真实国产伦偷精品| 日本一区二区三区中文字幕| 久久亚洲成人| 久久精品国产999大香线蕉| 国产欧美一区二区精品忘忧草 | 99re视频这里只有精品| 午夜欧美在线一二页| 亚洲第一网站男人都懂| 欧美精品videosex性欧美| 成人综合av网| 男人添女人下部高潮视频在观看| 免费在线观看麻豆视频 | 日韩欧美高清在线视频| 国产性色av一区二区| 日本一欧美一欧美一亚洲视频| 欧美一区二区视频17c| 精品久久久久久中文字幕2017| 国产九色在线| 精品网站999| 亚洲欧美大片| 亚洲视频免费看| 亚洲国产欧美日韩精品| 国产精品吊钟奶在线| 欧美另类videos| 日韩偷拍自拍| 四虎视频在线精品免费网址| 国产精品a级| 国产免费观看久久| 中文字幕欧美激情一区| 热久久这里只有精品| av色综合网| 天天夜碰日日摸日日澡性色av| 国产一级大片| 九九精品调教| 日韩情爱电影在线观看| 成人综合婷婷国产精品久久蜜臀| 亚洲国产精品精华液网站| 亚洲人成网站免费播放| 91精品综合久久久久久五月天| 欧美日韩福利在线| av网站无病毒在线| 亚洲精品18| 久久99精品久久久久| 午夜亚洲福利老司机| y97精品国产97久久久久久| 精品国产一区二区三区四区vr| 浓精h攵女乱爱av| 欧美freesex黑人又粗又大| 一区二区三区毛片免费| 国产免费观看久久| 亚洲热线99精品视频| 久久66热这里只有精品| 91美女在线免费观看| 国产国产一区| 日韩1区2区3区| 色天天综合久久久久综合片| 国内精品在线一区| 国产成人亚洲综合无码| 巨大荫蒂视频欧美另类大| 国产精品一区高清| 91网站视频在线观看| 亚洲国产精品中文| 国内一区二区三区在线视频| 日本视频二区| 波多野结衣欧美|