国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

時間序列機器學習數據集的非常規拆分技術

人工智能 機器學習
對于大多數工作來說,簡單的3-way就足夠了。在現實生產中,拆分方式往往需要更復雜的方法來確保泛化問題。這些拆分更加復雜,因為它們源自實際數據,而不是普通拆分方法所基于的數據結構。這篇文章試圖講解一些在機器學習開發中拆分數據的非常規方法,以及它們背后的原因。

確保機器學習模型在未知環境中泛化的一種嘗試是拆分數據。這可以通過多種方式實現,從3-way(訓練、測試、評估)拆分到交叉驗證的k拆分。其基本原理是,通過在數據子集上訓練機器學習模型,并在未知數據上進行評估,可以更好地推理模型在訓練中是否存在欠擬合或過擬合。

對于大多數工作來說,簡單的3-way就足夠了。在現實生產中,拆分方式往往需要更復雜的方法來確保泛化問題。這些拆分更加復雜,因為它們源自實際數據,而不是普通拆分方法所基于的數據結構。這篇文章試圖講解一些在機器學習開發中拆分數據的非常規方法,以及它們背后的原因。

讓我們從數據集開始

為了簡單起見,讓我們使用以表格格式來表示簡單多變量時間序列數據集。該數據由3個數字特征、1個分類特征和1個時間戳特征組成。下面是可視化的:

圖片

這種類型的數據集在機器學習的許多用例和行業中都很常見。一個具體的例子是從工廠車間里面多個傳感器傳輸的時間流數據。分類變量將是機器的ID,數字特征將是傳感器正在記錄的信息(例如,壓力、溫度等),時間戳將是數據傳輸和記錄在數據庫中的時間。 

拆分

假設您從數據工程部門以csv文件的形式收到了這個數據集,并承擔編寫分類或回歸模型的任務。在這種情況下,標簽可以是任何特征或額外的列。要做的第一件事是將數據拆分成有意義的子集。

為方便起見,您可以簡單拆分成訓練集和測試集。馬上問題來了,數據的簡單拆分在這里是行不通的:數據是由多個按時間索引的傳感器數據流組成的。那么,如何對數據進行拆分,從而保持順序,并使后續機器學習模型具有很好的泛化性呢?

數據的另一種觀點

我們可以做的最直接的轉換是表示每個分類類的數據(在我們的運行示例中,可視化每臺機器的數據)。這將產生以下結果:

圖片

水平拆分

分組使拆分的問題變得簡單了一些,并且很大程度上取決于你的假設。您可能會問:針對一個組訓練的機器學習模型如何泛化到其他組,也就是說,如果在class_1、class_2和class_3時間流上進行訓練,該模型在class_4和class_5時間流上的會如何呢?以下是這種拆分的可視化圖:

圖片

上面的這種拆分方式,我稱之為水平拆分。在大多數機器學習庫中,通過簡單地按分類特征進行分組并沿著分類進行分區,可以輕松實現這種拆分。使用這種拆分進行訓練,該模型就已經收集到了在未知分組中泛化的信息。

值得注意的是,拆分并沒有把時間作為拆分本身的基礎。不過,可以假設您還將按每個時間流的時間排序來拆分,以在數據中維護這種關系。這就引出了下一個拆分方式。

垂直拆分

但如果你想跨越時間本身呢?對于大多數時間序列建模,拆分數據的常用方法是past和future。也就是說,將訓練集的歷史數據與評估集的數據相比較。在這種情況下的假設是:機器學習模型如何訓練每組的歷史數據泛化到每組的未來數據?這個問題可以通過所謂的垂直拆分來回答:

圖片

這種拆分的成功訓練將表明該模型能夠在它已經看到的時間流中提取模式,并對未來的行為做出準確的預測。然而,這本身并不能表明該模型可以很好地泛化到來自不同組的其他時間流。

當然,您的多個時間流現在必須單獨排序,所以我們仍然需要分組。但這次,我們不是跨組,而是從past每個組中抽取樣本并將其放入train中,并將future組相應的放入eval 中。在這個理想化的例子中,所有時間流具有相同的長度,即每個時間流具有完全相同數量的數據點。但是,在現實世界中,情況可能并非如此——因此您需要一個系統來為每個組構建索引以進行拆分。

混合拆分

大家可能想知道,他們是否可以生成一個模型,在水平和垂直拆分的約束下都可以很好的進行泛化呢?在這種情況下,假設將是:如何在一些組的歷史數據上訓練的機器學習模型泛化到這些組的未來數據和其他組的所有數據?這種混合拆分的可視化結果如下所示:

圖片

當然,如果模型訓練是成功的,這個模型肯定會比其他模型在現實世界中更健壯。它不僅可以證明它已經看到的一些組的學習模式,而且還可以證明它已經獲得了跨組泛化的信息。如果我們將來要向工廠增加更多類似的機器,這可能是有用的。

多維拆分

水平和垂直拆分的概念可以推廣到許多維度。例如,可能需要根據兩個分類特征而不是一個分類特征進行分組,以便進一步隔離數據中的子組,并按子組對它們進行排序。中間可能還存在用于篩選樣本數量較少的組的復雜邏輯,以及與該域相關的其他業務級邏輯。

結論

這個假設的例子用來說明可以創建的各種機器學習拆分的無限可能性。就像在評估模型時確保機器學習的公平性很重要一樣,花足夠的時間考慮劃分數據集及其對下游模型產生偏差的后果也同樣重要。

責任編輯:華軒 來源: 不靠譜的貓
相關推薦

2010-07-21 16:44:22

telnet服務

2009-03-05 10:50:00

WLANMesh-Wifi終端

2018-11-28 14:53:56

華為

2013-06-14 09:59:55

大數據預測分析

2012-11-12 10:26:35

Web設計WebHTML5

2020-10-31 17:13:04

Python可視化Seaborn

2010-12-21 09:27:06

Windows服務器

2020-08-12 09:46:46

TensorFlow數據機器學習

2024-12-16 13:15:15

機器學習時間序列分析數據缺失

2019-06-19 09:13:29

機器學習中數據集深度學習

2021-12-13 09:14:06

清單管理數據集

2025-01-02 15:10:17

2022-09-21 23:41:40

機器學習開源數據

2020-07-15 13:51:48

TensorFlow數據機器學習

2022-10-12 00:05:24

邊緣數據時間序列金融

2020-06-24 07:53:03

機器學習技術人工智能

2016-01-22 10:38:22

機器學習

2021-03-12 11:00:14

機器學習人工智能爬坡測試

2021-03-04 12:40:25

機器學習人工智能爬坡測試

2024-07-10 14:25:20

點贊
收藏

51CTO技術棧公眾號

136fldh精品导航福利| 日韩精品一区二区在线观看| 欧美三级华人主播| 日韩黄色免费网站| 亚洲区成人777777精品| 不卡电影一区二区三区| 97影院手机在线观看| 狠狠色狠色综合曰曰| 日本美女高清在线观看免费| 精品91自产拍在线观看一区| 欧美亚洲色图校园春色| 国产乱人伦精品一区二区| 国产精品系列在线播放| 成人免费黄色网址| 欧美一区二区日韩一区二区| 台湾色综合娱乐中文网| 国产精品日韩一区二区免费视频| 久久国产婷婷国产香蕉| 国产精品一级久久久| 国产美女福利在线观看| 国产精品久久在线观看| 国产亚洲毛片| 麻豆电影传媒二区| 亚洲精品www久久久| 欧美日本亚洲韩国国产| 欧美成人黄色网址| 欧美一级午夜免费电影| 精品成人自拍视频| 91在线看网站| 亚洲国产高清一区| 91精品国自产在线观看| 国产精品灌醉下药二区| 第一福利在线视频| 99在线首页视频| 国产目拍亚洲精品99久久精品| 黄色网页网址在线免费| 国产精品电影观看| 国产精品久久夜| 你懂得影院夜精品a| 国产精品一二三四区| 未来日记在线观看| 久久久久久亚洲精品中文字幕| 亚洲少妇自拍| 中文av在线播放| 久久69精品久久久久久久电影好| 裸体一区二区| 麻豆免费在线观看| 明星裸体视频一区二区| 亚洲国产aⅴ成人精品无吗| 亚洲伊人春色| 国产精品一区在线| 成年人视频在线免费观看| 日韩电影网在线| 日本一道在线观看| 91蜜桃婷婷狠狠久久综合9色| 116极品美女午夜一级| 欧美丰满少妇xxxxx| 中文字幕在线不卡一区| 好吊日av在线| 四虎一区二区| 亚洲第一区中文99精品| 国产精品系列在线观看| 久久久加勒比| 成年人羞羞的网站| xvideos亚洲| 91色婷婷久久久久合中文| 亚洲精品一区在线| 在线国产1区| 亚洲最大av在线| 日韩欧美色综合| 97久久精品人人澡人人爽| 精品网站999| 美女做暖暖视频免费在线观看全部网址91 | 激情网站五月天| 97**国产露脸精品国产| 欧美视频一区二区三区四区| 蜜桃视频一区二区三区在线观看 | 亚洲性无码av在线| 中文字幕在线观看一区| 免费观看久久av| 国产精品13p| 小泽玛利亚视频在线观看| 日韩av大片免费看| 国产亚洲人成a一在线v站| 亚洲欧洲成人自拍| 首页亚洲欧美制服丝腿| 果冻天美麻豆一区二区国产| 亚洲制服国产| 中文字幕在线看| 可以在线看的黄色网址| 国产在线精品一区| 2019中文字幕在线观看| 欧美r级电影在线观看| 亚洲成人一区二区三区| 一级视频在线观看视频在线啦啦| 日韩精品一二三四| 九九久久精品| 99久久久成人国产精品| 思思99re6国产在线播放| http://嫩草影院| 欧美日韩在线一二三| 91网站在线免费观看| 日韩激情网站| 免费日韩在线观看| 国产激情一区二区三区在线观看| 欧美午夜一区二区福利视频| 免费99热在线观看| 原创国产精品91| 欧美一区午夜视频在线观看| 成人白浆超碰人人人人| 日本韩国在线视频爽| 亚洲国产中文字幕在线视频综合| 香蕉久久国产| 石原莉奈在线亚洲三区| 天天射成人网| 欧美有码视频| sdde在线播放一区二区| 久久人体视频| 亚洲国产99| 狠狠色伊人亚洲综合成人| 国产一区91精品张津瑜| 99久久精品国产观看| 亚洲精品高清视频在线观看| 综合婷婷亚洲小说| 亚洲成av人片一区二区三区| 亚洲va天堂va国产va久| 欧美日韩国产中字| 在线91免费看| 精品久久国产字幕高潮| 日韩久久免费电影| 欧美色网站导航| 亚洲动漫第一页| 亚洲国产岛国毛片在线| 欧美国产一区在线| 在线观看免费视频综合| 在线成人午夜影院| 亚洲欧美精品一区| 色综合亚洲精品激情狠狠| 欧美激情乱人伦一区| 欧美激情视频一区| 国产午夜精品一区二区三区| 91亚洲永久精品| 久久精品亚洲精品国产欧美| 亚洲天堂福利av| 欧美日韩国产123区| 国产一区二区三区欧美| 久久久精品国产| 国产极品jizzhd欧美| 成人综合av网| 欧美中日韩在线| 波多野吉衣av| 九色视频网站| 高潮毛片在线观看| 欧美一区=区三区| 国产中文精品久高清在线不| 国产成人免费在线观看| 白白色 亚洲乱淫| 亚洲男人的天堂在线观看| 欧美日韩高清不卡| 国产精品9999| 性欧美大战久久久久久久| 一区二区三区性视频| 91福利电影| **国产精品| 1024日韩| 亚洲成a人v欧美综合天堂| 69p69国产精品| 国产精品亚洲综合| 尤物国产在线观看| av手机免费在线观看| 欧美自拍偷拍| 国产成人激情av| 欧美一区二区女人| 国产大片精品免费永久看nba| 日本最新一区二区三区视频观看| 全黄性性激高免费视频| 激情内射人妻1区2区3区| av免费网站在线| 韩国一区二区三区在线观看| 一区二区三区中文字幕在线观看| 在线播放国产精品| 色之综合天天综合色天天棕色| 成人在线观看你懂的| 婷婷五月在线视频| 欧美深夜视频| 亚洲欧洲国产日本综合| 亚洲国产高潮在线观看| 91九色综合久久| 美日韩黄色片| 久久国产精品黑丝| 青青草一区二区三区| 欧美成人激情免费网| 日韩成人三级视频| 国产福利一区二区三区在线播放| 99视频精品免费视频| 久久久亚洲福利精品午夜| 日韩有码电影| 精彩视频一区二区三区| 久久av红桃一区二区小说| 一道本视频在线观看|