国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

兩種最為常用的數(shù)據(jù)挖掘方法論

大數(shù)據(jù) 數(shù)據(jù)分析
在實(shí)際項(xiàng)目進(jìn)行過(guò)程中,由于使用者的目標(biāo)背景和興趣不同,有可能打亂各階段順承的關(guān)系。

[[432911]]

本文轉(zhuǎn)載自微信公眾號(hào)「數(shù)倉(cāng)寶貝庫(kù)」,作者趙仁乾 等。轉(zhuǎn)載本文請(qǐng)聯(lián)系數(shù)倉(cāng)寶貝庫(kù)公眾號(hào)。

01CRISP-DM方法論

CRISP-DM方法論由NCR、Clementine、OHRA和Daimler-Benz的數(shù)據(jù)挖掘項(xiàng)目總結(jié)而來(lái),并被SPSS公司大力推廣。CRISP-DM方法論將數(shù)據(jù)挖掘項(xiàng)目的生命周期分為6個(gè)階段,分別是商業(yè)理解、數(shù)據(jù)理解、數(shù)據(jù)準(zhǔn)備、建模、評(píng)估和準(zhǔn)備工作,如圖1所示。在實(shí)際項(xiàng)目進(jìn)行過(guò)程中,由于使用者的目標(biāo)背景和興趣不同,有可能打亂各階段順承的關(guān)系。

圖1 CRISP-DM方法論

圖1呈現(xiàn)了CRISP-DM方法執(zhí)行流程的6個(gè)階段。各個(gè)階段的順序不是保持不變的,有時(shí)需要在某個(gè)階段向前或向后移動(dòng),這取決于每個(gè)階段的結(jié)果和下一個(gè)階段的具體任務(wù)。箭頭指出了各個(gè)階段之間的關(guān)聯(lián)。

在圖1中,最外圈的循環(huán)表示數(shù)據(jù)挖掘本身的循環(huán)特征。數(shù)據(jù)挖掘是一項(xiàng)持續(xù)的工作。在上一個(gè)流程和解決方案中獲得的經(jīng)驗(yàn)與教訓(xùn),可以給下一個(gè)項(xiàng)目提供指導(dǎo)。下面簡(jiǎn)要介紹每個(gè)階段的特點(diǎn)。

1)商業(yè)理解。該階段的特點(diǎn)是從商業(yè)角度理解項(xiàng)目的目標(biāo)和要求,通過(guò)理論分析找出數(shù)據(jù)挖掘可操作問(wèn)題,制訂實(shí)現(xiàn)目標(biāo)的初步計(jì)劃。

2)數(shù)據(jù)理解。該階段開(kāi)始于原始數(shù)據(jù)的收集,然后是熟悉數(shù)據(jù)、標(biāo)明數(shù)據(jù)質(zhì)量問(wèn)題、探索對(duì)數(shù)據(jù)的初步理解、發(fā)掘有趣的子集,以形成對(duì)探索關(guān)系的假設(shè)。

3)數(shù)據(jù)準(zhǔn)備。該階段包括所有從原始的、未加工的數(shù)據(jù)構(gòu)造數(shù)據(jù)挖掘所需信息的活動(dòng)。數(shù)據(jù)準(zhǔn)備任務(wù)可能被實(shí)施多次,而且沒(méi)有任何規(guī)定的順序。這些任務(wù)的主要目的是從源系統(tǒng)根據(jù)維度分析的要求,獲取所需要的信息,同時(shí)對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換和清洗。

4)建模。該階段主要是選擇和應(yīng)用各種建模技術(shù),同時(shí)對(duì)參數(shù)進(jìn)行校準(zhǔn),以達(dá)到最優(yōu)值。通常,同一類數(shù)據(jù)挖掘問(wèn)題會(huì)有多種建模技術(shù)。一些技術(shù)對(duì)數(shù)據(jù)格式有特殊的要求,因此常常需要返回到數(shù)據(jù)準(zhǔn)備階段。

5)評(píng)估。在模型最后發(fā)布前,根據(jù)商業(yè)目標(biāo)評(píng)估模型和檢查模型建立的各個(gè)步驟。此階段的關(guān)鍵目的是,確認(rèn)重要的商業(yè)問(wèn)題都得到充分考慮。

6)準(zhǔn)備工作。模型完成后,由模型使用者(客戶)根據(jù)當(dāng)時(shí)的背景和目標(biāo)完成情況,決定如何在現(xiàn)場(chǎng)使用模型。

02SEMMA方法論

除了CRISP-DM方法論,SAS公司還提出了SEMMA方法論。其與CRISP-DM方法論內(nèi)容十分相似,流程為定義業(yè)務(wù)問(wèn)題、環(huán)境評(píng)估、數(shù)據(jù)準(zhǔn)備、循環(huán)往復(fù)的挖掘過(guò)程、上線發(fā)布、檢視。其中循環(huán)往復(fù)的挖掘過(guò)程包含探索、修改、建模、評(píng)估和抽樣5個(gè)步驟,如圖2所示。

圖2  SEMMA方法論

1)抽樣。該步驟涉及數(shù)據(jù)采集、數(shù)據(jù)合并與抽樣操作,目的是構(gòu)造分析時(shí)用到的數(shù)據(jù)。分析人員將根據(jù)維度分析獲得的結(jié)果作為分析的依據(jù),將散落在公司內(nèi)部與外部的數(shù)據(jù)進(jìn)行整合。

2)探索。這個(gè)步驟有兩個(gè)任務(wù),第一個(gè)是對(duì)數(shù)據(jù)質(zhì)量的探索。變量質(zhì)量方面涉及錯(cuò)誤值(年齡=-30)、不恰當(dāng)(客戶的某些業(yè)務(wù)指標(biāo)為缺失值,實(shí)際上是沒(méi)有這個(gè)業(yè)務(wù),值應(yīng)該為“0”)、缺失值(沒(méi)有客戶的收入信息)、不一致(收入單位為人民幣,而支出單位為美元)、不平穩(wěn)(某些數(shù)據(jù)的均值變化過(guò)于劇烈)、重復(fù)(相同的交易被記錄兩次)和不及時(shí)(銀行客戶的財(cái)務(wù)數(shù)據(jù)更新滯后)等。探索步驟主要解決錯(cuò)誤的變量是否可以修改、是否可以使用的問(wèn)題。比如,缺失值很多,平穩(wěn)性、及時(shí)性很差的變量不能用于后續(xù)的數(shù)據(jù)分析,而缺失值較少的變量需要進(jìn)行缺失值填補(bǔ)。第二個(gè)是對(duì)變量分布形態(tài)的探索。對(duì)變量分布形態(tài)的探索主要是對(duì)變量偏態(tài)和極端值進(jìn)行探索。由于后續(xù)的統(tǒng)計(jì)分析大多是使用參數(shù)統(tǒng)計(jì)方法,這要求連續(xù)變量最好是對(duì)稱分布的,這就需要我們了解每個(gè)連續(xù)變量的分布情況,并制定好變量修改的方案。

3)修改。根據(jù)變量探索的結(jié)論,對(duì)數(shù)據(jù)質(zhì)量問(wèn)題和分布問(wèn)題涉及的變量分別做修改。數(shù)據(jù)質(zhì)量問(wèn)題涉及的修改包括錯(cuò)誤編碼改正、缺失值填補(bǔ)、單位統(tǒng)一等操作。變量分布問(wèn)題涉及的修改包括函數(shù)轉(zhuǎn)換和標(biāo)準(zhǔn)化,具體的修改方法需要與后續(xù)的統(tǒng)計(jì)建模方法相結(jié)合。

4)建模。根據(jù)分析的目的選取合適的模型,這部分內(nèi)容在1.3節(jié)已經(jīng)做了詳細(xì)的闡述,這里不再贅述。

5)評(píng)估。這里指模型的樣本內(nèi)驗(yàn)證,即使用歷史數(shù)據(jù)對(duì)模型表現(xiàn)的優(yōu)劣進(jìn)行評(píng)估。比如,對(duì)有監(jiān)督學(xué)習(xí)使用ROC曲線和提升度等技術(shù)指標(biāo)評(píng)估模型的預(yù)測(cè)能力。

 

本文摘編自《金融商業(yè)算法建模:基于Python和SAS》,經(jīng)出版方授權(quán)發(fā)布。

 

責(zé)任編輯:武曉燕 來(lái)源: 數(shù)倉(cāng)寶貝庫(kù)
相關(guān)推薦

2021-01-06 08:48:35

CSS 命名模塊

2013-12-25 09:50:27

華為馬悅企業(yè)業(yè)務(wù)

2014-05-13 09:56:24

數(shù)據(jù)挖掘

2010-03-05 16:03:30

Python連接數(shù)據(jù)庫(kù)

2010-11-25 10:21:20

MySql查詢時(shí)間段

2022-06-27 08:47:29

BEM修飾符元素

2020-02-05 14:31:04

兩種互通方法

2020-04-02 07:55:07

分析方法論研發(fā)

2016-03-25 15:37:18

數(shù)據(jù)治理數(shù)據(jù)分析BI

2025-04-10 11:47:41

2016-11-17 10:46:10

2010-08-20 13:51:44

路由器密碼

2010-08-13 15:12:05

CISCO密碼

2009-11-11 16:36:19

路由協(xié)議介紹

2015-03-27 09:31:01

2009-12-18 09:45:12

ADSL無(wú)線共享上網(wǎng)

2009-12-14 15:34:54

動(dòng)態(tài)路由協(xié)議

2010-10-14 14:33:15

MySQL多表聯(lián)查

2015-04-30 12:25:15

mininet數(shù)據(jù)中心

2011-04-06 11:05:21

SQL Server數(shù)交換數(shù)據(jù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

国产富婆一区二区三区| 日韩一二区视频| 性爱视频在线播放| 成人av电影在线网| 国产极品精品在线观看| 国产欧洲在线| 亚洲午夜一二三区视频| www.avtt| 水蜜桃久久夜色精品一区的特点| 国内精品一区二区三区| 丝袜国产在线| 一区二区三区在线免费播放| 在线观看成人一级片| 日韩国产欧美一区二区| 在线观看日韩专区| 在线观看h网| 懂色aⅴ精品一区二区三区蜜月| 免费欧美一级视频| 老司机免费视频一区二区三区| 成人中文字幕在线观看| 成人看片爽爽爽| 色噜噜国产精品视频一区二区| av电影高清在线观看| 色老综合老女人久久久| 国产激情视频网址| 国产精品午夜在线观看| 999一区二区三区| 日韩成人午夜电影| 动漫精品视频| 日韩精品二区| 91精品国产高清久久久久久久久 | 国产乱人伦精品一区二区在线观看 | caoporn国产精品| 日韩三级电影| 亚洲人成毛片在线播放女女| 91影院在线免费观看视频| 岛国av一区| 欧美成人一区二区三区电影| 成人免费看黄| 日韩高清av在线| 亚洲小说区图片| 日韩欧美一级特黄在线播放| 一区二区三区视频网站| 日韩欧美国产网站| 亚洲一区二区三区成人 | 69堂成人精品视频免费| 国产欧美日韩精品一区二区免费| 久久久久久久av| 成人av资源网址| 欧美美女18p| 91午夜精品| 午夜精品福利电影| 网曝91综合精品门事件在线 | 在线看免费av| 欧美日韩在线精品一区二区三区激情| 伪装者在线观看完整版免费| 五月综合激情网| 免费在线国产| 在线成人午夜影院| 1区2区在线| 日韩在线小视频| 大型av综合网站| 国产精品一二区| 影音先锋久久资源网| 日本欧美精品久久久| 久久精品久久久精品美女| 成人午夜免费剧场| 国产亚洲一二三区| 欧美最顶级a∨艳星| 欧美日韩亚洲高清一区二区| av在线看片| 亚洲亚裔videos黑人hd| 国产精品99久久免费| 欧美一级视频一区二区| 99久久激情| 亚洲一区二区三区精品动漫| www亚洲一区| 国产特级嫩嫩嫩bbb| 色8久久精品久久久久久蜜 | 国产精品久久久久久福利一牛影视| 97在线资源在| 岛国精品视频在线播放| 黄色在线观看视频网站| 在线精品视频视频中文字幕| 亚洲国产欧美日韩在线观看第一区| 成人免费xxxxx在线观看| 日产国产高清一区二区三区| 欧美黄色一级片视频| 欧美日韩国产精品一区| 国产亚洲成av人片在线观看| 97热精品视频官网| 亚洲二区免费| 国产福利视频在线播放| 色综合久久88色综合天天6 | 在线视频se| 亚洲国产高潮在线观看| 4438全国亚洲精品观看视频| 7777奇米亚洲综合久久| 国产1区2区3区精品美女| 爆操欧美孕妇| 亚洲精品在线三区| 曰本一区二区三区视频| 蜜桃成人免费视频| 国产亚洲精品bt天堂精选| 国产视频精品久久| xvideos亚洲人网站| 天天做天天爱综合| 少妇高潮喷水在线观看| 91黄色在线观看| 日韩激情精品| 九色综合日本| 亚洲三级在线观看| 厕沟全景美女厕沟精品| 9a蜜桃久久久久久免费| 国产欧美一区二区在线观看| 中文字幕有码在线观看| 日韩美女写真福利在线观看| 国产一区二区网址| 男人天堂综合| 欧美激情精品在线 | 91国在线精品国内播放| 老鸭窝一区二区久久精品| 精品少妇一区二区三区免费观看 | 91久久极品少妇xxxxⅹ软件| 国产主播一区二区| 中文字幕亚洲精品视频| 一区二区欧美日韩视频| 亚洲福利精品| 欧美aaa一级| 中文字幕日韩欧美| 久热精品视频| 欧美孕妇孕交xxⅹ孕妇交| 久久视频精品在线| 久久精品国产77777蜜臀| 免费国产在线视频| 日韩av色综合| 国产精品美女一区二区三区 | 亚洲丝袜一区在线| 最新亚洲视频| 濑亚美莉一二区在线视频| 欧美成人h版在线观看| 国产精品一色哟哟哟| 在线三级电影| 成人午夜影院在线观看| 亚洲午夜久久久久久久久电影网| 精品视频在线一区| 91好吊色国产欧美日韩在线| 亚洲国产精品人久久电影| 99精品福利视频| 97电影在线| 亚洲xxxx做受欧美| 亚洲电影一区二区三区| 丝袜久久网站| 狠狠干五月天| 国产精品高潮呻吟久久av黑人| 亚洲国产高清aⅴ视频| 国产视频一区二区在线播放| 91精品国产91久久久久麻豆 主演| 亚洲黄色免费三级| 韩国三级中文字幕hd久久精品| av成人影院在线| 亚洲一区不卡在线| 日韩精品视频免费| 国产成人免费在线| 手机在线观看av| 第九区2中文字幕| 国产小视频国产精品| 成人激情免费电影网址| 欧美va在线观看| 青青青国产在线观看| 久久国产精品久久精品| 欧美激情在线看| 神马影视一区二区| 十九岁完整版在线观看好看云免费| 成人精品aaaa网站| 欧美日韩精品欧美日韩精品| 视频一区二区中文字幕| 国内激情视频在线观看| 人人干视频在线| 欧美激情2020午夜免费观看| 亚洲视频在线一区观看| 午夜国产一区二区| 亚洲男同gay网站| 欧美一区二区视频在线播放| 日韩中文字幕在线免费观看| 国产精品视频你懂的| 日韩精品免费一区二区在线观看| 日韩欧美亚洲系列| 色就是色欧美| 久久偷看各类女兵18女厕嘘嘘 | 国产91在线观看丝袜| 国产亚洲欧美日韩精品一区二区三区| 国产伦精品一区二区三区四区视频_| 欧美激情二区三区| 岛国av一区二区在线在线观看| 亚洲福利一区| 成人免费影院| 好吊的妞视频这里都有| 国产精品区二区三区日本| 亚洲开心激情网|