国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

5分鐘掌握Python關聯規則分析

開發 后端
關聯規則分析也被稱為購物籃分析,用于分析數據集各項之間的關聯關系。

 1. 關聯規則

大家可能聽說過用于宣傳數據挖掘的一個案例:啤酒和尿布;據說是沃爾瑪超市在分析顧客的購買記錄時,發現許多客戶購買啤酒的同時也會購買嬰兒尿布,于是超市調整了啤酒和尿布的貨架擺放,讓這兩個品類擺放在一起;結果這兩個品類的銷量都有明顯的增長;分析原因是很多剛生小孩的男士在購買的啤酒時,會順手帶一些嬰幼兒用品。

不論這個案例是否是真實的,案例中分析顧客購買記錄的方式就是關聯規則分析法Association Rules。

關聯規則分析也被稱為購物籃分析,用于分析數據集各項之間的關聯關系。

1.1 基本概念

  •  項集:item的集合,如集合{牛奶、麥片、糖}是一個3項集,可以認為是購買記錄里物品的集合。
  •  頻繁項集:顧名思義就是頻繁出現的item項的集合。如何定義頻繁呢?用比例來判定,關聯規則中采用支持度和置信度兩個概念來計算比例值
  •  支持度:共同出現的項在整體項中的比例。以購買記錄為例子,購買記錄100條,如果商品A和B同時出現50條購買記錄(即同時購買A和B的記錄有50),那邊A和B這個2項集的支持度為50%   

  •  置信度:購買A后再購買B的條件概率,根據貝葉斯公式,可如下表示:  

  •  提升度:為了判斷產生規則的實際價值,即使用規則后商品出現的次數是否高于商品單獨出現的評率,提升度和衡量購買X對購買Y的概率的提升作用。如下公式可見,如果X和Y相互獨立那么提升度為1,提升度越大,說明X->Y的關聯性越強

1.2 關聯規則Apriori算法

關聯規則方法的步驟如下:

  •  發現頻繁項集
  •  找出關聯規則

Apriori算法是經典的關聯規則算法。Apriori算法的目標是找到最大的K項頻繁集。Apriori算法從尋找1項集開始,通過最小支持度閾值進行剪枝,依次尋找2項集,3項集直到沒有更過項集為止。

下面是一個案例圖解:

  •  圖中有4個記錄,記錄項有1,2,3,4,5若干
  •  首先先找出1項集對應的支持度(C1),可以看出4的支持度低于最小支持閾值,先剪掉(L1)。
  •  從1項集生成2項集,并計算支持度(C2),可以看出(1,5)(1,2)支持度低于最小支持閾值,先剪掉(L2)
  •  從2項集生成3項集,(1,2,3)(1,2,5)(2,3,5)只有(2,3,5)滿足要求
  •  沒有更多的項集了,就定制迭代

2. mlxtend實戰關聯規則

關聯規則目前在scikit-learn中并沒有實現。這里介紹另一個python庫mlxtend。

2.1 安裝

  1. pip install mlxtend 

2.2 簡單的例子

  •  來看下數據集: 
  1. import pandas as pd  
  2.  item_list = [['牛奶','面包'],  
  3.      ['面包','尿布','啤酒','土豆'],  
  4.      ['牛奶','尿布','啤酒','可樂'],  
  5.      ['面包','牛奶','尿布','啤酒'],  
  6.      ['面包','牛奶','尿布','可樂']]  
  7.  item_df = pd.DataFrame(item_list) 
  •  數據格式處理,傳入模型的數據需要滿足bool值的格式 
  1. from mlxtend.preprocessing import TransactionEncode  
  2.  te = TransactionEncoder()  
  3.  df_tf = te.fit_transform(item_list)  
  4.  df = pd.DataFrame(df_tf,columns=te.columns_)     

  • 計算頻繁項集

 

  1. from mlxtend.frequent_patterns import apriori  
  2. use_colnames=True表示使用元素名字,默認的False使用列名代表元素, 設置最小支持度min_support  
  3. frequent_itemsets = apriori(df, min_support=0.05, use_colnames=True 
  4. frequent_itemsets.sort_values(by='support'ascending=Falseinplace=True 
  5. # 選擇2頻繁項集  
  6. print(frequent_itemsets[frequent_itemsets.itemsets.apply(lambda x: len(x)) == 2])   

  •  計算關聯規則   
  1. from mlxtend.frequent_patterns import association_rules  
  2.     # metric可以有很多的度量選項,返回的表列名都可以作為參數  
  3.     association_rule = association_rules(frequent_itemsets,metric='confidence',min_threshold=0.9)  
  4.     #關聯規則可以提升度排序  
  5.     association_rule.sort_values(by='lift',ascending=False,inplace=True)   
  6.     association_rule  
  7.     # 規則是:antecedents->consequents  

選擇出來關聯規則之后,根據提升度排序后,可能最高提升度的規則是在我們常識范圍內,那這個規則的價值就不高。所以我們要在產生的規則中根據業務特點進行篩選,像開篇提到(啤酒->尿布)完全不同的品類之間的關聯。

筆者最近用關聯規則分析用戶的體檢報告記錄,也得出了關于各個病癥的有意義的關聯,如并發癥,不同病癥相互影響等。

3. 總結

本分介紹關聯規則的基本概念和經典算法Apriori,以及python的實現庫mlxtend使用。

總結如下:

  •  關聯規則用于分析數據集各項之間的關聯關系,想一想啤酒和尿布的故事
  •  三個重要概念:支持度,置信度和提升度
  •  Apriori通過迭代先找1項集,用支持度過濾項集,逐步找出所有k項集
  •  用置信度或提升度來選擇滿足的要求的規則
  •  mlxtend對數據要求轉換成bool值才可用 

 

責任編輯:龐桂玉 來源: Python中文社區 (ID:python-china)
相關推薦

2018-05-06 16:26:03

關聯規則數據分析關聯規則推薦

2020-12-17 10:00:16

Python協程線程

2021-01-29 11:25:57

Python爬山算法函數優化

2021-03-23 15:35:36

Adam優化語言

2020-12-07 11:23:32

Scrapy爬蟲Python

2017-01-10 09:07:53

tcpdumpGET請求

2020-10-27 10:43:24

Redis字符串數據庫

2020-12-01 12:44:44

PythonHook鉤子函數

2020-11-24 11:50:52

Python文件代碼

2021-06-07 09:51:22

原型模式序列化

2009-11-17 14:50:50

Oracle調優

2018-01-30 05:04:06

2021-04-19 23:29:44

MakefilemacOSLinux

2012-06-28 10:26:51

Silverlight

2025-01-24 08:38:47

2021-04-27 10:16:51

優化機器學習人工智能

2020-09-11 09:35:18

前端JavaScript策略模式

2009-11-05 10:55:22

Visual Stud

2022-05-30 07:51:13

數據庫MySQLQPS

2021-01-11 09:33:37

Maven數目項目
點贊
收藏

51CTO技術棧公眾號

伊人久久婷婷| 色老综合老女人久久久| 欧美在线一二三四区| 国产女人18毛片水18精品| 在线日韩欧美视频| 麻豆亚洲一区| 男人和女人做事情在线视频网站免费观看| 嫩草影院2018| 亚洲伊人春色| 亚洲成av人影院在线观看网| 国产成+人+综合+亚洲欧美丁香花| 国产免播放器视频| 亚洲激情中文| 欧美三级日本三级少妇99| 国产精品久久亚洲| 成人免费观看视频大全| 国产欧美日韩综合一区在线播放 | 成r视频免费观看在线播放| 91中文在线观看| 美女视频一区二区| 国产乱码精品一区二区三区亚洲人 | 丁香花高清在线观看完整版| 欧美黑白配在线| 亚洲人成在线播放| 在线成人免费观看| 三级网在线观看| 日本中文字幕在线视频观看| 国产精品一站二站| 国产一区二区成人| 亚洲欧美日韩一区二区三区在线| 欧美日韩综合网| 久久久一本精品| 国产精品久久二区二区| 国产精品精品视频| 欧美激情二区| 欧美成人video| 农村妇女精品一二区| 亚洲影院天堂中文av色| 欧美最近摘花xxxx摘花| av在线第一页| 成人黄色大片在线观看| 91av国产在线| 少妇视频在线| 亚洲摸摸操操av| 色乱码一区二区三在线看| 高清不卡一区| 国产精品第二页| 欧美 日韩 国产精品免费观看| 日韩精品在线观| 美女免费免费看网站| 亚洲成人免费视频| 看一级黄色录像| 欧洲杯半决赛直播| 亚洲福利在线视频| 成人免费网站视频www| 亚洲激情自拍| 91国产一区在线| 外国成人激情视频| 丝袜美腿精品国产二区| 奇米影视888狠狠狠777不卡| 大尺度一区二区| 91黄在线观看| 久久久久观看| 亚洲天堂第一页| 国产日韩三级| 亚洲欧洲av一区二区| 奇米一区二区| 亚洲黄色在线看| 在线观看视频污| 久久久久久久久伊人| 亚洲欧美日韩在线综合| 国产精品久久久久一区二区三区厕所 | 精品成人国产在线观看男人呻吟| 一级黄色免费在线观看| 久久久亚洲高清| 免费播放片a高清在线观看| 久久在线免费观看| 亚洲欧美国产不卡| 日本一区二区免费在线观看视频 | 这里只有精品电影| 四虎国产精品成人免费4hu| 国产精品18久久久久久久网站| 国产精品视频500部| 国产69精品久久久久毛片| 免费看污久久久| 91麻豆6部合集magnet| 蜜臀av性久久久久蜜臀av| 99视频一区| 成人精品视频久久久久| 日韩成人午夜| 欧美国产日产韩国视频| 国产精品扒开腿做爽爽爽视频软件| 欧美久久久久久久久| 国产一区二区| 麻豆蜜桃91| 一区二区三区欧美视频| 3d黄动漫网站| 日韩久久精品电影| 久久久久美女| 国产二区视频在线播放| 懂色一区二区三区免费观看| 黄污在线观看| 亚洲成人资源在线| 欧美在线va视频| 精品999在线观看| 老鸭窝毛片一区二区三区| 99久久99久久| 黄色欧美成人| 韩国成人一区| 一区二区三区四区在线播放| 粉嫩粉嫩芽的虎白女18在线视频| 一区二区在线视频播放| 国产乱妇乱子在线播视频播放网站| 国产精品流白浆视频| 日韩国产在线| 91色中文字幕| 国产精品豆花视频| 国产又粗又长又大的视频| 久久久精品国产99久久精品芒果| 久草在线视频福利| 亚洲欧美日韩一区二区三区在线| 伊人激情综合| 永久免费在线| 国产不卡在线观看| 国产精品成人一区二区三区夜夜夜| 国产成人福利夜色影视| 国色天香2019中文字幕在线观看| 日本精品一区二区三区在线观看视频| 久久这里只有精品6| 成人在线啊v| 成全视频全集| 久久一区二区三区喷水| 成人两性免费视频| 亚洲婷婷在线视频| 在线观看视频你懂的| 国内精品久久久久久影视8| 91在线视频官网| 日本中文视频| 欧美性感一类影片在线播放| av片在线观看免费| 丝袜亚洲另类欧美重口| 精品一区二区三区日韩| 毛片一区二区三区四区| 亚洲国产欧美另类丝袜| 日韩高清三区| 秋霞在线观看av| 国产精品揄拍500视频| 色综合久久综合中文综合网| 欧美78videosex性欧美| 热re99久久精品国产99热| 欧美国产一区二区在线观看| 色婷婷综合久久久久中文字幕| 亚洲h在线观看| 久久综合国产| 国产在线小视频| 亚洲人成自拍网站| 成人免费av网站| 国产精品久久久久av蜜臀| 最新国产在线视频| 亚洲天堂第二页| wwwwxxxxx欧美| 免费看成人哺乳视频网站| 精品久久久久久一区二区里番| 9191国产精品| 国产一区二区在线看| 污污免费网站| 国产一区二区三区色淫影院| 国产视频一区在线观看| av在线资源站| 九色精品免费永久在线| 国产精品videossex久久发布| 求av网址在线观看| 特色特色大片在线| 久久久久久久久久久久av| 日韩激情在线观看| 国产无套粉嫩白浆内谢的出处| 奇门遁甲1982国语版免费观看高清| 欧美日韩国产在线| 99精品视频在线免费播放| 国产日韩精品一区观看| 国产视频精品在线| 综合网在线视频| 日韩免费电影| 99视频免费| 奇米成人av国产一区二区三区| 欧美激情亚洲激情| 久久久视频精品| 69久久夜色精品国产69乱青草| 欧美精品激情视频| 国产精品福利网站| 久久艳片www.17c.com| 雨宫琴音一区二区在线| 国产精品婷婷| 日韩国产精品亚洲а∨天堂免| 欧美大片aaaa| 成人vr资源| 国产精品热久久久久夜色精品三区| 在线视频1区2区| www.日本在线播放| 亚洲国产成人久久|