国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

日志和告警數據挖掘經驗談

大數據
項目的需求是收集的客戶系統一個月300G左右的的日志和告警數據做一個整理,主要是歸類(Grouping)和關聯(Correlation),從而得到告警和日志的一些統計關系,這些統計結果可以給一線支持人員參考。

最近參與了了一個日志和告警的數據挖掘項目,里面用到的一些思路在這里和大家做一個分享。

項目的需求是收集的客戶系統一個月300G左右的的日志和告警數據做一個整理,主要是歸類(Grouping)和關聯(Correlation),從而得到告警和日志的一些統計關系,這些統計結果可以給一線支持人員參考。

得到的數據主要分為兩部分,一部分是告警的歷史數據,這部分數據很少,只有50M左右,剩下的全部都是日志數據。日志數據大概有50多種不同類型,對應系統中不同的模塊。每種類型的文件每天產生一個日志文件,所以總數大概是1500個左右的日志文件。文件大概都是這樣的:A_2016-04-15.log, B_2016-04-15.log, …, A_2016-05-14.log, B_2016-05-14.log。每個文件在10M-1G之間不等。

1. 日志的模式挖掘

通過查看日志,發現所有的log每一行基本都是類似這樣的Pattern:

YYYY-MM-DD hh:mm:ss [模塊名] [具體日志]

每類日志的模塊名都是一樣的,基本可以忽略。有價值的就是時間戳和具體日志。

而且可以發現,很多日志只是極少部分動態內容不同,在代碼中屬于同一個位置的輸出,這些數據后面我們會分為一類數據。比如:

2016-04-26 00:30:38.795 55637 ResourceManager Free ram (MB): 244736

2016-04-26 00:34:38.795 55637 ResourceManager Free ram (MB): 244748

有某些類型日志每個時段都有出現,咨詢后得知基本沒有任何分析價值,這些日志后面我們會加入黑名單,不加分析。

2. 日志的歸類

由于每類日志都有30個文件,每個文件基本都有100萬行,我們的***步工作就是去除上面提到的無用日志。去掉無用日志后,我們要分析的日志大概減少了30%。

接著我們要做的就是每一行的日志進行歸類(Grouping)。這里有很多的方法可以選擇,比如K-means,但是我們這么多的日志,很難去定義一個合適的K。經過一番嘗試后我們放棄了K-means。但是K-means的思想還是可以用的。***我們使用的是啟發式的方法來歸類。

首先定下的基本思路是: 對于每一類文件,我們分別做歸類,***再一起和告警文件做關聯(Crrelation)。我們作了不同類別文件的日志肯定不在一類的假定。

對于每一類文件的每一行日志,我們我們通過對具體日志的字符串的相似度進行歸類,算法如下:

1)初始化將最終類別數組設置為空,類別數組的每一行的格式是 [index] [類別里***次出現的具體日志內容] [該類日志出現的所有時間形成的數組]

2)初始化字符串相似度閾值,相似度超過閾值的字符串即為一類。項目里面我們相似度閾值取80%。

3)初始化歸類的時間間隔,在一個時間間隔內的相似日志僅僅記錄一次時間。也就是說如果某類日志已經有這段時間的記錄,再次在這段時間出現的類似日志將會被忽略。取的過大,后面關聯時精確度降低,取的過小,后面關聯時計算量會很大。項目里我們取10分鐘作為日志間隔。也就是一天劃分成了24*6個時間間隔。

4)對于某一種類別, 對于每一行的具體日志我們去和該類別的最終類別數組的每一行的具體日志做相似度比較:

a) 如果和最終類別里的某行具體日志的字符串的相似度超過了閾值,則這兩個字符串即歸為一類,僅僅把這個要分析的具體日志的時間點存入該類別,停止該行日志的分析。

b) 如果和最終類別里的任何一行具體日志的字符串的相似度都低于閾值。則我們發現了一個新的類別。在最終類別里加入一行記錄。并把該日志的時間間隔對應的點作為該類別的時間數組的***條時間記錄。

5) 對于所有其他的類別,分別執行上面的第4步。得到所有類別的最終類別數組。最終我們的50多個類別數組一共只剩下100多M,每個數組平均有100多種類別。

這個算法產生的類別數組中每一行是這樣的內容:

  1. ResourceManager Free ram (MB): 244736 [[2016-04-26 00:30],[2016-04-26 10:40], …] 

上面的算法中,我們用到了字符串相似度算法。這里我們用到是python的字符串下相似度算法庫:python-Levenshtein。計算相似度我們用了python-Levenshtein庫的ratio函數,即萊文斯坦比。如果大家對python-Levenshtein的字符串相似度計算有興趣,可以參考python-Levenshtein的官方文檔:https://pypi.python.org/pypi/python-Levenshtein/0.12.0#id1

3. 日志和告警的關聯

現在我們有了50多種日志的類別數據,每個類別也有在時間分布上的數據,同時,回到告警,每個告警也有在時間分布上的數據。現在我們可以在時間維度上做關聯算法。

我們的日志類別數組和告警在時間維度一共有30*24*6=4320個點。我們的目標是找到和每個告警在時間維度上關聯度比較高的一組日志。這里我們采用的是基于余弦相似度的算法。我們選擇了所有的和告警在時間維度上相似度超過80%的日志類別。這些類別作為最終的統計結果作為我們輸出的一部分。

4. 告警和告警的關聯

這部分工作主要是研究告警和告警之間的統計關系。主要是基于統計的在時間維度上的父子關系。

由于告警數據較少,我們將時間間隔精確到1分鐘。對于每一種告警,我們檢查在該告警和其他告警在時間維度上的關系。我們檢查3種情況。

***種情況是在相同時間間隔出現的兄弟告警和該告警的統計關系,我們選擇在時間維度上和該告警相似度超過80%的所有告警,這些告警和該告警有時間上同步的關系,也就是這些告警統計上總是和該告警同時出現。

第二種情況是在該告警出現前一分鐘內的所有父親告警和該告警的關系,我們選擇在時間維度上和該告警相似度超過80%的所有告警,這些告警和該告警有時間上先后的關系,也就是這些告警統計上總是在該告警之前出現。

第三種情況是在該告警出現后一分鐘內的所有兒子告警和該告警的關系,我們選擇在時間維度上和該告警相似度超過80%的所有告警,這些告警和該告警有時間上先后的關系,也就是這些告警統計上總是在該告警之后出現。

以上就是對日志和告警數據挖掘的項目經驗總結,希望對大家有所啟發。

作者:劉建平Pinard(十年碼農,對數學統計學,數據挖掘,機器學習,大數據平臺,大數據平臺應用開發,大數據可視化感興趣。

責任編輯:武曉燕 來源: 36大數據
相關推薦

2011-09-09 09:50:40

Oracle

2009-06-29 15:39:53

Servlet和JSPServlet引擎

2009-08-03 10:13:13

開發框架

2012-03-12 10:51:41

數據中心災難備份

2024-05-28 07:01:29

2009-09-14 15:04:44

2010-06-24 21:43:20

2018-11-23 09:00:00

微服務微服務架構日志

2011-08-15 10:27:48

2014-03-13 09:20:38

jQueryAngularJs

2011-06-21 16:26:19

SEO內部優化

2013-08-02 11:23:45

2012-07-13 14:25:59

2010-08-17 13:23:49

2015-09-16 10:13:16

游戲性能

2009-07-02 14:35:00

Oracle數據庫文件

2010-01-14 20:05:43

虛擬化數據中心

2015-09-23 14:01:51

2009-07-11 10:30:17

綜合布線工作體會

2009-11-02 11:11:07

VB.NET OOP設
點贊
收藏

51CTO技術棧公眾號

日韩电影网址| 欧美一级一区| 制服丝袜亚洲网站| 国产天堂在线播放视频| 亚洲午夜性刺激影院| 久久精品日韩精品| 亚洲午夜私人影院| 国产精品你懂的在线欣赏| 蜜臀av免费观看| 疯狂蹂躏欧美一区二区精品| 91亚洲天堂| 精品国产欧美成人夜夜嗨| 思热99re视热频这里只精品| 国产精品国产亚洲精品看不卡15| 狠狠色狠狠色综合| 黄色av网站在线观看| 91精品国产综合久久福利软件 | 超碰在线97av| 蜜桃av一区二区三区| 天天激情综合| 欧美系列日韩一区| 色播一区二区| 开心色怡人综合网站| 亚洲欧美色图小说| 性欧美freesex顶级少妇| 国产精品视频免费在线| 成人午夜免费av| 91在线观看| 4438全国亚洲精品在线观看视频| 日本视频一区二区| igao视频网在线视频| 中文字幕九色91在线| 最新国产拍偷乱拍精品| 人人澡人一摸人人添| 日韩大陆毛片av| 欧美成人中文| 污视频网站免费| 国产香蕉97碰碰久久人人| 久久精品影视| 日韩欧美精品免费| 欧美天天综合网| 国产suv精品一区二区四区视频| 秋霞毛片久久久久久久久| 1区2区3区精品视频| 午夜小视频在线观看| 国产精品露脸自拍| 国产一区在线观看视频| 天堂av网在线| 国产亚洲欧洲高清一区| 66国产精品| 欧美在线观看www| 欧美久久久久久蜜桃| 欧美一级精品片在线看| 国产成a人亚洲精v品在线观看| 欧美精品v日韩精品v韩国精品v| 日韩三级av高清片| 欧美一级中文字幕| 2021天堂中文幕一二区在线观| 视频一区二区三区在线| 传媒视频在线| zzjj国产精品一区二区| 亚洲天堂日韩在线| 国产精品裸体瑜伽视频| 欧美日韩另类一区| 日韩精品免费一区二区三区| 欧美,日韩,国产在线| 亚洲国产成人在线播放| 国产大片一区| 无码人妻丰满熟妇区毛片18| 亚洲欧美国产高清va在线播| 亚洲国产第一| 五月天婷婷在线视频| 97免费中文视频在线观看| 成人91在线观看| a级毛片免费观看在线 | 欧美日日夜夜| 男同互操gay射视频在线看| 日韩欧美一级特黄在线播放| 久久成人综合| 最全影音av资源中文字幕在线| 久久av红桃一区二区小说| 国产在线精品一区二区三区不卡 | 日本成年人网址| 色综合视频一区二区三区高清| 中国av一区| 亚洲 中文字幕 日韩 无码| 久久精品国产久精国产一老狼 | 日韩一区三区| 成人综合av| 欧美二区在线播放| 欧美激情综合网| 777午夜精品电影免费看| 大陆av在线播放| 亚洲精品av在线| 日韩影院二区| 蝌蚪视频在线播放| 成人福利视频网| 色婷婷av久久久久久久| 999久久久91| jizz视频在线观看| 亚洲一区二区三区xxx视频| 欧美性猛交xxxx乱大交退制版| 日韩欧美综合| 日本aⅴ写真网站免费| 国产精品高潮在线| 亚洲最色的网站| 黄色成人精品网站| 欧美视频综合| 青青草成人网| 亚洲国产一区自拍| 26uuu色噜噜精品一区二区| 四虎国产精品永久在线国在线| 五月婷婷激情久久| 欧美一级淫片丝袜脚交| 国产精品色婷婷| 香蕉综合视频| 永久免费av在线| 综合色婷婷一区二区亚洲欧美国产| 亚洲国产高清福利视频| 9久草视频在线视频精品| 亚洲精品伦理| 国产对白在线正在播放| 成人妇女免费播放久久久| 制服丝袜一区二区三区| 久久国产精品色| av电影在线地址| 99精品视频播放| 2019av中文字幕| 欧美图区在线视频| 日韩成人一区二区三区在线观看| 日韩欧美激情| 91大神影片| 国产精品一区二区免费看| 欧美xfplay| 91在线丨porny丨国产| 欧美激情在线免费| 欧美激情免费| 六月激情综合网| 国产精品美女免费视频| 亚洲国产第一页| 国产日韩欧美电影| 最新日韩欧美| jizzjizz少妇亚洲水多| 欧美精品少妇| 伊人色综合影院| 国产精品久久久久久av福利| 欧美精品1区2区| 久久久www成人免费无遮挡大片| 成人亚洲一区二区| 九色视频在线播放| 丁香婷婷综合激情| 国产精品video| 精品国产精品网麻豆系列| 91在线精品秘密一区二区| 激情久久五月| 日韩欧美一区二区三区在线观看 | 成人在线免费高清视频| 九九久久综合网站| 日韩欧美成人区| 麻豆国产精品一区二区三区| 欧美wwwsss9999| 久久一区二区精品| 岛国在线视频免费看| 久久精品黄色| 久久久久久久波多野高潮日日| 亚洲永久免费视频| 黄色成人美女网站| a级网站在线播放| 成人性做爰aaa片免费看不忠| 国产精品视频入口| 日韩有码视频在线| 欧美日高清视频| 久久九九国产精品| 美腿丝袜在线亚洲一区 | 亚洲人成电影在线观看天堂色| 亚洲电影一区二区三区| 蜜桃在线一区二区三区| 99精品小视频| 亚洲国产91视频| 91资源在线观看| 香蕉视频在线免费| 能在线观看的av网站| 蜜桃久久精品乱码一区二区| 欧美综合在线观看| 国产视频在线观看一区二区| 色猫猫国产区一区二在线视频| 99这里只有久久精品视频| 美腿丝袜在线亚洲一区| 成人aaaa| 超碰97久久国产精品牛牛| 亚洲男同gay网站| 在线一级视频| 亚洲精品乱码久久久久久自慰| 国产精品免费久久久久久| 久久精品国产96久久久香蕉| 51午夜精品国产| 一道本成人在线| 中文字幕色av一区二区三区| 26uuu另类欧美亚洲曰本| 久久久久久夜|