国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

直擊Titan圖數據庫:如何提升25%+的反欺詐檢測效率?

數據庫 其他數據庫
圖數據庫以圖論為基礎,數據本身以圖的方式存儲(比如鄰接表),在處理與圖相關的任務時占有先天的優勢。所以目前在知識圖譜,社交網絡分析等領域開始有越來越多的應用。

傳統的關系型數據庫通過實體和關系來建模,在過去的很長一段時間內都占據著絕對的統治地位。但是隨著大數據的興起,它的一些缺陷也變得越來越明顯,特別是在需要處理非常復雜的實體關系時,關系型數據庫變得越來越力不從心。 

當我們要表示實體間的多對多關系時,一般會建立關系表。當要看實體間的關系時,我們需要把這種關系再關聯起來。這通常是一項非常消耗性能的工作,特別是在關系非常復雜或者關系層次很多的情況下,需要關聯非常多的表,甚至產生非常巨大的中間結果,導致查詢非常緩慢甚至跑不出來。

圖數據庫以圖論為基礎,數據本身以圖的方式存儲(比如鄰接表),在處理與圖相關的任務時占有先天的優勢。所以目前在知識圖譜,社交網絡分析等領域開始有越來越多的應用。

常見的圖形數據庫

以下是三個比較流行的圖數據庫及各自的特性對比。

經過我們對比及試用的結果,OrientDB 和 Neo4j 使用比 Titan 都要簡單,社區也更活躍。但是 Neo4j ***的缺陷在于并非是真正的分布式,當數據量超過單機的承載能力以后很難處理;而且 Neo4j 和OrientDB 的底層存儲都是自主研發,Titan 支持HBase/Cassandra 作為底層存儲,跟我們目前主要的數據平臺 Hadoop 能很好集成在一起;此外,Titan 除了支持 OLTP 操作以外,還可以跟 Spark 結合進行 OLAP 相關的分析。所以我們最終決定采用 Titan 。

Titan技術架構 

Titan 的總體技術架構如上所示,存儲、索引、OLAP 的計算引擎都是開源的可選組件:

  1. 底層存儲支持 HBase/Cassandra,所以存儲是可以平行擴展的,幾乎沒有容量限制;
  2. 支持 Elasticsearch/Solr/Lucene 作為外部的索引插件,實現在進行非等值查詢時也能利用到索引;
  3. Management API 負責 Schema 的創建,修改,刪除及實例管理等操作;
  4. 通過 Tinkerpop API提供圖上的操作接口;
  5. Internal API、Database Layer、Storage and Index Interface Layer負責將 Tinkerpop 和Management API 的圖操作轉換成底層存儲 Cassandra 和 HBase 上的操作(比如HBase 中的put、get、scan)。
  6. GraphComputer 提供以 Spark/MR 的方式進行圖上的 OLAP 操作,做子圖或者全圖上的分析(比如計算 Pagerank )。

Titan圖的表示 

Titan用結點、邊和屬性三類信息來描述一個圖,如上圖所示。

結點(Vertex):用于表示一個實體,結點通過指定不同的標簽(LABEL)來區別具體的實體類型,如Titan、Location;結點由唯一的 Vertex ID 標識,該ID由 Titan 自動生成并管理。

邊(Edge):用于描述實體之前的關系,有出結點和入結點;邊同樣有標簽(LABEL),用于區分邊的類型,如上圖所示的 father、lives;邊帶有方向;邊可以指定是否只允許單向查詢;邊可以指定 MULTILICITY,表示該 LABEL 的邊能存在幾條;邊也有唯一的 Edge ID,該ID由 Titan 自動生成及管理。

屬性(property):既可以在結點上,也可以在邊上,用于描述結點和邊的附加信息;屬性通過 PROPERTY KEY來表示該屬性是什么屬性,如上圖所示 name、age、place;屬性也可以指定 CARDILITY,用于表示該屬性可以存在多個該屬性;屬性也有唯一的 Property ID,該 ID由 Titan自動生成及管理;對于結點和邊上的屬性都可以添加索引,這時通過屬性來查詢特定結點或者邊的時候,可以直接通過索引定位到對應的結點或者邊的 ID,減少掃描的數據量,提升性能。

Titan的圖查詢

Titan通過 Tinkerpop 的 Gremlin 語言提供圖的查詢、修改等操作。一個 Titan 實例對應的就是 Tinkerpop 的一個 Gremlin Server。多個對應相同存儲后臺的 Gremlin Server 組成了 Titan 的分布集式集群。用戶可以通過 Gremlin Client 或者Restful API提交查詢請求。

查詢的例子如下: 

  1. #創建一個集群  
  2. gremlin> graph = TitanFactory.open('conf/titan-hbase.properties' 
  3. ==>standardtitangraph[hbase:[titan003, titan004, titan005]]  
  4. gremlin> g = graph.traversal()  
  5. ==>graphtraversalsource[standardtitangraph[hbase:[titan003, titan004, titan005]], standard]  
  6. #查詢name'saturn'的結點  
  7. gremlin> saturn = g.V().has('name''saturn').next()  
  8. ==>v[256]  
  9. #查看saturn結點有哪些屬性  
  10. gremlin> g.V(saturn).valueMap()  
  11. ==>[name:[saturn], age:[10000]]  
  12. #saturn的祖父的姓名  
  13. gremlin> g.V(saturn).in('father').in('father').values('name' 
  14. ==>hercules  
  15. #查詢hercules的父母的信息  
  16. gremlin> g.V(hercules).out('father''mother' 
  17. ==>v[1024]  
  18. ==>v[1792]  
  19. gremlin> g.V(hercules).out('father''mother').values('name' 
  20. ==>jupiter  
  21. ==>alcmene  
  22. gremlin> g.V(hercules).out('father''mother').label()  
  23. ==>god  
  24. ==>human  
  25. gremlin> hercules.label()  
  26. ==>demigod 

Titan底層存儲格式

Titan 中的結點和邊按照鄰接表的方式組織,每個結點的鄰接表包含該結點的所有相鄰邊和該結點的屬性,存儲上遵循Big Table Data Model。

也就是說,表由多行組成,每一行由很多的Cell組成,每個 Cell 由一個Column和Value組成。行由唯一的 Key 標識,每個 Cell 由 Key+column 標識。

Titan Layout:

Edge & Property Layout: 

如上圖所示,對于 Titan 的實現來說。每一行的 Key 就是結點的 Vertex ID,該 ID 是由 Titan自動維護的一個64bit長整型數。每個 Cell 就是結點的屬性或者該結點相連的邊。

邊 Cell 的 Column 包含邊的方向,邊上指定的排序屬性的信息,鄰接點的ID, 邊的ID; 邊的 Value 包含邊上的所有屬性( Signature 屬性在前)。

屬性 Cell 的 Column 包含屬性的類型 ID ;  Value 包含屬性的 ID 和屬性的值。

拍拍貸圖數據庫應用

我們目前將用戶信息、設備信息及社交關系構建了一個異構網絡,并將該異構網絡圖應用在用戶關聯分析及反欺詐檢測場景。

傳統的方式上,我們的數據都是存儲在RDMS上,要查詢用戶的關聯關系時,都是通過關聯多張表來實現。但這種方式存在很多的問題:

  1. 這些表相應都較大,在做表關聯的時候效率非常低下;
  2. 對于關系的層次支持非常有限,出入度很大的結點,產生的中間結果會非常大;
  3. 對于圖上的查詢不夠靈活。

這些都極大地限制了我們分析能力和分析效率。出于以上這些痛點,我們引入了 Titan 圖形數據庫。每天會通過改寫的 Titan Bulkload 將10億+結點信息和500億+左右的關系數據導入Titan 后臺 HBase 生成一張包含13類節點和15類邊的復雜異構網絡。

通過該網絡,可以方便快速地回答以下類似問題:

  • 和用戶A關聯的用戶有哪些;
  • 和用戶A關聯的用戶有什么特征;
  • 用戶A和用戶B怎么關聯在一起的。

下圖是我們將圖數據庫應用于反欺詐中的示例圖: 

根據原始的數據圖我們可以對用戶做以下調查分析,來確定特定的用戶是不是欺詐用戶或者是不是與欺詐用戶有關聯:

  • 通過特定規則篩選可疑用戶
  • 查看與可疑用戶有特定關聯的用戶
  • 查看與可疑用戶有特定關聯的所有用戶組成的子網的網絡特征及用戶特征
  • 分析特定用戶可以通過什么樣的關聯關系關聯在一起
  • 最多可分析6層關聯關系的數據 

通過該方式,我們大大減少了調查過程中的工作量,整體效率提升了25%+。 

作者介紹

馮錦明,拍拍貸高級數據工程專家。

責任編輯:龐桂玉 來源: DBAplus社群
相關推薦

2010-04-07 13:46:28

數據庫

2018-04-27 22:51:29

2015-03-06 11:29:53

圖數據庫Titan圖數據庫NoSQL數據庫

2017-02-11 09:58:19

2010-05-04 16:31:34

Oracle數據庫

2023-07-28 08:00:00

人工智能向量數據庫

2015-09-17 10:30:45

2015-09-25 10:46:48

2012-11-21 17:35:21

Oracle技術嘉年華

2023-07-06 09:53:39

2010-08-26 09:12:33

非法DHCP

2010-04-07 17:45:22

Oracle位圖索引

2018-01-12 09:34:17

數據庫技術能力

2016-05-17 10:26:51

2023-08-29 10:53:36

2023-09-13 14:52:11

MySQL數據庫

2021-02-05 08:10:44

業務欺詐檢測網絡威脅網絡安全

2015-07-28 10:42:34

DevOpsIT效率

2014-05-22 09:23:33

Teradata 大數據天睿
點贊
收藏

51CTO技術棧公眾號

日韩精品免费一区二区三区| 国产日韩欧美精品一区| 老司机成人影院| 亚洲色图在线视频| 免费无码毛片一区二三区| 99久久影视| 亚洲人成网站在线| 天堂8在线天堂资源bt| 久久一二三四| 精品欧美久久久| 91九色porny在线| 中文字幕一区二区三区四区不卡 | 久久久综合亚洲91久久98| 日韩欧美一区二区三区免费看| 久久久人成影片一区二区三区| 国产一级不卡毛片| 国产精品538一区二区在线| 国产亚洲视频中文字幕视频| 草美女在线观看| 精品国产乱码久久久久久蜜臀| 日本暖暖在线视频| 激情综合色综合久久综合| 这里只有精品在线播放| 日本成年人网址| 成人av网站免费观看| 欧美日韩视频免费| 成人avav影音| 能在线观看的av网站| 国产欧美精品国产国产专区| 国产精品免费久久久久影院| 香蕉视频在线网站| 日韩亚洲精品在线| 日韩久久久久久久| 久久99蜜桃精品| 六月丁香婷婷激情| 亚洲伦在线观看| 久热av在线| 成人黄色大片在线观看 | 欧美综合一区二区三区| 成人精品一区二区三区校园激情| 欧美日韩一区国产| wwwww亚洲| 俺也去精品视频在线观看| vam成人资源在线观看| 欧美中文在线观看国产| 88国产精品视频一区二区三区| 草莓视频一区| 韩国女主播成人在线观看| 国产日韩一区二区在线| 亚洲综合丁香婷婷六月香| 日本在线播放不卡| 国产aⅴ综合色| 亚洲成色www.777999| 久久精品一区二区三区中文字幕| 欧美日韩在线不卡一区| 成人av在线资源网| 在线激情av| 91视视频在线直接观看在线看网页在线看| 精品www久久久久奶水| 亚洲大片一区二区三区| 黄视频在线免费看| 欧美激情一区二区三区成人 | 蜜桃久久av一区| 天天夜碰日日摸日日澡性色av| 国产精品久久久久久久久晋中| 黄视频在线播放| 色偷偷av亚洲男人的天堂| 免费一级在线观看| 亚洲精品视频在线播放| 欧美一级全黄| 亚洲精品日韩成人| 国内揄拍国内精品久久| 黄色一级视频播放| 性做久久久久久免费观看| av漫画网站在线观看| 国产91久久婷婷一区二区| 轻轻草成人在线| 特级全黄一级毛片| 久久久久国产精品麻豆ai换脸| 在线观看免费视频一区二区三区| 亚洲激情在线视频| 四虎成人精品永久免费av九九| 日本国产中文字幕| 狠狠色噜噜狠狠狠狠97| 中文字幕综合| 欧美激情视频一区二区三区| 国产精品―色哟哟| 国产资源在线观看入口av| 国产精品亚洲综合天堂夜夜| 豆国产96在线|亚洲| 超碰免费在线| 国产精品成人观看视频国产奇米| 国产亚洲字幕| 色先锋资源久久综合5566| 国产在线欧美| 成人精品3d动漫| 亚洲欧洲在线观看av| 国产综合av在线| 日本道色综合久久| 自拍av在线| 日韩资源在线观看| 性高湖久久久久久久久| 久久久久久77777| 国产精品国产三级国产有无不卡| 国产黄色在线观看| 日韩视频国产视频| 国产h视频在线观看| 久久久在线观看| 丁香亚洲综合激情啪啪综合| 久久bbxx| 国产精品二区在线| 欧美91精品| 147欧美人体大胆444| 99tv成人| 超清福利视频| 亚洲免费三区一区二区| 国产一区二区精品调教| 久久人人97超碰人人澡爱香蕉| 一级日本不卡的影视| 亚洲精品在线播放| 国产美女网站在线观看| 日韩精品高清视频| 久久99精品国产麻豆不卡| 色呦呦网站在线观看| 精品国产髙清在线看国产毛片 | 米奇在线777| 国内精品久久久久久中文字幕 | av无码久久久久久不卡网站| 99久久精品国产网站| 免费毛片b在线观看| 久久久久www| 成人激情自拍| 欧美性猛交久久久乱大交小说| 国产一区二区三区视频免费| 精品一区免费av| 二吊插入一穴一区二区| 色综合久久久久久中文网| 欧美亚视频在线中文字幕免费| 黄色国产一级视频| 欧美剧在线观看| 中文字幕亚洲在| 欧美三级电影在线| 国产.com| 亚洲xxxxx电影| 欧美日韩精品一区二区三区| 女同视频在线观看| 久久久91精品| 国产欧美1区2区3区| 牛牛影视久久网| 国产超碰在线| 亚洲高清色综合| 综合视频一区| 激情综合色综合啪啪开心| 中文不卡1区2区3区| 欧美中日韩在线| 欧美日本亚洲视频| 亚洲精品视频观看| 一区二区三区毛片免费| 午夜在线视频免费观看| 亚洲国产精品高清| 先锋影音国产精品| 色综合久久88色综合天天提莫| 欧美精品一区二区三区在线| 黄色日韩网站视频| 一本色道69色精品综合久久| www.久草.com| 久久草.com| 日日噜噜噜夜夜爽亚洲精品| 国产精品成人一区二区艾草| 久久麻豆精品| 日本动漫同人动漫在线观看| 真实国产乱子伦对白视频| 国产91精品视频在线观看| 欧美视频一区在线| 久久中文字幕导航| 日本高清不卡三区| 在线播放日韩精品| 亚洲综合一区二区精品导航| 在线国产日韩| 国产午夜在线| 欧美日韩精品免费观看视一区二区 | 国产日韩在线观看视频| 360天大佬第二季在线观看| 久久久久久亚洲精品不卡4k岛国 | 日本资源在线| 日本成人中文字幕在线| 91牛牛免费视频| 亚洲色图第一页| 精品国产91久久久久久老师| 久久99国产乱子伦精品免费| 欧美影院天天5g天天爽| 第一av在线| 在线一区二区三区精品| 欧美a级免费视频| www.一区二区三区| 久久精品中文字幕电影| 欧美精品99久久久**| 国产精品久久久久一区二区三区共 | 亚洲激情女人| 你懂的在线观看一区二区|