国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Apache Spark的Lambda架構示例應用

大數據 Spark
目前,市場上很多玩家都已經成功構建了MapReduce工作流程,每天可以處理TB級的歷史數據,但是在MapReduce上跑數據分析真的太慢了。所以我們給大家介紹利用批處理和流處理方法的Lambda架構,本文中將利用Apache Spark(Core,SQL,Streaming),Apache Parquet,Twitter Stream等實時流數據快速訪問歷史數據。

目前,市場上很多玩家都已經成功構建了MapReduce工作流程,每天可以處理TB級的歷史數據,但是在MapReduce上跑數據分析真的太慢了。所以我們給大家介紹利用批處理和流處理方法的Lambda架構,本文中將利用Apache Spark(Core,SQL,Streaming),Apache Parquet,Twitter Stream等實時流數據快速訪問歷史數據。

Apache Hadoop簡史

Apache Hadoop由 Apache Software Foundation 公司于 2005 年秋天作為Lucene的子項目Nutch的一部分正式引入。它受到***由 Google Lab 開發的 Map/Reduce 和 Google File System(GFS) 的啟發。它成為一個獨立項目的時間已有10年。

目前已經有很多客戶實施了基于Hadoop的M / R管道,并成功運行到現在:

Oozie的工作流每日運行處理150TB以上的數據并生成分析報告

Bash的工作流每日運行處理8TB以上的數據并生成分析報告

2016年來了!

2016年商業現實發生了變化,越快做出決策往往價值就會越大。另外,技術本身也在發展,Kafka,Storm,Trident,Samza,Spark,Flink,Parquet,Avro,云提供商等都成為了工程師們的流行語。

因此,現代基于Hadoop的M / R管道可能會是下圖所示的這樣:

圖上的M/R通道看起來不錯,但其實它本質上還是一個傳統的批處理,有著傳統批處理的缺點,當新的數據源源不斷的進入系統中時,還是需要大量的時間來處理。

Lambda 架構

針對上面的問題,Nathan Marz提出了一個通用、可擴展和容錯性強的數據處理架構即Lambda架構,它是通過利用批處理和流處理方法來處理大量數據的。Nathan Marz的書對從源碼的角度對Lambda架構進行了詳盡的介紹。

層結構

這是Lambda架構自上而下的層結構:

所有數據進入系統后都分派到批處理層和速度層進行處理。批處理層管理主數據集(一個不可變的,只可增加的原始數據集),并預先計算批處理視圖。 服務層對批視圖進行索引,以便可以進行低延遲的臨時查詢。 速度層僅處理最近的數據。所有的查詢結果都必須合并批處理視圖和實時視圖的查詢結果。

要點

許多工程師認為Lambda架構就只包含層結構和定義數據流程,但是Nathan Marz的書中為我們介紹了其它幾個比較重要的點:

  • 分布式思想
  • 避免增量結構
  • 數據的不變性
  • 創建重新計算算法
  • 數據的相關性

如前所述,任何查詢結果都必須通過合并來自批處理視圖和實時視圖的結果,因此這些視圖必須是可合并的。在這里要注意的一點是,實時視圖是前一個實時視圖和新數據增量的函數,因此這里使用增量算法,批處理視圖是所有數據的函數,因此應該使用重新計算算法。

權衡

世間萬物都是在不斷妥協和權衡中發展的,Lambda結構也不例外。通常,我們需要解決幾個主要的權衡:

完全重新計算 vs.部分重新計算

在有些情況下,可以使用Bloom過濾器來避免完全重新計算

重計算算法 vs. 增量算法

增量算法其實很具吸引力,但是有時根據指南,我們必須使用重計算算法,即便它很難得到相同的結果

加法算法 vs. 近似算法

雖然Lambda架構能夠與加法算法很好地協同工作,但是在有些情況下更適合使用近似算法,例如使用HyperLogLog處理count-distinct問題。

實現

實現Lambda架構的方法有很多,因為每個層的底層解決方案是獨立的。每個層需要底層實現的特定功能,有助于做出更好的選擇并避免過度決策:

  • 批量層:一次寫入,批量讀取多次
  • 服務層:支持隨機讀取但不支持隨機寫入; 批量計算和批量寫入
  • 速度層:隨機讀寫; 增量計算

例如,其中一個實現(使用Kafka,Apache Hadoop,Voldemort,Twitter Storm,Cassandra)可能如下所示:

Apache Spark

Apache Spark被視為在所有Lambda架構層上進行處理的集成解決方案。 其中Spark Core包含了高級API和支持常規執行圖的優化引擎,SparkSQL用于SQL和結構化數據處理,Spark Streaming支持實時數據流的可擴展,高吞吐量,容錯流處理。 當然,使用Spark進行批處理的價格可能比較高,而且也不是所有的場景和數據都適合。但是,總體來說Apache Spark是對Lambda架構的合理實現。

示例應用

我們創建一個示例應用程序來演示Lambda架構。這個示例的主要目的統計從某個時刻到現在此刻的#morningatlohika tweets哈希標簽。

批處理視圖

為了簡單起見,假設我們的主數據集包含自時間開始以來的所有tweets。 此外,我們實現了一個批處理,創建了我們的業務目標所需的批處理視圖,因此我們有一個預計算的批處理視圖,其中包含與#morningatlohika一起使用的所有主題標記的統計信息:

因為數字方便記憶,所以我使用對應標簽的英文單詞的字母數目作為編號。

實時視圖

當應用程序啟動并運行時,有人發出了如下的tweet:

在這種情況下,正確的實時視圖應包含以下標簽及其統計信息(在我們的示例中為1,因為相應的hash標簽只使用了一次):

查詢

當終端用戶查詢hash標簽的統計結果時,我們只需要將批量視圖與實時視圖合并起來。 所以輸出應該如下所示:

場景

示例場景的簡化步驟如下:

  • 通過Apache Spark創建批處理視圖(.parquet)
  • 在Apache Spark中緩存批處理視圖
  • 流應用程序連接到Twitter
  • 實時監控#morningatlohika tweets
  • 構建增量實時視圖
  • 查詢,即合并批處理視圖和實時視圖

技術細節

源代碼基于Apache Spark 1.6.x,(在引入結構化流之前)。 Spark Streaming架構是純微型批處理架構:

所以處理流應用程序時,我使用DStream連接使用TwitterUtils的Twitter:

在每個微批次(使用可配置的批處理間隔),對新的tweets中hashtags的統計信息的計算,并使用updateStateByKey()狀態轉換函數更新實時視圖的狀態。 為了簡單起見,使用臨時表將實時視圖存儲在存儲器中。

查詢服務反映批處理和實時視圖的合并:

輸出

文章開頭提到的基于Hadoop的M/R管道使用Apache Spark來優化:

后記:

正如之前提到的Lambda Architecture有其優點和缺點,所以支持者和反對者都有。 有些人說批處理視圖和實時視圖有很多重復的邏輯,因為最終他們需要從查詢角度創建可合并的視圖。 所以他們創建了一個Kappa架構,并稱其為Lambda架構的簡化版。 Kappa架構系統是刪除了批處理系統,取而代之的是通過流系統快速提供數據:

但即使在這種情況下,Kappa Architecture中也可以應用Apache Spark,例如流處理系統:

責任編輯:未麗燕 來源: 網絡大數據
相關推薦

2016-12-20 09:47:38

Apache SparLambda架構

2021-07-20 10:59:22

云計算架構示例云應用

2014-02-14 15:43:16

ApacheSpark

2017-10-10 17:00:11

SparkHadoop數據處理

2018-02-02 15:50:07

決策樹Apache Spar數據

2014-03-26 10:52:24

Apache Spar

2017-04-01 14:01:50

Apache Spar內存管理

2018-02-08 18:00:49

Spark文件測試

2009-08-10 10:06:10

.NET Lambda

2022-06-01 13:52:11

開源大數據

2019-06-11 13:22:32

Lambda大數據架構大數據平臺

2016-11-25 23:04:00

AdMaster架構實踐

2017-06-26 15:00:17

2017-03-10 16:32:44

Apache Spar大數據工具

2025-07-28 09:15:00

代碼LambdaStream

2017-07-11 09:59:22

Apache Spar技術數據

2015-08-04 09:16:20

JavaLambda表達式

2010-04-21 13:31:11

Oracle時間

2022-12-15 17:15:42

數據庫NoSQL

2015-11-09 09:58:31

大數據Lambda架構
點贊
收藏

51CTO技術棧公眾號

国产日韩欧美电影| 成人欧美一区二区| 国产精品精品国产一区二区| 色噜噜狠狠色综合网| 国产精品国产精品国产专区不蜜| 九义人在线观看完整免费版电视剧| 中文字幕免费精品一区| 你懂的一区二区| av网站在线观看不卡| 欧美精品v日韩精品v韩国精品v| 欧美日本三级| 欧美极品一区| 亚洲大型综合色站| 亚洲午夜国产成人| 日韩精品大片| 亚洲风情在线资源站| 91麻豆精品国产综合久久久| 老牛影视免费一区二区| 亚洲一区二区三区四区五区中文| xxxx视频在线| 97操在线视频| 最新国产精品久久精品| 日韩漫画puputoon| 日韩av电影免费在线| 日韩欧美一区二区三区| 欧美变态挠脚心| 天堂…中文在线最新版在线| 欧美一区二区精品在线| 成人3d动漫在线观看| 国产a级一级片| 亚洲成人网在线| 日韩香蕉视频| 色视频在线观看福利| 2024亚洲男人天堂| 久久精品亚洲国产奇米99| 欧美日韩精品免费观看视完整| 久久国产日韩欧美| 在线观看不卡一区| **女人18毛片一区二区| 黄色免费看片| 91黄色8090| 国产亚洲一区字幕| 国产一区二区三区四区五区3d| 性做爰过程免费播放| 欧美一区二区三区在线看| 欧美日韩p片| 国产一级免费在线观看| 国产精品视频久久久久| 亚洲另类一区二区| 亚洲伊人春色| 性史性dvd影片农村毛片| 欧美又大又粗又长| 尤物在线观看一区| 欧美猛男同性videos| 国产精品粉嫩av| 日本欧美精品在线| 亚洲人一二三区| 一区三区在线欧| 男人免费av| 国产精品私拍pans大尺度在线| 一区二区三区免费在线观看| 五月国产精品| a4yy在线播放免费观看视频| 国产日韩综合一区二区性色av| 亚洲成av人影院| 911精品美国片911久久久| 激情综合闲人网| 精品网站在线看| 精品国产一区久久| 久久99国内精品| 电影亚洲一区| 久久久久久久久久久久久久国产| 欧美精品xxx| 玉足女爽爽91| 伊人精品在线| 99爱在线视频| 欧美日韩激情视频在线观看| 国语对白做受69| 亚洲一区日韩精品中文字幕| 亚洲欧美伊人| 波多野结依一区| 玩弄中年熟妇正在播放| 91精品国产成人www| 精品国产乱码久久久久久天美| 国内精品福利| 美女尤物在线视频| 国模吧无码一区二区三区| 青青a在线精品免费观看| 色综合久久天天| 男人的天堂亚洲一区| h1515四虎成人| 色偷偷福利视频| 国产精品日韩一区二区免费视频| 亚洲国产日韩欧美在线图片| 久久精品亚洲一区二区三区浴池| 欧州一区二区| 日本无删减在线| 黑人糟蹋人妻hd中文字幕| 国产精品久久久久影院日本| 欧美一区二区在线视频| av福利精品导航| 99久久精品费精品国产| 色婷婷在线播放| www.日日操| 国产激情美女久久久久久吹潮| 亚洲精品自拍第一页| 自拍av一区二区三区| 日韩午夜激情| 麻豆精品一区| 高清av在线| 女人天堂av手机在线| 91精品久久久久久久久久久久久久 | 在线国产一区| 182在线视频观看| 亚色视频在线观看| 久久大香伊蕉在人线观看热2| www.久久久久久.com| 欧美午夜丰满在线18影院| 国产乱码精品一区二区三区五月婷 | 国产精品久久久精品| 欧美videofree性高清杂交| ww久久中文字幕| 国产在线成人| 91成人短视频在线观看| 国产视频在线看| 成人精品小视频| 九九九九精品九九九九| 色综合久久精品亚洲国产 | 精品久久国产字幕高潮| 亚洲精品久久久蜜桃| 国产一区二区伦理片| 你懂的国产精品| 综合中文字幕| 国产天堂在线播放视频| 最色在线观看| 免费日韩视频在线观看| 欧美一区二区影视| 国产精品视频xxxx| 中文字幕欧美日韩精品| 69堂国产成人免费视频| 亚洲欧美日韩国产综合| 成人av先锋影音| 免费欧美在线| 久久日文中文字幕乱码| 日韩成人久久| 天堂√8在线中文| 成人性生交大片免费看午夜| 色爱综合网站| mm131午夜| 久久久久久久有限公司| 国产精品一区二区三区久久久 | 一区在线视频观看| 一区二区三区四区在线看| 成人在线视频观看| 亚洲综合影视| 国外av在线| 一级毛片免费视频| 91看片就是不一样| 欧美另类videosbestsex日本| 极品日韩久久| 亚洲www永久成人夜色| 欧美一级黑人aaaaaaa做受| 久久久精品在线| 亚洲乱码国产乱码精品精天堂| 欧美日韩极品在线观看一区| 亚洲综合激情另类小说区| 国产欧美一区二区三区鸳鸯浴 | 亚洲午夜电影在线观看| 国产欧美日韩三级| 成人福利视频在线看| 韩国v欧美v亚洲v日本v| 一本一道久久综合狠狠老精东影业| 日韩欧美电影| 精品国产一区二区三区香蕉沈先生| 中文字幕日韩高清在线| 国产成人免费| 九九热线视频只有这里最精品| 9999精品成人免费毛片在线看| av免费在线免费观看| 天天在线视频色| 无遮挡动作视频在线观看免费入口| 深夜福利视频在线免费观看| 最大av网站| 在线观看麻豆视频| 另类av导航| 两个人看的免费完整在线观看| 国产美女被遭强高潮免费网站| 综合激情丁香| 毛片毛片毛片毛片| 免费在线看污| 人成在线免费视频| 九色国产在线观看| a中文在线播放| 瑟瑟视频在线| 黄色在线观看视频网站| 亚洲欧美韩国| 日韩黄色三级在线观看| 在线精品自拍| 国产免费av一区二区三区| 99精品网站|