国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

對比Hadoop 分析Spark受多方追捧的原因

數據庫 Hadoop Spark
作者Mikio Braun是柏林工業大學機器學習專業的博士后,他通過描述了自己對Spark逐步認識的過程,為我們剖析了Spark的原理和應用。

作為通用的并行處理框架,Spark具有類似Hadoop的一些優點,而且Spark采用了更好的內存管理,在迭代計算上具有比Hadoop更高的效率,Spark還提供了更為廣泛的數據集操作類型,大大方便了用戶的開發,checkpoint的應用使Spark具有很強容錯能力,眾多優越的性能和比Hadoop更廣泛的適用面讓Spark的進一步發展值得期待。

  Apache Spark現在名聲大噪。為支持Spark項目成立的 Databricks公司 從Andereessen Horowittz那里募集了1400萬美元,Cloudera也已決定全力支持Spark,還有眾多其它公司也積極地加入這件大事。所以我覺得這正是我應該認真了解一下這場躁動的時候。

  我研究了一段時間的Scala API(用Scala寫的Spark),老實說一開始我很失望,因為Spark看起來真的太不起眼了。基本的抽象是Resilient Distributed Datasets(RDDs)和基本分布式不可變集,可以基于本地文件或通過HDFS存儲在Hadoop上的文件定義,提供常用的Scala-style集合操作(如映射,foreach等)。

  我的***反應是"沒搞錯吧,這真是基本分布式集合嗎?"。相比之下Hadoop就顯得豐富多了:分布式文件系統,眾所周知的Map Reduce,支持所有類型的數據格式、 數據源、單元測試、聚類變量等。

  其他人很快就指出還有更多,事實上Spark也提供更復雜的操作(如join、依據操作分組或規約),這樣你就可以為相當復雜的數據流建模(雖然沒有迭代)。

  隨著時間的推移我恍然大悟,原來Spark所謂的簡單其實說的大多是關于Hadoop中的Java API而不是Spark本身。即使是簡單的例子在Hadoop中通常也會有大量的樣板代碼。但從概念上講,Hadoop非常簡單,它只提供了兩種基本操作:并行的映射(Map)和規約(Reduce)操作。如果用相同的方式,對表示相似分布式集合,事實上將有更小的接口(有些項目像 Scalding就是處理類似的事情,并且代碼看起來很類似Spark)。

  Spark實際上提供了一組重要的操作,在這一點讓我信服以后,我通過這個 論文進行了更深入的研究,它描述了通用的架構。RDDs 是Spark的基本構造模塊,實際上真的很像分布式不可變集。這些定義的操作(如map或foreach),容易地進行并行處理;還有join運算,需要兩個RDDs和收集基于一個共同鍵的條目;以及依據操作規約,通過用戶指定基于鍵的函數來聚合條目。在單詞計數示例中,計數一次就將文本映射到所有的單詞,然后用鍵對他們進行規約,以此來實現字數統計。RDDs可以從磁盤中讀取,然后為提高速度而保留在內存中,他們也可以被緩存,那樣你就不需要每次都重讀他們。僅那樣就比Hadoop快了很多,這大部分是基于磁盤的速度。

  容錯機制也是Spark的亮點之一。取代給中間結果進行持久化或建立檢查點,Spark會記住產生某些數據集的操作序列。因此,當一個節點出現故障時,Spark會根據存儲信息重新構造數據集。他們認為這樣也不錯,因為其他節點將會幫助重建。

  所以本質上,Spark相比純粹的Hadoop,有更小的接口(可能在將來也會變得臃腫),但有許多基于之上的項目(例如像Twitter的 Scalding)達到了類似水平的表現。其他的主要區別是Spark默認情況下是在內存中,這自然帶來性能上很大的改善,甚至允許運行的迭代算法。雖然Spark已也沒有內置對迭代的支持,不過,就像他們宣稱的那樣:只要你想要,它就可以快到讓你可以進行迭代。

  Spark流——微批處理的回歸

  Spark還配有一個流數據處理模型,這當然讓我很感興趣。還有一篇對設計總結得很漂亮的 論文。與Twitter的 Storm框架相比,Spark采用了一種有趣而且獨特的辦法。Storm基本上是像是放入獨立事務的管道,在其中事務會得到分布式的處理。相反,Spark采用一個模型收集事務,然后在短時間內(我們假設是5秒)以批處理的方式處理事件。所收集的數據成為他們自己的RDD,然后使用Spark應用程序中常用的一組進行處理。

  作者聲稱這種模式是在緩慢節點和故障情況下會更加穩健,而且5秒的時間間隔通常對于大多數應用已經足夠快了。對于這一點,我不太確定,因為分布式計算總是很復雜,我不相信你能隨意說有些東西是就比其他人的好。這種方法也很好地統一了流式處理與非流式處理部分,這一點是千真萬確的。

  結束語

  Spark在我看來還是很有前途的,加上Spark被給予的支持和獲得的關注,我堅信它將成熟起來并將在這個領域扮演更加重要的角色。當然,它不可能適用于所有場景,正如作者承認的那樣,基于RDD穩定性只更改很少條目的操作就不適合。原則上,你必須對整個數據集備份,即使你只是想要更改一個條目。這可以很好地并行處理,但成本很高。copy-on-write在這里可能更有效,但是還未被實現。

 

  最上層是在TU Berlin的研究項目,有類似的目標,然而卻通過更為復雜的操作(如迭代)來發展,不僅是為了容錯能力存儲一系列操作,而且要將它們用于全局調度優化和平行化。

責任編輯:彭凡 來源: 天極網
相關推薦

2012-08-14 09:26:35

云計算集裝箱數據中心IDC

2013-05-15 16:43:38

2010-01-05 11:01:19

Oracle系統升級管理

2013-03-08 15:39:49

云時代OpenStackSDN

2015-01-05 16:02:40

頻話機“eSpace 華為

2011-12-05 14:07:17

虛擬化本地存儲桌面虛擬化

2009-03-31 17:06:58

LinuxNovellEnterprise

2019-08-26 14:31:02

2013-10-15 14:56:34

移動游戲

2019-08-27 10:00:02

深度學習

2020-05-27 11:20:37

HadoopSpark大數據

2016-11-02 09:57:12

數據數據經理數據分析

2020-04-03 16:25:26

機器視覺工業4.0工業物聯網

2017-05-05 14:47:05

互聯網

2017-02-14 13:11:23

HadoopStormSamza

2013-03-13 09:52:47

EDM網絡·安全技術周刊SDN

2016-04-21 10:54:15

友盟+UBDC全域大數據

2020-11-25 08:33:32

人工智能
點贊
收藏

51CTO技術棧公眾號

欧美xxxxxxxxx59| 久久久精品日韩| 福利成人在线观看| 中文字幕免费中文| 韩日视频在线观看| 亚洲伊人一本大道中文字幕| 最近2019年日本中文免费字幕| 亚洲 欧美综合在线网络| 国产成人在线视频网址| 亚洲综合激情| 中文在线播放一区二区| 精品中文在线| 欧美一级免费| 成人国产精品一区二区免费麻豆 | 99精品国产高清一区二区| 欧美日韩久久不卡| 亚洲人成在线观看一区二区| 国产亚洲欧美色| 成人高清av在线| 国内精品免费在线观看| 蜜臀av一区二区| 捆绑调教美女网站视频一区| 亚洲小说图片| 精品久久国产| 亚洲在线久久| 午夜精彩国产免费不卡不顿大片| 欧美日本一区| 毛片一区二区| 国产精品一二一区| 国产福利精品一区| 高端美女服务在线视频播放| 自拍视频在线| а√最新版地址在线天堂| avlululu| 成人av小说网| aaa毛片在线观看| 老司机午夜av| 国产无遮挡在线视频免费观看| 亚洲男人资源| 久草在线视频网站| 成人午夜毛片| 国产福利资源一区| 激情欧美日韩一区| 99精品欧美| www.欧美色图| 欧美午夜电影在线| 亚洲欧洲偷拍精品| 欧美一级大片在线观看| 97视频热人人精品| 欧美日韩视频免费| www.xxx亚洲| 在线观看男女av免费网址| 天堂av资源在线观看| 丝袜综合欧美| 欧美日韩看看2015永久免费| 亚洲激情专区| 久久国产精品亚洲77777| 亚洲国产一区二区精品专区| 亚洲区国产区| 亚洲精品第一国产综合野| 亚洲精品免费电影| 欧美一区二区网站| www.日韩免费| 狠狠色狠狠色综合人人| www.av毛片| aaa在线观看| 99国产精品免费网站| 奇米色一区二区| 亚洲成人免费影院| 亚洲精品资源在线| 91高清在线免费观看| 免费试看一区| caoporn97免费视频公开| 中文字幕在线看片| 麻豆久久一区| 日本中文字幕一区二区视频| 国产亚洲综合av| 亚洲国产精久久久久久| 久久久久久com| 在线精品亚洲一区二区| 天堂网www中文在线| 成人精品动漫一区二区三区| 日韩黄色一级片| 性感美女久久精品| 97精品国产97久久久久久免费 | 精品一区二区三区免费播放 | 在线不卡一区二区| 亚洲最大的成人网| 一区二区三区免费播放| 成年男女免费视频网站不卡| 激情亚洲综合在线| 久久精品在线免费观看| 国产精品久久久久久久岛一牛影视 | 亚洲毛片aa| 北条麻妃视频在线| 欧美jiizzhd精品欧美| 中文有码久久| 水中色av综合| 伊人国产精品| 欧美日韩综合| 欧美专区福利免费| 国产欧美短视频| 欧美日韩中文字幕精品| 亚洲天堂第一页| 国产麻花豆剧传媒精品mv在线| a∨色狠狠一区二区三区| 不卡一卡二卡三乱码免费网站| 国产亚洲欧美日韩精品| 国产呦系列欧美呦日韩呦| 国产 日韩 亚洲 欧美| 你懂得网站在线| 激情六月综合| 99精品欧美一区二区蜜桃免费 | 国产中文字幕日韩| 麻豆av福利av久久av| 亚洲黄色小视频在线观看| 污污网站在线看| 高潮久久久久久久久久久久久久| 婷婷亚洲最大| 26uuu久久天堂性欧美| 亚洲第一免费网站| 国产高清在线一区二区| 伊人色综合影院| 老司机午夜在线视频| 精品一区二区精品| 久久免费视频在线观看| 国际av在线| 国产精品99久久不卡二区| 欧美成人免费va影院高清| 在线播放av片| 成人在线观看a| 亚洲精品成人影院| 亚洲日本中文字幕| 中文字幕国内自拍| 久久国产高清| 欧美老女人xx| 97电影在线看视频| 国产精品理论片在线观看| 99视频国产精品免费观看| 美女网站视频一区| 婷婷久久综合九色国产成人| 小泽玛利亚av在线| 欧美成人亚洲| 欧美另类极品videosbestfree| seseavlu视频在线| 最近中文字幕一区二区三区| 久久久久九九九| 亚洲第一二三区| 欧美tk—视频vk| 在线看片你懂得| 国产69精品久久777的优势| 国产伦精品一区二区三区精品视频 | 在线视频超级| 一本到高清视频免费精品| 手机在线免费观看毛片| 久久电影网电视剧免费观看| 热99在线视频| 超碰国产精品一区二页| 亚洲黄色www网站| 少妇一级淫免费放| 99久久精品免费| 日本a级片久久久| 亚洲一区欧美二区| 国产精品污www一区二区三区| 成人看的羞羞网站| 国产成人在线一区二区| 日日夜夜综合| 中文字幕v亚洲ⅴv天堂| 亚洲狼人综合干| 亚洲福利国产| 欧美日韩一区在线观看| 久久久久久久9| 99精品女人在线观看免费视频| 亚洲欧美在线视频观看| 97超级碰碰碰久久久| 日日躁夜夜躁aaaabbbb| 在线成人视屏| 国产精品私房写真福利视频| 97免费高清电视剧观看| 综合图区亚洲| 国产在线麻豆精品观看| 日韩国产在线播放| 日韩精品视频一区二区在线观看| 91九色在线播放| 91污在线观看| 中文字幕精品久久久久| 成人午夜剧场免费观看完整版| 日韩毛片网站| 一区二区三区在线观看视频| 热草久综合在线| av网站无病毒在线| 免费成人在线影院| 全球成人中文在线| 阿v视频在线| 操日韩av在线电影| 日韩精品一级毛片在线播放| 色与欲影视天天看综合网| 成人午夜av| 亚洲欧美一二三| 亚洲乱码日产精品bd|