国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

數據分析工具篇——Spark計算原理

大數據 Spark
Hadoop的MR結構和YARN結構是大數據時代的第一代產品,滿足了大家在離線計算上的需求,但是針對實時運算卻存在不足,為滿足這一需求,后來的大佬研發了spark計算方法,大大的提高了運算效率。

Hadoop的MR結構和YARN結構是大數據時代的第一代產品,滿足了大家在離線計算上的需求,但是針對實時運算卻存在不足,為滿足這一需求,后來的大佬研發了spark計算方法,大大的提高了運算效率。

Spark的計算原理

spark的結構為:

節點介紹:

  1. Cluster Manager:在standalone模式中即為Master主節點,控制整個集群,監控worker。在YARN模式中為資源管理器負責分配資源,有點像YARN中ResourceManager那個角色,大管家握有所有的干活的資源,屬于乙方的總包。
  2. WorkerNode:可以干活的節點,聽大管家ClusterManager差遣,是真正有資源干活的主。從節點,負責控制計算節點,啟動Executor或者Driver。
  3. Executor:在WorkerNode上起的一個進程,相當于一個包工頭,負責準備Task環境和執行。
  4. Task:負責內存和磁盤的使用。Task是施工項目里的每一個具體的任務。
  5. Driver:統管Task的產生與發送給Executor的,運行Application 的main()函數,是甲方的司令員。
  6. SparkContext:與ClusterManager打交道的,負責給錢申請資源的,是甲方的接口人。

整個互動流程是這樣的:

  1. 甲方來了個項目,創建了SparkContext,SparkContext去找ClusterManager申請資源同時給出報價,需要多少CPU和內存等資源。ClusterManager去找WorkerNode并啟動Excutor,并介紹Excutor給Driver認識;
  2. Driver根據施工圖拆分一批批的Task,將Task送給Executor去執行;
  3. Executor接收到Task后準備Task運行時依賴并執行,并將執行結果返回給Driver;
  4. Driver會根據返回回來的Task狀態不斷的指揮下一步工作,直到所有Task執行結束;

運行流程及特點為:

  • Sparkcontext的作用:一是分發task,申請資源等功能外,更重要的一個功能是將RDD拆分成task,即繪制DAG圖。

借用上圖我們再來了解一下spark的運算過程:

  1. 構建Spark Application的運行環境,啟動SparkContext;
  2. SparkContext向資源管理器(可以是Standalone,Mesos,Yarn)申請運行Executor資源,并啟動StandaloneExecutorbackend;
  3. Executor向SparkContext申請Task;
  4. SparkContext將應用程序分發給Executor;
  5. SparkContext構建成DAG圖,將DAG圖分解成Stage、將Taskset發送給Task Scheduler,最后由Task Scheduler將Task發送給Executor運行;
  6. Task在Executor上運行,運行完釋放所有資源;

RDD計算案例

我們用一個案例來分析RDD的計算過程:

  • 在客戶端通過RDD構建一個RDD的圖形,如圖第一部分rdd1.join(rdd2).groupby(…).filter(…)。
  • sparkcontext中的DAGScheduler會將上步的RDD圖形構建成DAG圖形,如圖第二部分;
  • TaskScheduler會將DAG圖形拆分成多個Task;
  • Clustermanager通過Yarn調度器將Task分配到各個node的Executer中,結合相關資源進行運算。

DAGScheduler對于RDD圖形的劃分是有一定規律的:

 

  1. stage的劃分是觸發action的時候從后往前劃分的,所以本圖要從RDD_G開始劃分。
  2. RDD_G依賴于RDD_B和RDD_F,隨機決定先判斷哪一個依賴,但是對于結果無影響。
  3. RDD_B與RDD_G屬于窄依賴,所以他們屬于同一個stage,RDD_B與老爹RDD_A之間是寬依賴的關系,所以他們不能劃分在一起,所以RDD_A自己是一個stage1;
  4. RDD_F與RDD_G是屬于寬依賴,他們不能劃分在一起,所以最后一個stage的范圍也就限定了,RDD_B和RDD_G組成了Stage3;
  5. RDD_F與兩個爹RDD_D、RDD_E之間是窄依賴關系,RDD_D與爹RDD_C之間也是窄依賴關系,所以他們都屬于同一個stage2;
  6. 執行過程中stage1和stage2相互之間沒有前后關系所以可以并行執行,相應的每個stage內部各個partition對應的task也并行執行;
  7. stage3依賴stage1和stage2執行結果的partition,只有等前兩個stage執行結束后才可以啟動stage3;
  8. 我們前面有介紹過Spark的Task有兩種:ShuffleMapTask和ResultTask,其中后者在DAG最后一個階段推送給Executor,其余所有階段推送的都是ShuffleMapTask。在這個案例中stage1和stage2中產生的都是ShuffleMapTask,在stage3中產生的ResultTask;
  9. 雖然stage的劃分是從后往前計算劃分的,但是依賴邏輯判斷等結束后真正創建stage是從前往后的。也就是說如果從stage的ID作為標識的話,先需要執行的stage的ID要小于后需要執行的ID。就本案例來說,stage1和stage2的ID要小于stage3,至于stage1和stage2的ID誰大誰小是隨機的,是由前面第2步決定的。

Executor是最終運行task的苦力,他將Task的執行結果反饋給Driver,會根據大小采用不同的策略:

  • 如果大于MaxResultSize,默認1G,直接丟棄;
  • 如果“較大”,大于配置的frameSize(默認10M),以taksId為key存入BlockManager
  • else,全部吐給Driver。

 

責任編輯:未麗燕 來源: 數據python與算法
相關推薦

2021-01-13 15:24:29

數據分析工具HQL原理

2019-06-19 16:01:14

Spark數據分析SparkSQL

2015-09-23 09:24:56

spark數據分析

2015-09-08 09:24:26

大數據分析采購

2012-06-15 10:13:03

2016-11-09 14:28:04

Spark開源數據分析工具

2023-11-24 08:47:36

ScipyPython

2021-03-15 10:43:20

大數據數據分析工具

2017-10-11 11:10:02

Spark Strea大數據流式處理

2012-03-21 09:31:51

ibmdw

2020-04-22 13:27:20

數據分析模塊解決

2020-05-15 15:18:25

matlab數據分析

2015-08-21 14:34:46

Excel

2020-11-26 14:02:43

數據分析工具

2015-08-21 13:54:38

大數據

2015-07-08 15:07:23

大數據分析多少種工具

2015-08-14 10:28:09

大數據

2012-08-17 10:35:17

云計算存儲大數據

2012-03-19 10:20:59

云計算數據分析

2017-11-29 12:45:37

Apache Spar大數據數據分析
點贊
收藏

51CTO技術棧公眾號

好吊色欧美一区二区三区| 5566日本婷婷色中文字幕97| 亚洲品质自拍视频| 亚洲精品社区| 精品久久福利| 在线视频您懂的| 久久人人爽人人爽人人av| 成人午夜小视频| 日韩在线观看免费全| 91国内精品野花午夜精品| av亚洲精华国产精华精| 亚洲国产高清一区二区三区| 福利片一区二区| a√中文在线观看| 深夜福利视频在线免费观看| 国产精品欧美激情在线观看| 蜜桃导航-精品导航| 国产精品久久激情| 国产一区二区三区丝袜| 欧美日韩成人一区二区| 自拍偷拍国产亚洲| 国内精品久久久久影院色| 一区二区三区国产精华| 97久久亚洲| 亚洲精品88| 日本在线观看免费| 樱桃视频免费看| 超碰影院在线观看| 亚洲自拍偷拍一区二区三区| 国产欧美日韩在线播放| 国产成人精品一区二区三区| 久久亚洲影音av资源网 | 日韩avvvv在线播放| 色135综合网| 成人国产精品久久| 国产美女一区视频| 国产在线观看黄| 黄色网战入口| 黄色成人在线看| 一本久久a久久精品vr综合| 成人免费视频网站入口| 国产精品久久久久久久久免费看 | 欧美xoxoxo| 国产欧美黑人| 一区二区三区四区激情| 6080yy午夜一二三区久久| 亚洲缚视频在线观看| 日韩中文字幕高清在线观看| 一区二区三区四区视频免费观看| 小早川怜子影音先锋在线观看| 欧美尤物美女在线| 深夜福利视频在线观看| 黄网站app在线观看下载视频大全官网| 久久久噜噜噜www成人网| 日产精品久久久一区二区福利| 影音先锋男人资源在线| 欧美激情国产在线| 三级视频中文字幕| 欧美成人免费在线观看视频| 老汉色影院首页| 午夜精品视频在线观看一区二区| 国产精品久久久久久免费观看 | 91麻豆精品国产| 欧美午夜精品一区| 91黄视频在线观看| 91久久久免费一区二区| 精品久久久一区二区| 亚洲.国产.中文慕字在线| 一区二区成人在线观看| 亚洲人成伊人成综合网小说| 亚洲色图都市小说| 一区二区三区在线观看网站| 亚洲在线一区二区三区| 亚洲一区二区三区影院| 亚洲一区二区欧美日韩| 亚洲成人久久影院| 欧美性猛交xxxxx水多| 自拍偷自拍亚洲精品播放| 色呦呦在线观看视频| 亚洲人成网站在线播| 欧美一区二区三区四区久久| 一本大道av一区二区在线播放| 亚洲一区二区在线播放相泽| 亚洲精品国产成人久久av盗摄 | 色成人综合网| www.成人在线.com| 精品国产麻豆| 午夜视频一区二区在线观看| av综合网页| 色爱综合av| 日韩精品一区二区三区免费观看| 欧美xxxxx视频| 欧美日韩国产亚洲一区| 欧美日韩专区| 久久久久久久欧美精品| 日韩高清一区在线| 久久国产欧美日韩精品| 国产一区二区不卡老阿姨| 成人午夜又粗又硬又大| 成人国产精品免费| 欧美国产精品一区二区三区| 亚洲狼人国产精品| 日韩欧美亚洲一二三区| 91精品国产一区二区三区蜜臀 | 日本调教视频在线观看| 羞羞视频在线观看| 在线视频三区| 涩涩视频在线免费看| 亚洲国产综合在线观看| 日本欧美高清| 亚洲欧美色图| 欧洲毛片在线视频免费观看| 欧美理论在线| 免费在线视频一区| 一广人看www在线观看免费视频| 亚洲理论在线| 精品国产免费人成在线观看| 黄色影院在线播放| 最新中文字幕在线| 欧美激情欧美激情| 白嫩白嫩国产精品| 国产日韩精品一区二区浪潮av| 欧美日韩在线精品一区二区三区| 精品国产成人| 影音先锋在线影院| 尤物在线视频| 新片速递亚洲合集欧美合集| 久久精品国产亚洲blacked| 艳女tv在线观看国产一区| 日本网站在线观看一区二区三区| 国产乱xxⅹxx国语对白| 人妻少妇精品无码专区二区| 高清av影院| 欧美性videos| av成人在线播放| 国产中文精品久高清在线不| 亚洲欧美日本日韩| 久久综合久久综合久久综合| 午夜av一区二区| 亚洲精品白浆高清久久久久久| 美女撒尿一区二区三区| 97av自拍| 成人免费性视频| 深夜福利视频在线免费观看| 中文字幕在线官网| 成人激情在线| 国产精品影视在线| 亚洲午夜视频在线| 日韩精品电影网| 国产精品吹潮在线观看| 相泽南亚洲一区二区在线播放| 国产一区二区在线免费播放| 成人影院免费观看| 婷婷精品久久久久久久久久不卡| 久久久人成影片免费观看| 激情综合五月天| 亚洲一二三四在线观看| 日韩大片免费观看视频播放| 国产www精品| 裸体大乳女做爰69| 宅男宅女性影片资源在线1| 日本精品免费| 日本vs亚洲vs韩国一区三区 | 91短视频在线| 国产美女情趣调教h一区二区| 99久久人爽人人添人人澡| 国产视频一区欧美| 中文久久乱码一区二区| 欧美不卡一二三| 热99精品里视频精品| 中文字幕在线亚洲三区| 最近最新中文字幕在线| 欧美爱爱视频| 男人天堂欧美日韩| 亚洲综合在线视频| 最近2019好看的中文字幕免费| 成人永久免费| 女人扒开屁股爽桶30分钟| 欧美成年黄网站色视频| 国产精品色在线网站| 久99久精品视频免费观看| 一本色道久久综合精品竹菊| 欧美激情一区二区三区在线视频观看| av免费高清观看| 天堂av在线资源| 欧美日韩综合视频网址| 视频福利一区| 日韩av一级电影| 亚洲一区二区三区视频在线| 一区二区三区www| 国内精品视频在线播放| 99不卡视频| 国产精品第一| 免费视频一区二区三区在线观看| 一区二区三区产品免费精品久久75| 一区二区三区视频在线| 精品中文字幕一区| 草久在线视频| 给我免费播放日韩视频| 成人永久aaa|