国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

京東萬臺規模Hadoop集群 | 分布式資源管理與作業調度

數據庫 大數據 其他數據庫 分布式 Hadoop
為了增加生產效率和節約成本,必須要將之前分散在各處的集群資源統一管理起來,組成一個超大集群對外提供服務,并且要讓各種并行框架可以利用它的存儲和計算資源進行業務處理。

京東為什么要做萬臺規模的Hadoop?

隨著京東的業務增長,原有的Hadoop集群已經無法滿足高速增長的存儲與計算需求。拆分集群雖然可以分擔一部分壓力,但帶來了另外的一些問題,如拆分集群之后假如某個業務無法避免的需要另外一個集群上的數據,這時便帶來了跨集群讀數據的問題,嚴重影響了作業執行效率。另一方面,各個集群總有閑忙時間,在某個集群閑時這些資源是浪費的并沒有產生價值。

為了增加生產效率和節約成本,必須要將之前分散在各處的集群資源統一管理起來,組成一個超大集群對外提供服務,并且要讓各種并行框架可以利用它的存儲和計算資源進行業務處理。

Hadoop 概述

Hadoop 作為大數據的處理平臺已經有十幾年的發展歷史。其設計思想是使用廉價的臺式機組成一個大的集群做分布式計算與數據存儲,利用冗余備份的方式保證數據的安全性和高可用,通過并行計算的方式完成超大數據集的快速處理。

通過增加節點的方式提升Hadoop集群的計算和存儲能力。通常在分布式并行處理數據時,移動計算代碼的成本會低于移動數據,所以Hadoop的MapReduce框架計算時會將計算代碼分發到每個數據節點上執行,利用數據本地性較少的網絡交互提升性能。

過去Hadoop 2.0版本之前,Hadoop在設計上包含兩部分,***部分是分布式存儲HDFS,另一部分是MapReduce 計算框架。自Hadoop2.0 版本之后,計算框架部分做了優化升級變成了我們現在用的YARN (Yet Another Resource Negotiator) , YARN提供了分布式資源管理和作業調度的功能,同時提供了統一的編程模型,通過這個編程模型很多計算框架可以遷移到YARN上來。

 

京東萬臺規模Hadoop集群 | 分布式資源管理與作業調度

從愿景上,Hadoop 致力于解決復雜數據的處理和運算,處理結構化和非結構化數據存儲,提供分布式海量數據并行處理。

回想過去我們使用MPI、OpenMP去實現一個分布式處理程序,那時我們需要自己控制程序的遠程啟動與停止,同時要自己編寫容錯代碼。現在Hadoop通過優化和抽象將這些繁瑣的、能夠通用的功能都封裝到了框架中,讓開發者只需要關注自己的業務邏輯代碼而不需要再寫一些錯誤重試和通訊相關的代碼,大大增加了開發效率。同時使用那些并不太擅長編寫代碼的數據工程師也可以輕松使用Hadoop集群去實現自己的分布式處理分析程序。

分布式資源管理

在Hadoop 2.0 YARN 架構下,主要有以下幾個組件:

1. ResourceManager:主節點服務,負責維護節點信息和負責資源管理與作業調度, 可以部暑兩臺并利用Zookeeper 實現高可用

2. NodeManager:計算節點服務,負責提供計算和管理當前節點上的Container進程。可以部署1~N臺

3. ApplicationMaster:用戶每提交一個應用都會包含一個ApplicationMaster, 負責與RM通訊申請或釋放資源與NM通訊啟動和停止Task. 監控任務的運行狀態

4. Container:Container是YARN中的資源抽象,它封裝了多個緯度的資源,如CPU、內存、磁盤等

5. Client:負責提交作業,同時提供一些命令行工具

 

 

京東Hadoop分布式資源管理與作業調度介紹

京東從很早之前就開始使用Hadoop,踩了很多坑,從過去摸著石頭過河到現在小有所成,無論是業務問題還是Hadoop框架本身的問題,我們都遇到過。

通過解決這些問題我們對Hadoop做了很多功能升級與修改,其中有一些功能回饋到了社區,另外一些沉淀到了我們自己的分支版本中。今天我們的Hadoop大數據平臺提供了豐富的功能、完善的工具,為京東大數據業務保駕護航。

目前在京東大數據環境下,為滿足不同業務對運行環境需求,我們利用Docker On YARN的模式把運行環境隔離做了隔離,允許每個人定制自己的運行環境安裝自己的算法庫。使用Linux CGroup的模式支持嚴格的計算資源隔離,保證每個作業的計算資源不受其他作業影響。另擴展了資源與調度模型,增加了GPU和其他硬件的調度支持。為業務方統一了日志查詢工具幫助快速定位錯誤。

過去大數據平臺這邊有各種小集群,如:Presto, Alluxio 等,每個小集群都有自己的一批機器,每臺機器上可能只部署一個服務,這些服務對機器的利用率并不高,甚至是浪費的,痛定思痛,我們決定利用YARN統一進行資源管理與調度。經過幾年的發展,我們將大部分的并行框架都移植到了YARN上運行(如:Presto、Alluxio),利用YARN的優勢和調度特點充分的利用這些機器資源,大大提升了集群資源利用率。  

同時我們也自研了Tensorflow On YARN 、Caffe On YARN 等一系列的深度學習框架與工具幫助算法工程師直接使用Hadoop集群進行算法處理。大大加快了算法與業務迭代速度。讓大數據平臺獲得了深度學習處理的能力。

 

京東萬臺規模Hadoop集群 | 分布式資源管理與作業調度 

后來為了更好的支持異地多活和跨地域擴展能力,我們再次改造升級實現了萬臺Hadoop集群分布式資源管理與調度系統,解決了之前單集群擴展瓶頸和無法有效支撐跨機房調度與災備的問題。該系統已經在線上部署,并經過了今年618的大促考驗,可以說是穩如磐石。

系統逐步鋪開上線之后我們將京東跨地域的幾個大數據機房實現了互聯,同時我們的HDFS也配套實現了同樣的跨機房功能,也在這時京東大數據處理平臺系統真正擁有了跨地域的部署與擴展能力。

系統具有非常強的靈活性,可以通過修改調度路由策略和存儲數據映射表,輕松的做到跨機房的作業遷移和數據遷移。同機房內不同集群之間可以實現作業跨子集群運行充分利用各集群資源,功能可隨時根據子集群負載動態開關,無需用戶參與,對用戶完全透明。

為了使新的大數據平臺系統更友好更易于管理使用,團隊開啟了界面化項目。我們利用WEB技術實現了面向管理員的大數據平臺管理系統,使用這套管理系統之后可以靈活方便的上下線子集群,實時管理和修改調度策略,不再需要像以前一樣登陸到對應的物理服務器上執行相關命令。通過標準化系統化,我們將運維命令封裝在了代碼里,每個命令執行前后都有相關的校驗與權限認證,減少人工操作時出現的誤操作,如果發生錯誤系統將自動回滾。

 

京東萬臺規模Hadoop集群 | 分布式資源管理與作業調度

平臺提供了基于用戶級的權限管理,可以很靈活的管理集群中計算資源的權限,以實現控制每個用戶可以使用的計算資源量大小和資源池使用權限認證。

真實生產環境中平臺會把資源按照一定的使用規則進行劃分,并分配相關的權限給對應的人或部門,從而避免某些用戶惡意提交作業到別人的資源池。同時平臺也細化了操作權限避免某些用戶惡意操作別人的作業(如:停止執行)。 

 

京東萬臺規模Hadoop集群 | 分布式資源管理與作業調度

之前大數據平臺會存在多個集群,每個集群對應自己的客戶端,每個客戶端對應自己的配置文件,運維起來麻煩不利于管理。

 

京東萬臺規模Hadoop集群 | 分布式資源管理與作業調度

調度架構修改升級完之后,從邏輯上可以理解為增加了一層調度抽象(Router),由原來的兩級調度變成了三級調度。也就是子集群的策略選擇。現在的作業提交流程是:

1. 客戶端先將作業提交請求發送給Router 

2. Router根據配置的調度信息將作業請求轉發給對應的子集群 

3. 子集群收到作業請求之后安排作業的運行

在這種方式下,每個客戶端使用同樣的一套配置文件,保證了客戶端輕量級,不再像之前一樣需要區分集群信息。所有的調度策略與邏輯都封裝在Router組件中。(所有的調度策略和控制信息我們保存在DBMS中)

增加了作業的動態跨子集群借用資源功能,可以隨時控制某個隊列中的相關作業是否需要跨子群執行。方便單個子集群在資源緊張時動態去借用另一個空閑集群的資源。

增加了邏輯隊列名的概念,對于用戶來說他們只需要關心自己的邏輯隊列名,而真正運行作業是在哪個物理隊列則不需要他們關心,通過這個功能平臺端可以隨時控制邏輯隊列真正運行在哪個子集群的哪個物理隊列。達到快速遷移或容災的目的。

為了避免Router意外丟失或掛掉,在Router組件方面,我們單獨開發了高可用和負載均衡功能,整個集群會部署多臺Router節點,每個機房都會有一個或多個Router, 客戶端的請求會根據負載和距離從分散的多個Router服務器上選擇一個最合適的。同時我們支持任何時間點Router掛掉(如果Router的連接狀態不可用客戶端會自動切換到另外一個Actvie的Router)

京東萬臺規模Hadoop集群 | 分布式資源管理與作業調度

下面是這個架構的邏輯框圖,包含了整個架構中所有組件。其中新增是Router和State&Policy Store 兩個組件,前者直接對接Client 屏蔽后端RM子集群相關信息提供提交與作業信息查詢的功能,可以同時部署多臺對外提供服務。后者負責保存當前所有子集群的狀態信息、Active RM 的地址信息和調度策略信息。(每隔一段時間子集群會以心跳的方式匯報自己當前的服務狀態并存儲到StateStore中)目前我們支持多種調度策略可以滿足多種場景下的調度需求。

具體提交流程如下:

1. Client 提交作業到Router上

2. Router 獲取邏輯隊列調度策略信息

3. 將作業提交請求轉提到對應的ResourceManager上,并保存Application相關信息到StateStore中

4. ResourceManager接收到請求后啟動AppMaster, AppMaster啟動之后向AMRMProxy發起資源請求

5. AMRMProxy 接收到這個請求之后,從State&Store Policy中讀取策略信息,判斷這個作業是否需要跨子集群運行

6. 向對應的子集群發送資源請求,AppMaster負責啟動請求到的Container

 

京東萬臺規模Hadoop集群 | 分布式資源管理與作業調度

 

超大規模Hadoop集群優化策略&優化思路

原生的調度器,存在很多問題。其中最主要的是性能問題,為此我們自研了一個基于隊列鏡像的多路分配策略,大大提升了ResourceManager調度器的性能,讓我們單個YARN子集群擁有了超過萬臺規模資源管理與調度能力。

另一方面豐富了調度器分配資源的算法邏輯,增加多個維度的排序篩選規則,多個規則之間可以組合使用,如:基于內存、基于負載 、基于使用率等等。

還有其他一些ResourceManager性能相關的代碼優化,如:簡化資源計算流程,拆分鎖等等。

在MapReduce方面優化了服務性能和框架功能。主要與Shuffle 服務相關。

優化&分析&測試工具    

Benchmark

  • HiBench  https://github.com/intel-hadoop/HiBench
  • Hadoop 自帶 Benchmark

JVM分析工具

  • http://gceasy.io/
  • http://fastthread.io

Linux 性能分析

  • Perf
  • NMON
  • Google Tools

未來展望與期待

京東大數據平臺的實踐提供了一種可供參考的技術架構與實施方式。未來,京東大數據平臺依然會在電商級分布式架構與技術方案演進方向繼續前進。對此我們也有一些新的功能即將上線。

一、如何利用集團內的資源節省成本

過去每年的大促都需要根據往年的流量進行機器的采購,大促結束之后這些機器利用率很低浪費了大量成本,為了解決這個問題,目前的大數據平臺已經與集團內的專有云-阿基米德完成了對接,平臺可以通過自動伸縮的方式彈性使用云資源,未來的大促中將利用這個功能去承接一部分計算任務。

二、大數據平臺產品化

 

京東在大數據處理方面積累了豐富的經驗,同時沉淀出了一些很優秀的中間件和服務產品,未來我們將陸續把這些產品云化對外提供服務。 

責任編輯:龐桂玉 來源: ITPUB
相關推薦

2017-08-10 10:17:32

Hadoop分布式搭建

2019-09-26 15:43:52

Hadoop集群防火墻

2017-10-27 08:40:44

分布式存儲剪枝系統

2023-03-01 08:44:42

OpenStackDockerK8S

2025-05-13 03:22:00

2013-05-09 15:39:30

Hadoop集群分布式

2014-08-13 10:47:18

分布式集群

2017-01-10 16:18:26

分布式存儲建設

2021-11-22 16:21:28

Kubernetes 運維開源

2017-10-17 08:33:31

存儲系統分布式

2020-09-29 19:20:05

鴻蒙

2023-06-26 00:14:28

Openjob分布式任務

2012-09-19 14:09:20

Hadoop開源

2017-01-16 14:51:26

京東分布式服務CallGraph

2016-12-15 19:41:23

應用調度資源管理華為HDG

2017-09-04 08:49:17

存儲原理架構

2017-12-07 15:24:10

Hadoop大數據服務器

2010-06-03 14:42:47

Hadoop分布式集群

2021-04-12 07:41:57

Centos7系統分布式集群

2021-08-16 09:55:41

鴻蒙HarmonyOS應用
點贊
收藏

51CTO技術棧公眾號

福利二区91精品bt7086| 欧美日韩国产成人在线观看| 亚州精品一二三区| 国产91高潮流白浆在线麻豆| 亚洲人成人77777线观看| 亚洲大片在线| 成人福利网站在线观看| 无码日韩精品一区二区免费| 欧美成人亚洲成人日韩成人| 欧美日韩国产网站| 亚洲天堂成人在线视频| av电影免费在线看| 亚洲成人激情在线观看| 美女精品视频| 精品福利一区二区三区| 18av在线播放| 精品国产不卡一区二区三区| 成人免费看片| 777奇米成人网| 天天影视久久综合| 欧美日韩免费高清一区色橹橹| 水莓100在线视频| 在线观看日韩国产| 高清福利在线观看| 欧美日韩五月天| 成人video亚洲精品| 精品日韩一区二区三区免费视频| 男人资源在线播放| 欧美一区二区三区免费大片| 国产激情在线观看| 精品国内片67194| h片视频在线观看| 亚洲人成伊人成综合网小说| 亚洲日本青草视频在线怡红院| av免费观看大全| 亚洲韩日在线| 国产精品毛片一区视频 | 欧美日韩激情在线| 美女视频黄a大片欧美| 国产中文欧美日韩在线| 日本美女爱爱视频| 亚洲男人av电影| 日本一区二区三区视频在线看| 国产亚洲一区二区精品| 一道本一区二区三区| 2024亚洲男人天堂| 国产一区二区三区黄视频 | 成人国产精品久久久久久亚洲| 免费看黄色91| 91蜜桃在线视频| 久久亚洲国产精品成人av秋霞| 欧美hdxxxxx| 热re91久久精品国99热蜜臀| 国产精品一区一区三区| 超级碰碰视频| 久久精品欧美一区二区三区不卡| 黄网站在线观看| 天天爱天天做天天操| 日本一区二区动态图| caoprom在线| 国产成人无码a区在线观看视频| 国内精品写真在线观看| 天堂av一区| 国产尤物av一区二区三区| 亚洲欧美一区二区三区久久| 久久精品国产99国产精品| 有码av在线| 日韩免费看网站| 一本久久知道综合久久| 国产极品人妖在线观看| 成人黄色免费看| a91a精品视频在线观看| 99热一区二区三区| 精品久久久久久| 国产电影一区二区三区爱妃记| 青青草视频在线观看| 国产成人精品视频| 中文字幕中文字幕中文字幕亚洲无线| 成人影院网站ww555久久精品| 欧美高清一级大片| 中文字幕五月欧美| 999久久久精品国产| 在线天堂av| 91精品久久久久久久久久久| 国产乱理伦片在线观看夜一区| 欧洲一级精品| 99福利在线观看| 久久精品影视伊人网| 久久久久久久国产精品影院| 九九久久婷婷| av大大超碰在线| 日本xxx免费| 97国产精品久久| 91精品欧美综合在线观看最新| 国产日产欧美一区| 国产一级一区二区| 欧美精品一线| 日韩成人在线观看视频| 美女欧美视频在线观看免费| 欧美乱妇高清无乱码| 欧美性xxxxx极品少妇| 奇米一区二区三区av| 欧美亚洲尤物久久| 国产一区二区三区亚洲综合| 欧美日韩高清在线一区| 亚洲午夜日本在线观看| 欧美videos粗暴| 一区不卡字幕| 欧美影院精品一区| 日本亚洲不卡| 欧美精品无码一区二区三区| 亚洲人成绝费网站色www| 久久九九国产| 欧美私人网站| 91久久精品国产91久久| 亚洲黄色性网站| 国产一区二区在线视频你懂的| 欧美激情国产精品日韩| 亚洲色图美腿丝袜| 奇米一区二区三区av| 丝袜美腿av在线| 四虎影院一区二区三区| 日韩写真欧美这视频| 99riav1国产精品视频| 色就是色亚洲色图| 国产精品视频99| 黄色精品一区二区| 欧美精选一区二区三区| 国产免费视频| 国语自产精品视频在线看抢先版图片| 成人一区二区三区中文字幕| 色猫猫成人app| 久久久久久久激情| 欧美国产视频日韩| 国产精品成人在线观看 | 久久婷婷色综合| 日本精品网站| 国产乱人伦精品一区二区三区| 日韩av网站大全| 韩国欧美国产一区| 国产精成人品2018| 牛夜精品久久久久久久| 51久久精品夜色国产麻豆| 中文字幕一区二区三区在线观看 | 爱爱免费视频网站| 国产精品久久久久免费a∨大胸| 亚洲第一福利视频在线| 欧美日本免费| 怡红院av在线| 成人av在线不卡| 久热国产精品视频| 一区二区三区免费| 亚洲天堂偷拍| 中国色在线日|韩| 久章草在线视频| 国产精品视频不卡| 在线不卡一区二区| 国产成人精品免费在线| 国产精品毛片视频| 日韩午夜影院| 亚洲综合欧美日韩| 欧美日本啪啪无遮挡网站| 亚洲国产精品影院| 日韩影院免费视频| 电影91久久久| 你懂的在线观看视频网站| 亚洲五月六月| 国语自产在线不卡| 欧美另类一区二区三区| 99re视频这里只有精品| 天天影视综合| 高清电影一区| 写真福利理论片在线播放| 亚洲欧美在线网| 国语自产在线不卡| 这里只有精品免费| 久久久综合激的五月天| 欧美黄色aaaa| 成人国产综合| 黄色av免费在线观看| 国产69精品久久久久999小说| 国产成人在线亚洲欧美| 欧美大肚乱孕交hd孕妇| 国产精品传媒入口麻豆| 亚洲一区日韩| 欧美在线关看| 欧美精品videossex少妇| 成人免费网址在线| 日韩影院一区| 国产精品久久久久久久久久三级 | 日本中文字幕中出在线| 成人毛片免费在线观看| 欧美一级爱爱| 日本不卡高字幕在线2019| 亚洲精品成人网| 亚洲国产另类av| www.亚洲色图.com| 国产精品久久久久9999高清| 国产毛片久久久| av电影一区|