国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

專訪阿里穆公:阿里巴巴 HBase 性能優化及容災經驗

原創
系統
HBase 是一個分布式的可擴展、非關系型開源數據庫。它很好地用Java實現了Google的Bigtable系統大部分特性,因此在數據量猛增的阿里巴巴非常受歡迎。本文中,阿里巴巴數據庫技術專家朱金清(穆公)給大家分享了阿里巴巴 HBase 性能優化及容災方面的經驗。

【51CTO專稿】隨著市場規模的擴大,產品與技術的發展,業務數據量越來越大,對海量數據的高效寫入和讀取變得越來越重要。 HBase 是一個分布式的可擴展、非關系型開源數據庫。它很好地用 JAVA 實現了 Google 的 Bigtable 系統大部分特性,因此在數據量猛增的阿里巴巴非常受歡迎。本文中,阿里巴巴數據庫技術專家朱金清(穆公)給大家分享了阿里巴巴 HBase 性能優化及容災方面的經驗。

(阿里巴巴數據庫技術專家 朱金清)

以下是采訪實錄:

第一部分:阿里巴巴 HBase 集群介紹

51CTO:朱老師您好!首先請您簡單地做一下自我介紹。

穆公:我是朱金清,在阿里的花名叫穆公,這個花名是我師兄取的,后來由于我們阿里武俠的花名都被取光了,只能取以前的皇帝的名字,我這個是以前的秦穆公,發音跟水工、電工、木工中的“木工”一樣。我主要是做數據庫相關的工作,來阿里巴巴之前,我在百度做 MySQL 。2011年年初來阿里巴巴了,主要做 MySQL/ HBase  相關的。

51CTO:阿里巴巴 HBase 集群的規模大概是什么樣兒?

穆公:現在我們總共在線加離線是有上千臺的機器,相對來說我估計應該算是國內比較大的。據我所知,百度好像不怎么用這個 HBase (早期的時候有用過),騰訊好像還沒怎么聽過。我知道有用 HBase 可能有幾家:小米、360和新浪,大概是這樣。我們這邊單獨的最大的集群在搜索,一個集群有二三百臺左右。

51CTO:阿里巴巴這邊 HBase 主要是用在搜索這個領域?

穆公:搜索的集群比較大,因為全網的日志我們要抓下來。不過很多場景都用到了,包括 kv 型行數據、append型的數據、日志業務、還要所有的歷史數據,我們現在也都是放在 HBase 上。如果你是全部作為備份分析的,那就放云梯那兒,如果你要實時查詢數據,或者是要查詢歷史數據,比如說我們的以往的訂單,都可以用 HBase 。

51CTO: HBase 典型的應用場景有哪些?

穆公:主要有幾種:

1、對高吞吐的寫入有要求的;

2、日志型的應用;

3、有全網的數據抓取的;

4、有消息類的;

5、分析類的(如離線分析用 HBase 也是很好的選擇,不過要跟在線分開);

6、結構易變類的。

51CTO:阿里巴巴對 HBase 的改進和擴展主要在哪些方面?

穆公:比如我報告里面說的容災方案 iback ,實現了跨機房容災和異常切換等。還有我們后端團隊也開發了 Replication 方案,然后在二級索引上我們的后端研發團隊也一起來做了一個二級索引的這個策略,這個二級索引現在在社區都還沒有怎么用,以前好像就是聽華為有一套二級索引,然后我們現在就是在這方面做,就相當于對它功能的一些完善。然后就是說 HBase 要走得更遠的話,那可能跨機房容災可能一定要做好,這一點我們也投入精力,現在看 Facebook 基本上也朝著這方面,基本上他們也是這么做,所以我覺得我們方向應該是比較對的。

51CTO:你們這邊有借鑒 Facebook 的經驗嗎?

穆公:有, Facebook 在 HBase 上打的 Patch 也比較多,我們可以直接把Patch拿過來,可能有一些能用,有一些不能用,我們就根據自己公司的實際情況,進行改進。我們跟 Facebook 溝通還是比較多的,上上周我去美國跟他們一起交流了這個,收獲還是很多的。

當然就 Facebook 來說,它是一個SNS的應用,應用可能相對單一一點。淘寶阿里這邊,又有交易,又有買家、賣家,是一個多維度的,相對來說,需求比較復雜多樣化。 Facebook 比較好,它的應用和產品沒那么復雜,把產品優化做到極致。在這方面,我們可能需要更多的學習一下。

51CTO:阿里巴巴的 HBase 跟 Facebook 的 HBase 主要的相同點和不同點分別是什么?

穆公:相同點:我們對 HBase 做事上的風格比較類似,組織結構也都蠻像的,有開發的團隊,有運維團隊;

不同點:我們比 Facebook 多了一個角色,我們有設計評審,相當于有點DBA的角色在里面,而 Facebook 可能是沒有太多這樣的。

阿里和 Facebook 都非常注重高可用和性能, Facebook 也在高可用上投入了很多的精力,阿里也如此。但是在性能上,阿里投入精力還可能不見得有那么多,這一點上我們需要根據自己的情況來彌補。#p#

第二部分:阿里巴巴 HBase 性能優化和容災經驗

51CTO:阿里是如何做好 HBase 性能優化的呢?

穆公:我覺得主要有幾部分,第一個就是說我們在一個業務上,因為性能優化不是說你上線了之后去優化,這是一種優化。還有一種優化就是說上線之前,我就幫它決定好,這個東西可能用什么樣的存儲更好,有可能比如說這個用了之后, HBase ,我們也注意了,以前可能不清楚 HBase 用了之后,可能性能還沒有多好,換了一個其他還更好,其實這主要是在于選型階段要做好。要確定好哪個是最合適的方案,這個我覺得是一個評審的優化,還有一個就是到底每一臺機器的性能的優化,每一臺機器性能優化,我們相當于算是上線之后的優化了,我們分為兩個方面,一個就是有硬件的解決方案,我們現在也有上 SSD 這個硬件,然后來提高隨機讀的性能,因為 HBase 隨機讀性能相對來說是比較一般的,而 MySQL 我覺得達不到那么好。還有一個就是相當于我們在進程,在 HBase 這個代碼上面進行優化,比如說我們現在也有后端的研發團隊也有做了二級索引的方案,就是提高這個讀查詢的性能,然后在代碼上面做了一些。剛才說了一個軟件一個硬件,現在我們也有軟硬件結合的方式,就是說這個代碼改了,然后用了 SSD 或者 FusionIO 這種硬件,然后讓它的讀取,就相當于查詢很好。

51CTO:有效地提高讀取的速度?

穆公:對,因為 HBase 現在寫性能很好,它需要更多做的是讀的性能要做得更好,所以慢慢可能是相對來說一個性能優化的一個更主要的一個地方,可能在讀取上。

51CTO:在做 HBase 性能優化的時候,主要注意事項有哪些?

穆公:一個就是說可能你對代碼能不清楚的話,我們可能盡量建議簡單的需求不要直接通過進入代碼來搞定,如果說在外圍或者配置參數能搞定的話,直接外圍或者配置修改來搞定。因為這樣的話,我可能升級代價也小,就是相當于如果能從外圍和配置搞定的,不從 HBase 底層就能搞定,我們建議在外面直接搞定。所以現在有一個優先級,如果必須得通過代碼改名,那就得這個代碼進來以Patch的形式,在不同的版本上都可以用,大概是這樣。性能優化還有一個就是說我們也希望說這個不是說什么場景我都去優化,就是對通用的,比如說這個東西做了一點就能很多集群都能提升,那這個產品我們更傾向通用問題的解決。

如果只是說對特殊產品的優化,我們可能會更傾向于推動應用一起來做優化,因為不然的話,可能會造成成本壓力,我需要買那么多機器來搞定一個業務,那就代價太大了,所以我們需要更通用的,這個東西解決的是一個共性的東西,這樣就比較好。

51CTO: HBase 在容災方面的一些經驗,您能否分享一下?

穆公: HBase 的容災,因為從需要其實我們還沒有容災上線,因為 HBase 如果你做一個離線分析,它其實不用管容災不容災,因為離線一存一分鐘兩分鐘沒有問題。如果你要做一個在線存儲,它就對這個可用性,服務持續性要求就很高了,所以我就覺得如果你要把這個東西做好,你容災一定要做好,容災現在有幾種,內部可能國內我們現在有容災,因為社區原來自帶的容災方案不好使,好像有一個限制是說儲備機器要一樣,這個不可能的,如果我這邊擴了兩臺,那邊也必須擴兩臺,代價太大了。所以后來我們用的時候,我們傾向于從外圍來做,就是要做容災的話,就像MySQL一樣,如果MySQL有一個自帶的Replication并不是容災,因為容災還有數據一致性,然后服務切換之后,就是說數據同步這是一部分,就是說如果你一層切換之后,數據一致性顯得更重要,所以這個東西是從 HBase 內部做不好。所以我們現在有自己做了一個,還有 Facebook 他們也自己做,我們思路是一樣的,我們并不知道他們具體產品叫什么,但是思路大概類似。

51CTO:在部署 HBase 時,哪個環節比較容易出故障?

穆公:因為它是一個分布式集群,所以單點故障率會比較高,就是一臺機器一層,比如說一個分布是有十臺機器,一臺機器掛了,這個是正常的,因為它是一個分布式,它能自己恢復,但是這中間需要時間。還有一個就是因為 HBase 現在還是快速發展中,它代碼等等有一些 Bug ,這個肯定我們以前也都遇到過,來了一個 Bug 又出現問題,所以這樣就導致你需要去把這些方面都考慮到,所以就相對來說,這些都是需要我們去注意的一個地方。

51CTO:一般故障出現最多的情況是?

穆公:我們最多的情況還是單機的故障,因為現在還算是比較穩定了,基本上如果我們用最新版,有可能會有問題,但是我們用相對穩定的版本,基本上還好,但是相對穩定的就有另外的問題,它可能性能并不是那么佳,但是因為集群那么多,又不可能說對每個集群都做一個升級,升級代價也會比較大,我們傾向于說每年會推一個大版本,第二年之后就新的業務上來了,我們就用新的版本,原來有一些需求需要升級的話,我們就把它升級掉。

還有就是 HBase 現在因為它的這個升級時間也稍微代價有點大,并不是說每個馬上就能升級,數據量也很大,然后一般現在在這個比如說我在升級過程中,有一些相應就會有波動,所以這些都需要導致我們不可能說所有的集群一下都升級了,我一直對這些重點的,有一些可能我覺得再加一兩臺機器能搞定,我們就傾向于這種方式來,就是這樣,所以我覺得這個代價是在可控的,而且還相對來說,有一些時候往往用硬件能解決問題,它其實我覺得代價還算是比較小的,因為這個集群的升級,它其實牽動的能力,比如開發也要幫忙配合一起來做,其實耗費的整體也是非常大的。#p#

第三部分:如何加入阿里巴巴 HBase 團隊?

51CTO: HBase 能否成為NoSQL領域的領導者?您是怎么看待這個問題的?

穆公:我覺得就目前來說,為什么我們選擇 HBase ?一方面我覺得它比較通用,它基于Hadoop之上,本身它就有一個先天的優勢,然后還有一個,它確實的寫入的性能還是很好的,讀取性能,你說現在說沒有那么好,但是我覺得也還可以了,只不過說我們現在讀業務,要求做到更極致的時候,不可能說機器成倍的長,我們所以需要做一些優化。然后現在的使用接口提供,或者功能各個方面,都是很完善的,所以在NoSQL上,特別是你要說持久化的NoSQL,就是 HBase 它是NoSQL,同時也支持持久化,就是不是NoSQL那種緩存系統,支持可以持久化的NoSQL,我覺得現在主流的,比如說像 cassandra ,還有MongoDB也算NoSQL,MongoDB確實量上億了之后,基本上性能就不怎么樣了, cassandra 之前有說,我覺得 cassandra 跟 HBase ,可能目前還是會是NoSQL里面,可能更大的兩個。但是 cassandra 之前也說了,它有不同的特性,它可能對一致性做得不好,但是它對可靠性要做得好,所以這個需要權衡。有可能像我們阿里三淘的業務等等,可能一致性就很高了,可能有一些比如說我說是其他一些離線分析或者等等這些,它可能延遲那么一點點也沒有問題,我覺得這種用 cassandra 也是很好的,我這次去國外一看,他們也有一些東西,還用的 cassandra ,對在線服務的一致性要求不高, cassandra 還是用得很好的。

現在就是說 Facebook 自己不用 cassandra ,這也說明釋放出了一個信號,可能說這個東西可以用,但是可能它相比較來說, HBase 更好一些,因為社區也更活躍,就是 HBase 現在還一直在發展,但是 cassandra 現在版本迭得很慢了,之前我看的是0.8還是多少,現在可能版本就沒有迭得那么快,因為開發 cassandra 的 Facebook ,他現在不怎么用這個東西, HBase 現在社區還是非常活躍的,然后去國外看的時候,Twitter也在用, Facebook 更不用說了, Facebook 應該是國外我估計用這個最大的,我們應該可能算是國內最大的,目前我還是不知道有哪個公司用得比我們更大,單說機器應該沒有,然后容量等等之類的,然后 ebay 也有用 HBase ,ebay 好像搜索也是用 HBase ,然后 Twitter 具體我還真不知道,它那些消息還是什么,我不知道它具體存在哪里,但是  Twitter 他們說最近很緊急的需要招人, HBase 這方面也要招人,重點說了這兩塊,所以基本上就是 HBase ,我覺得前景還是非常好的,基本上我覺得還是可以在近幾年還是會是最核心的一個  NoSQL ,我覺得近幾年應該是這樣,可能多年之后,會不會有一個新的 NoSQL 浪潮沖擊一下,那也是有可能的。

就目前而言, HBase 應該是在 NoSQL 里面發展前景比較好的,我也比較看好它。

51CTO:如果想加入阿里 HBase 這個團隊,需要具備哪些方面的素質,或者技術要領?

穆公:其實我們很缺 HBase 這方面的人才,如果大家有什么問題,可以私下聊,也可以聯系我,我們現在這個要求說高也蠻高的。

如果應屆生其實也還好,但是社招的話,我們一般要求就是說要有至少三年以上JAVA的一些開發能力,我們覺得這邊做下來,可能更多的是開發的工作,運維也需要開發東西來做,所以我關注的是以開發來解決 HBase 這個整體運維或者大規模云計算,都是以開發來解決這個問題,所以我覺得我更看重 JAVA 一些開發能力,如果有 Hadoop 的一些基礎,就是最好了。然后對網絡 TCP 協議之類的,要有一定的理解,網絡資源 RPC 的調用,還有其他就是最好也能寫一些腳本這樣子,要處理一些運維的事情。但是我覺得更關鍵的是好學,學習能力強,這個相對而言可能還更重要,如果 Hadoop 基礎你沒有,你夠聰明也沒有問題。

其次人比較踏實,有技術追求,我覺得就可以了,應屆生應該主要以這種為主,因為應屆生他可能不見得會有Hadoop跟 HBase 的經驗,但是我覺得它只要有JAVA的開發能力,然后自己有這方面的追求,我們阿里可以培養,歡迎這樣的優秀的應屆畢業生加入我們。

好的,專訪到此告一段落,非常感謝穆公的分享。

責任編輯:黃丹 來源: 51CTO.com
相關推薦

2010-06-28 10:43:47

2013-08-22 09:41:52

阿里巴巴去IOE王堅

2013-08-04 20:13:50

2013-11-07 11:26:08

2019-01-28 10:10:36

開源技術 趨勢

2009-06-30 13:28:54

阿里巴巴旺旺

2014-12-31 10:48:40

阿里巴巴馬云

2013-08-04 21:02:59

實時計算存儲阿里巴巴和仲

2009-02-27 10:46:32

DBA筆試題阿里巴巴

2023-03-29 09:42:32

2019-08-15 10:25:02

代碼開發工具

2013-08-22 09:36:45

阿里巴巴王堅阿里云

2013-08-08 10:34:50

阿里巴巴BAT

2012-09-11 10:09:54

阿里云

2013-10-30 16:40:55

阿里巴巴阿里云云計算

2009-06-22 09:38:49

阿里巴巴辦公環境

2010-08-25 14:33:59

抄底

2015-04-23 15:30:08

2015-06-12 10:12:30

2015-05-12 15:09:01

阿里巴巴公有云IaaS
點贊
收藏

51CTO技術棧公眾號

五月天丁香综合久久国产| 亚洲精品高清国产一线久久| 免费人成在线观看视频播放| 成人精品视频一区二区| 中文字幕一区二区三区四区五区人 | 国产一区二区三区四区五区美女 | 日韩在线欧美在线| 国产精品黄色av| 影音先锋男人的网站| 国产高清www| 波多野结衣在线观看| 国产aⅴ精品一区二区三区久久| 久久精品国产一区二区三区免费看| 欧美综合一区二区| 轻点好疼好大好爽视频| 美女爽到呻吟久久久久| 91亚洲国产成人精品性色| 欧美xxxxx视频| 欧美另类高清videos| 中韩乱幕日产无线码一区| 成人精品一区二区三区中文字幕| 蜜桃成人免费视频| 精品久久综合| 老鸭窝亚洲一区二区三区| 91免费看国产| 欧美一区亚洲| 国产精品乱码视频| 久久永久免费| 桥本有菜av在线| 99视频国产精品| 国产xxxxx视频| 亚洲男同1069视频| 深夜影院在线观看| 日韩一区二区在线观看视频播放| 丁香花视频在线观看| www.日韩视频| 美女毛片一区二区三区四区最新中文字幕亚洲 | 成人少妇影院yyyy| www.浪潮av.com| 国产精品九色蝌蚪自拍| 永久免费不卡在线观看黄网站| 欧美日韩另类字幕中文| а√天堂在线官网| 精品小视频在线| 国产精品午夜av| 91沈先生在线观看| 奇米精品一区二区三区四区 | 国产一级特黄a大片免费| 亚洲一区二区在线视频| 久久精品视频免费看| 在线视频国产日韩| 久久中文字幕二区| 亚洲精品一区二| 国产日产欧产精品推荐色| 中文有码在线观看| 亚洲欧美日韩中文视频| 九九在线高清精品视频| 无码免费一区二区三区免费播放| 国产精品每日更新| 久草免费在线| 性色av一区二区咪爱| 国产精品hd| 男女高潮又爽又黄又无遮挡| 无码av中文一区二区三区桃花岛| 色老太综合网| 91网站在线看| 91在线一区二区| 欧美另类极品| 2021久久精品国产99国产精品| 亚洲狼人精品一区二区三区| 成人在线免费播放视频| 欧美一区二区三区系列电影| 欧美成人一区在线观看| 在线观看欧美一区| 大荫蒂欧美视频另类xxxx| www.成人在线视频| 精品国产一区二区三| 中文字幕一区在线| 伊人网在线播放| 2022国产精品| 欧美国产成人在线| 超碰成人av| 成人欧美视频在线| 国产精品国产三级国产专播品爱网| 日韩精品分区| 91精品天堂| 亚洲图片激情小说| 日韩精品影院| 欧美成人一二三| 日本中文字幕一区二区视频| 日本视频一二三区中文字幕| 国产亚洲视频中文字幕视频| 亚洲综合99| 欧美在线一卡| 51久久精品夜色国产麻豆| 9人人澡人人爽人人精品| 欧美巨大xxxx做受沙滩| 亚洲一区二区三区成人在线视频精品| 国产欧美精品区一区二区三区| 成人福利视频| 日本一区二区三区四区在线观看| 欧美视频裸体精品| 色婷婷久久久| 99re精彩视频| 欧美肥婆姓交大片| www..com久久爱| 日韩和的一区二在线| 一区二区三区四区不卡| 欧美一区二区三区日韩| 亚洲黄色精品| 国产日本在线| 亚洲japanese制服美女| 亚洲欧美偷拍另类a∨色屁股| 国产一区二区三区| a在线视频观看| 综合136福利视频在线| 国产高清不卡一区| 亚洲第一会所001| 97超碰国产精品| 亚洲欧美国产精品va在线观看| 日韩和欧美一区二区| 国产写真视频在线观看| 久久国产精品一区二区三区| 欧美日韩中文字幕一区| 在线成人h网| 国产精品一区二区三区视频网站| 久久精品日产第一区二区三区精品版 | 国内精品国产成人国产三级粉色| 欧美一级视频免费看| 国产亚洲欧美一区| 捆绑紧缚一区二区三区视频| www.久久久久.com| 日本一区二区高清视频| 欧美精品色综合| 另类国产ts人妖高潮视频| 国产精品麻豆一区二区三区 | 91精品国产777在线观看| 国产精品免费视频网站| 欧美色网在线| 中文字幕人成乱码在线观看| 欧美日韩视频在线一区二区观看视频| 欧美男男青年gay1069videost| 香蕉视频国产精品 | 久久久久久久国产精品影院| 桃子视频成人app| 黑人糟蹋人妻hd中文字幕| 一夜七次郎国产精品亚洲| 91在线视频网址| 一区二区三区日本视频| 久热精品在线播放| 777午夜精品福利在线观看| 精品久久久国产| 一区二区电影| 爱情岛亚洲播放路线| 在线视频不卡国产| 欧美黑人国产人伦爽爽爽| 国产精品色一区二区三区| 91精品国产成人观看| 岛国视频免费在线观看| 亚洲最大免费| 日韩视频免费在线| 亚洲综合激情网| 欧美 日韩 国产 一区| heyzo在线| 五月丁香综合缴情六月小说| 国产成人精品视| 欧美三级午夜理伦三级中视频| 精品亚洲国内自在自线福利| 最近高清中文在线字幕在线观看1| 欧美一区一区| 伊人久久大香线蕉综合网站 | 97视频免费在线观看| 欧美国产精品专区| 美女少妇全过程你懂的久久| 免费在线国产| 日韩精品无码一区二区三区| 久久久精品美女| 欧美日韩国产专区| 日韩美女视频中文字幕| 欧美日韩精品免费| 青青草成人在线观看| 亚洲欧美日韩视频一区| wwwwxxxxx欧美| 一区二区导航| 18av在线视频| 丁香六月激情婷婷| 国产成人精品在线播放| 日韩午夜精品视频| 91蝌蚪porny| 翔田千里一区二区| 日本电影久久久| √天堂资源地址在线官网| 人妻激情另类乱人伦人妻| 成人黄色免费网站在线观看| 日韩美女视频在线| 亚洲美女淫视频| 视频一区二区三区在线| 国产在线日韩精品| 狠狠色噜噜狠狠狠狠色吗综合| 久久视频在线免费观看|