VMware對大數據平臺Hadoop實現虛擬化
譯文VMware近日宣布了取得的進展,這些進展讓vSphere得以管理Hadoop集群。
這樣一來,VMware讓成千上萬的VMware企業客戶有辦法借助它們已經熟悉的軟件來處理部署的Hadoop系統。從技術方面來說,這推進了該公司在虛擬化基礎設施上運行Hadoop節點方面所開展的工作,從而將虛擬化的優勢帶到了大數據平臺。
VMware近期宣布推出VMware vSphere大數據擴展件(VMware vSphere Big Data Extensions)的公共測試版,這將讓該公司廣受歡迎的基礎設施管理軟件可以控制客戶建立起來的Hadoop集群。這些擴展件仍然需要一個基礎性的Hadoop平臺,而HortonWorks、MapR、Cloudera等廠商或者VMware的合作伙伴Pivotal各處發行的Hadoop平臺都基于開源Apache代碼。大數據擴展件現在讓那些發行版可以通過vSphere來加以管理。市場調研公司Taneja Group的高級分析師Michael Matchett表示,VMware讓私有企業能夠將自己的大數據作為一項服務來托管。
VMware能推出這些功能還得益于它在Serengeti項目方面開展的工作,該項目旨在優化在虛擬化基礎設施上運行上的Hadoop集群。Matchett表示,這是該大數據項目邁出的可能很重要的一步,對部署Hadoop的公司而言更是如此。在虛擬機上、而不是在裸機上運行Hadoop節點帶來了與虛擬化計算服務器同樣的許多優勢:可以更有效地利用硬件資源,而且增強了管理系統方面的靈活性。Matchett表示,用戶可以在虛擬環境下托管Hadoop,因為這讓用戶能夠混搭其他工作負載,并且充分利用跨多個客戶端的基礎設施。
其他公司也在努力對Hadoop集群實現虛擬化。亞馬遜云網絡服務公司(AWS)提供了Elastic Map Reduce(EMR)解決方案,這基本上是一項類似Hadoop的、基于公共云的服務。不過,VMware主要針對私有云和部署在客戶處的系統。
為vSphere增加支持還可能預示著VMware打算作出其他舉措。比如說,VMware可能擴展該平臺,以便使用該公司即將發布的公共云產品(定于今年晚些時候發布),可以輕松遷移由vSphere管理的Hadoop工作負載。其他公司、尤其是微軟可能是下一個將推出支持自身管理軟件的功能,以便在Windows Systems Center環境下控制在該公司的虛擬機管理程序:Hyper-V上的Hadoop發行版。
VMware宣布的這些新功能是公共測試版的一部分,使用vSphere 5.1的客戶現在可以報名申領公測版;預計這些功能會在年底前正式投放市場。除了宣布這些擴展件外,VMware還表示Serengeti項目支持來自Apache Hadoop的***開源代碼,其中包括新的YARN功能:Hadoop社區的一些人認為,這款資源管理器有望為基于Hadoop平臺開發的新應用程序打開閘門。



















