国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Hadoop+GPU強(qiáng)強(qiáng)聯(lián)手的性能探索

云計(jì)算 Hadoop
Hadoop并行處理可以成倍地提高性能。現(xiàn)在的問題是如果將一部分計(jì)算工作從CPU遷移到GPU會(huì)怎么樣?能否更快理論上,這些處理如果經(jīng)過了并行計(jì)算的優(yōu)化,在GPU上執(zhí)行會(huì)比CPU快50-100倍。

Hadoop并行處理可以成倍地提高性能。現(xiàn)在的問題是如果將一部分計(jì)算工作從CPU遷移到GPU會(huì)怎么樣?能否更快理論上,這些處理如果經(jīng)過了并行計(jì)算的優(yōu)化,在GPU上執(zhí)行會(huì)比CPU快50-100倍。作為大數(shù)據(jù)專家和PaaS的推動(dòng)者,Altoros Systems研發(fā)團(tuán)隊(duì)一直致力于探索Hadoop+GPU的可能性,以及在實(shí)際的大規(guī)模系統(tǒng)中的實(shí)現(xiàn),這篇文章就是他們的部分研究成果。作者 Vladimir Starostenkov是Altoros Systems的資深研發(fā)工程師,他在實(shí)現(xiàn)復(fù)雜軟件架構(gòu)( 包括數(shù)據(jù)密集型系統(tǒng)和Hadoop驅(qū)動(dòng)的應(yīng)用程序)方面有五年經(jīng)驗(yàn),而且 對人工智能和機(jī)器學(xué)習(xí)算法也很感興趣。

技術(shù)現(xiàn)狀:

多年來,有很多將Hadoop或MapReduce應(yīng)用到GPU的科研項(xiàng)目。 Mars可能是第一個(gè)成功的GPU的MapReduce框架。采用Mars技術(shù),分析WEB數(shù)據(jù)(搜索和日志)和處理WEB文檔的性能提高了1.5-1.6倍。 根據(jù)Mars的基本原理,很多科研機(jī)構(gòu)都開發(fā)了類似的工具,提高自己數(shù)據(jù)密集型系統(tǒng)的性能。相關(guān)案例包括 分子動(dòng)力學(xué)、數(shù)學(xué)建模(如Monte Carlo)、基于塊的 矩陣乘法、財(cái)務(wù)分析、圖像處理等。

還有針對網(wǎng)格計(jì)算的 BOING系統(tǒng),它是一個(gè)快速發(fā)展、志愿者驅(qū)動(dòng)的中間件系統(tǒng)。盡管沒有使用Hadoop,BOINC已經(jīng)成為許多科研項(xiàng)目加速的基礎(chǔ)。例如, GPUGRID是一個(gè)基于BOINC的GPU和分布式計(jì)算的項(xiàng)目,它通過執(zhí)行分子模擬,幫助我們了解蛋白質(zhì)在健康和疾病情況下的不同作用。多數(shù)關(guān)于醫(yī)藥、物理、數(shù)學(xué)、生物等的 BOINC項(xiàng)目也可以使用Hadoop+GPU技術(shù)。

因此,使用GPU加速并行計(jì)算系統(tǒng)的需求是存在的。這些機(jī)構(gòu)會(huì)投資GPU的超級計(jì)算機(jī)或開發(fā)自己的解決方案。硬件廠商,如Cray,已經(jīng)發(fā)布了配置GPU和預(yù)裝了Hadoop的機(jī)器。Amazon也推出了EMR(Amazon Elastic MapReduce),用戶可以在其配置了GPU的服務(wù)器上使用Hadoop。

超級計(jì)算機(jī)性能很高,但是成本達(dá)數(shù)百萬美元;Amazon EMR也僅適用于延續(xù)幾個(gè)月的項(xiàng)目。對于一些更大的科研項(xiàng)目(兩到三年),投資自己的硬件更劃算。即使在Hadoop集群內(nèi)使用GPU能提高計(jì)算速度,數(shù)據(jù)傳輸也會(huì)造成一定的性能瓶頸。以下會(huì)詳細(xì)介紹相關(guān)問題。

工作原理

數(shù)據(jù)處理過程中,HDD、DRAM、CPU和GPU必然會(huì)有數(shù)據(jù)交換。下圖顯示了CPU和GPU共同執(zhí)行計(jì)算時(shí),數(shù)據(jù)的傳輸。

 

 

圖:數(shù)據(jù)處理時(shí),各組件之間的數(shù)據(jù)交換

箭頭A :數(shù)據(jù)從HDD傳輸?shù)紻RAM(CPU+GPU計(jì)算的初始步驟)

箭頭B :CPU處理數(shù)據(jù)(數(shù)據(jù)流:DRAM->chipset->CPU)

箭頭C :GPU處理數(shù)據(jù)(數(shù)據(jù)流:DRAM->chipset->CPU->chipset->GPU->GDRAM->GPU)

完成任何任務(wù)所需的時(shí)間總量包括:

CPU或GPU進(jìn)行計(jì)算所需的時(shí)間

數(shù)據(jù)在各個(gè)組件間傳輸所需的時(shí)間

根據(jù)Tom’s HARDWARE 2012年的CPU圖表,CPU的平均性能在15到130GFLOPS之間,而Nvidia GPU的性能范圍在100到3000+ GFLOPS。這些都是統(tǒng)計(jì)值,而且很大程度上取決于任務(wù)的類型和算法。無論如何,在某些情況下,一個(gè)GPU可以使節(jié)點(diǎn)速度加快5至25倍。一些開發(fā)者聲稱,如果你的集群包括多個(gè)節(jié)點(diǎn),性能可以提高50到200倍。例如,MITHRA項(xiàng)目達(dá)到了254倍的性能提升。 #p#

性能瓶頸:

那么,GPU對數(shù)據(jù)傳輸會(huì)有什么影響?不同類型的硬件傳輸數(shù)據(jù)的速率不同,超級計(jì)算機(jī)已經(jīng)在GPU上做過相關(guān)優(yōu)化,一個(gè)普通的計(jì)算機(jī)或服務(wù)器在數(shù)據(jù)傳輸時(shí)可能會(huì)慢得多。 通常在一個(gè)CPU和芯片集數(shù)據(jù)傳輸速率在10到20GBps之間(圖中的Y點(diǎn)),GPU和DRAM間的數(shù)據(jù)交換速率在1到10GBps之間(圖中的X點(diǎn))。雖然一些系統(tǒng)速率可達(dá)10GBps(PCI-E v3),大部分標(biāo)準(zhǔn)配置的GDRAM和DRAM間數(shù)據(jù)流速率是1GBps。(建議在真實(shí)的硬件環(huán)境中來測量實(shí)際值,因?yàn)镃PU內(nèi)存帶寬[X和Y]以及對應(yīng)的數(shù)據(jù)傳輸速率[C和B]可能差不多也可能相差10倍)。

雖然GPU提供了更快的計(jì)算能力,GPU內(nèi)存和CPU內(nèi)存間的數(shù)據(jù)傳輸(X點(diǎn))卻帶來了性能瓶頸。因此,對于每一個(gè)特定的項(xiàng)目,要實(shí)際測量消耗在GPU上的數(shù)據(jù)傳輸時(shí)間(箭頭C)以及GPU加速節(jié)省的時(shí)間。因此,最好的方法是根據(jù)一個(gè)小集群的實(shí)際性能估計(jì)更大規(guī)模系統(tǒng)的運(yùn)行情況。

由于數(shù)據(jù)傳輸速率可能相當(dāng)慢,理想的情況是相比執(zhí)行計(jì)算的數(shù)目,每個(gè)GPU輸入/輸出數(shù)據(jù)的量比較小。切記:第一,任務(wù)類型要和GPU的能力相匹配,第二任務(wù)可以被Hadoop分割為并行獨(dú)立的子流程。 復(fù)雜的數(shù)學(xué)公式計(jì)算(例如矩陣乘法),大量隨機(jī)值的生成,類似的科學(xué)建模任務(wù)或其它通用的GPU應(yīng)用程序都屬于這種任務(wù)。

可用的技術(shù)

JCUDA:JCUDA項(xiàng)目為Nvidia CUDA提供了Java綁定和相關(guān)的庫,如JCublas、JCusparse(一個(gè)矩陣的工作庫)、JCufft(通用信號(hào)處理的Java綁定)、JCurand(GPU產(chǎn)生隨機(jī)數(shù)的庫)等等。但 它只適用于Nvidia GPU。

Java Aparapi。Aparapi在運(yùn)行時(shí)將Java字節(jié)碼轉(zhuǎn)換為OpenCL,并在GPU上執(zhí)行。所有的Hadoop+GPU計(jì)算系統(tǒng)中,Aparapi和OpenCL的前景最被看好。Aparapi由AMDJava實(shí)驗(yàn)室開發(fā),2011年開放源代碼,在AMD Fusion開發(fā)者峰會(huì)的官網(wǎng)上可以看到Aparapi的一些實(shí)際應(yīng)用。OpenCL是一個(gè)開源的、跨平臺(tái)的標(biāo)準(zhǔn),大量硬件廠商都支持這個(gè)標(biāo)準(zhǔn),并且可以為CPU和GPU編寫相同的代碼基礎(chǔ)。如果一臺(tái)機(jī)器上沒有GPU,OpenCL會(huì)支持CPU。

創(chuàng)建訪問GPU的本地代碼。訪問GPU本地代碼進(jìn)行復(fù)雜的數(shù)學(xué)計(jì)算,要比使用綁定和連接器性能高很多,但是,如果你需要在盡可能短的時(shí)間內(nèi)提供一個(gè)解決方案,就要用類似Aparapi的框架。然后,如果你對它的性能不滿意,可以將部分或整個(gè)代碼改寫為本地代碼。可以使用C語言的API(使用Nvidia CUDA或OpenCL)創(chuàng)建本地代碼,允許Hadoop通過JNA(如果是Java應(yīng)用程序)或Hadoop Streaming(如果是C語言應(yīng)用程序)使用GPU。

GPU-Hadoop框架

也可以嘗試定制的GPU-Hadoop框架,這個(gè)框架啟動(dòng)于Mars之后,包括Grex、Panda、C-MR、GPMR、Shredder、SteamMR等。但是GPU-Hadoop多用于特定的科研項(xiàng)目,并且不再提供支持了,你甚至很難將Monte Carlo模擬框架應(yīng)用于一個(gè)以其它算法為基礎(chǔ)的生物信息項(xiàng)目。

處理器技術(shù)也在不斷發(fā)展。在Sony PlayStation 4中出現(xiàn)了革命性的新框架、Adapteva的多核微處理器、ARM的Mali GPU等等。Adapteva和Mali GPU都將兼容OpenCL。

Intel還推出了使用OpenCL的Xeon Phi協(xié)同處理器,這是一個(gè)60核的協(xié)同處理器,架構(gòu)類似于X86,支持PCI-E標(biāo)準(zhǔn)。雙倍精度計(jì)算時(shí)性能可達(dá)1TFLOPS,能耗僅為300Watt。目前最快的超級計(jì)算機(jī)天河-2就使用了該協(xié)同處理器。

很難說以上哪種框架會(huì)在高性能和分布式計(jì)算領(lǐng)域成為主流。隨著它們的不斷改善,我們對于大數(shù)據(jù)處理的理解可能也會(huì)改變。

責(zé)任編輯:王程程 來源: Network World
相關(guān)推薦

2015-04-16 16:04:32

云計(jì)算微軟云Azure

2014-09-24 10:33:04

飛利浦仙視電子

2015-03-13 13:05:43

APICloud

2009-02-28 16:13:49

NovellVMware虛擬化

2009-09-27 11:27:33

Hibernate3JBOSS 3.2

2014-10-15 16:31:48

IBMSAP企業(yè)云

2011-09-02 15:03:36

VMworld思科虛擬

2011-09-19 09:32:21

微軟Windows SerAzure

2025-01-14 08:20:00

CIOCEO

2014-09-04 10:06:09

浪潮金蝶云計(jì)算

2015-07-08 15:06:29

智慧商圈大連華為

2009-08-03 11:46:13

云計(jì)算BMC亞馬遜

2023-03-26 12:15:41

PandasPySpark分布式

2021-11-17 21:50:53

人工智能可視化

2016-10-25 17:04:48

京東云

2013-07-25 13:25:17

安卓

2012-09-21 14:00:30

紅帽Linux

2012-08-30 10:50:07

2016-03-24 18:10:36

IT解決方案深信服華勝天成
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

99久久精品国产毛片| 最近2019中文免费高清视频观看www99 | 自拍视频在线| 国产欧美精品日韩区二区麻豆天美| 日韩精品在在线一区二区中文| 日韩欧美电影| 国产精品高潮视频| 欧美三级午夜理伦三级小说| 久久精品免费电影| jizz亚洲女人高潮大叫| 亚洲欧美国产va在线影院| 日韩专区av| 日韩午夜激情视频| 亚洲综合影视| 精品区一区二区| 日本片在线看| 日韩av在线免费播放| free性欧美| 日韩成人久久久| 国内激情视频在线观看| 日韩亚洲电影在线| 日韩三级电影视频| 日韩女优制服丝袜电影| www视频在线免费观看| 日韩午夜在线观看视频| 蜜桃在线视频| 中文字幕日韩欧美在线视频| 国产高清精品二区| 98精品国产高清在线xxxx天堂| 欧美一区二区三区久久| 国产精品69av| 国产综合自拍| 中文字幕一区二区三区四区五区六区 | 999久久久91| 91精品国产综合久久香蕉922| 99热精品久久| 久久久99国产精品免费| 激情六月婷婷久久| 波多野结衣综合网| 亚洲欧美偷拍三级| 国产精品一区在线看| 精品国产三级a在线观看| 小早川怜子影音先锋在线观看| 久久精品国产v日韩v亚洲| 香蕉久久99| 精品国产电影| 成人动漫视频在线| 日本性视频网| 日韩欧美另类在线| 亚洲91网站| aa成人免费视频| 国产精品91xxx| 色琪琪免费视频网站| 91麻豆精品91久久久久久清纯| 国产啊啊啊视频在线观看| www.日本久久久久com.| 欧美高清视频手机在在线| 日韩三级电影网站| 国产精品色在线| 午夜激情在线观看| 久久亚洲一区二区三区四区五区高| 教室别恋欧美无删减版| 亚洲蜜桃在线| 一区二区三区在线免费| 日韩激情美女| 欧美在线视频一区二区| 日韩电影免费在线看| 成人拍拍拍在线观看| 欧美日韩卡一卡二| 日韩一区二区三区精品| 国产在线精品一区二区中文 | 亚洲高清视频在线| 男女免费观看在线爽爽爽视频| 欧美激情一区二区三区在线视频观看 | 色无极亚洲影院| youjizz.com亚洲| 亚洲欧美自拍偷拍| 99在线视频影院| 国产精品入口福利| 国产91富婆露脸刺激对白| 亚洲啪啪aⅴ一区二区三区9色| 亚洲亚裔videos黑人hd| 欧美日韩视频| 999www成人| 国产亚洲精品久久久| 欧美女人交a| 成人xxx免费视频播放| 亚洲精品成人网| 亚洲一区二区| 欧美视频免费播放| 日韩欧美一区中文| 97视频热人人精品免费| 蜜臀久久99精品久久久酒店新书| 日韩一区二区在线看| 欧美日韩在线网站| 久久久精品在线视频| 亚洲电影免费观看高清完整版在线观看 | 亚洲午夜私人影院| 91丨精品丨国产| 日韩av电影免费在线观看| 亚洲在线视频一区| 国产精久久一区二区| 亚洲精品日韩在线观看| 福利微拍一区二区| 久久夜色电影| 黄色免费观看视频网站| 亚洲成人精品视频| 国产一区亚洲| 95影院理论片在线观看| 欧美肥婆姓交大片| 成人动漫一区二区| 黄色漫画在线免费看| 免费久久久一本精品久久区| 欧美午夜www高清视频| 久草精品在线| www.99av| 欧美丰满少妇xxxxx| 国产91丝袜在线观看| 黄色在线看片| 欧美日韩国产精品一卡| 欧美天天综合网| 亚洲高清资源在线观看| 传媒在线观看| 国产99视频精品免视看7| 1024精品合集| 蜜桃tv一区二区三区| 免费裸体视频网站| 国产精品色悠悠| 精品毛片网大全| 久久精品影视| 91在线导航| 欧美日韩亚洲一区二区三区四区| 欧美欧美午夜aⅴ在线观看| 日韩视频不卡| 在线欧美三级| 成年人视频大全| 久久精品99久久久香蕉| 99视频精品免费视频| 免费一级欧美片在线观看网站| 99久久国产宗和精品1上映| 欧美黑人一区二区三区| 亚洲人成精品久久久久| 99热国内精品永久免费观看| av大片在线观看| 亚洲精品美女久久7777777| 亚洲美女黄色片| 成人99免费视频| 国产精品中文字幕制服诱惑| 香艳视频网站| 91网站在线看| 欧美精品亚洲一区二区在线播放| 亚洲美女色禁图| а√天堂资源官网在线资源| 国产精品久久久久久久久电影网| www.久久久久| 中文字幕在线不卡一区| 国产精品麻豆久久| 久久bbxx| 欧美极品少妇无套实战| 欧美人与物videos| 一区二区三区精品视频在线| 午夜精品偷拍| 亚洲精品永久免费视频| 妞干网在线免费视频| 国产精品xxx视频| 欧美日韩成人综合天天影院 | 黄色软件在线| 视频一区二区三区在线观看| 中文字幕亚洲一区二区三区| 欧美国产精品久久| 欧美网站在线| 亚洲wwww| 黄色免费看片| 精品免费日产一区一区三区免费| 精品国产露脸精彩对白| 久久日韩粉嫩一区二区三区| 亚洲免费二区| 依依综合在线| 免费播放av| 中文字幕免费在线不卡| 秋霞av国产精品一区| 精品久久久久久久人人人人传媒| 久久亚洲综合色一区二区三区| 亚洲欧美综合久久久| 快播电影网址老女人久久| 免费一级网站| 久久免费一级片| 91精品视频播放| 亚洲最新中文字幕| 欧美日韩综合视频| 99国产精品国产精品久久| 欧美激情日韩| 动漫一区二区三区| 黄色网页网址在线免费| 国产野外作爱视频播放| 欧美12av| 日本成熟性欧美| 日韩精品小视频| 激情久久av一区av二区av三区| 国产激情视频一区二区三区欧美 |