国产精品电影_久久视频免费_欧美日韩国产激情_成年人视频免费在线播放_日本久久亚洲电影_久久都是精品_66av99_九色精品美女在线_蜜臀a∨国产成人精品_冲田杏梨av在线_欧美精品在线一区二区三区_麻豆mv在线看

Hadoop Map-Reduce使用教程

開發(fā) 架構(gòu) Hadoop
在學(xué)習(xí)Hadoop的過程中,你可能會遇到Hadoop Map-Reduce方面的問題,本文就向大家介紹一下Hadoop Map-Reduce教程,歡迎大家一起來學(xué)習(xí)Hadoop方面的知識,希望本文的介紹對你的學(xué)習(xí)有所幫助。

本節(jié)從用戶的角度出發(fā),全面地介紹了Hadoop Map-Reduce框架的各個方面,希望通過本節(jié)介紹大家對Hadoop Map-Reduce有一定的認(rèn)識,歡迎大家一起來學(xué)習(xí)。

先決條件

請先確認(rèn)Hadoop被正確安裝、配置和正常運(yùn)行中。

概述

Hadoop Map-Reduce是一個使用簡易的軟件框架,基于它寫出來的應(yīng)用程序能夠運(yùn)行在由上千個商用機(jī)器組成的大型集群上,并以一種可靠容錯的方式并行處理上T級別的數(shù)據(jù)集。
一個Map-Reduce作業(yè)(job)通常會把輸入的數(shù)據(jù)集切分為若干獨(dú)立的數(shù)據(jù)塊,由map任務(wù)(task)以完全并行的方式處理它們。框架會對map的輸出先進(jìn)行排序,然后把結(jié)果輸入給reduce任務(wù)。通常作業(yè)
的輸入和輸出都會被存儲在文件系統(tǒng)中。整個框架負(fù)責(zé)任務(wù)的調(diào)度和監(jiān)控,以及重新執(zhí)行已經(jīng)失敗的任務(wù)。
通常,Map-Reduce框架和分布式文件系統(tǒng)是運(yùn)行在一組相同的節(jié)點(diǎn)上的,也就是說,計(jì)算節(jié)點(diǎn)和存儲節(jié)點(diǎn)通常在一起。這種配置允許框架在那些已經(jīng)存好數(shù)據(jù)的節(jié)點(diǎn)上高效地調(diào)度任務(wù),這可以使整個集群的網(wǎng)絡(luò)帶寬被非常高效地利用。

Map-Reduce框架由單獨(dú)一個masterJobTracker和每個集群節(jié)點(diǎn)一個slaveTaskTracker共同組成。這個master負(fù)責(zé)調(diào)度構(gòu)成一個作業(yè)的所有任務(wù),這些任務(wù)分布在不同的slave上,master監(jiān)控它們的執(zhí)行,重新執(zhí)行已經(jīng)失敗的任務(wù)。而slave僅負(fù)責(zé)執(zhí)行由master指派的任務(wù)。
應(yīng)用程序至少應(yīng)該指明輸入/輸出的位置(路徑),并通過實(shí)現(xiàn)合適的接口或抽象類提供map和reduce函數(shù)。再加上其他作業(yè)的參數(shù),就構(gòu)成了作業(yè)配置(jobconfiguration)。然后,Hadoop的jobclient提交作業(yè)(jar包/可執(zhí)行程序等)和配置信息給JobTracker,后者負(fù)責(zé)分發(fā)這些軟件和配置信息給slave、調(diào)度任務(wù)且監(jiān)控它們的執(zhí)行,同時提供狀態(tài)和診斷信息給job-client。
雖然Hadoop框架是用JavaTM實(shí)現(xiàn)的,但Map-Reduce應(yīng)用程序則不一定要用Java來寫。
HadoopStreaming是一種運(yùn)行作業(yè)的實(shí)用工具,它允許用戶創(chuàng)建和運(yùn)行任何可執(zhí)行程序(例如:Shell工具)來做為mapper和reducer。
HadoopPipes是一個與SWIG兼容的C++API(沒有基于JNITM技術(shù)),它也可用于實(shí)現(xiàn)Map-Reduce應(yīng)用程序。

Hadoop Map-Reduce輸入與輸出

Map-Reduce框架運(yùn)轉(zhuǎn)在<key,value>鍵值對上,也就是說,框架把作業(yè)的輸入看為是一組<key,value>鍵值對,同樣也產(chǎn)出一組<key,value>鍵值對做為作業(yè)的輸出,這兩組鍵值對的類型可能不同。
框架需要對key和value的類(classes)進(jìn)行序列化操作,因此,這些類需要實(shí)現(xiàn)Writable接口。另外,為了方便框架執(zhí)行排序操作,key類必須實(shí)現(xiàn)WritableComparable接口。
一個Map-Reduce作業(yè)的輸入和輸出類型如下所示:
(input)<k1,v1>->map-><k2,v2>->combine-><k2,v2>->reduce-><k3,v3>(output)

Hadoop Map-Reduce-用戶界面

這部分文檔為用戶將會面臨的Map-Reduce框架中的各個環(huán)節(jié)提供了適當(dāng)?shù)募?xì)節(jié)。這應(yīng)該會幫助用戶更細(xì)粒度地去實(shí)現(xiàn)、配置和調(diào)優(yōu)作業(yè)。然而,請注意每個類/接口的javadoc文檔依然是能提供最全面的
文檔;本文只是想起到教程的作用。
我們會先看看Mapper和Reducer接口。應(yīng)用程序通常會通過提供map和reduce方法來實(shí)現(xiàn)它們。
然后,我們會討論其他的核心接口,其中包括:JobConf,JobClient,Partitioner,OutputCollector,Reporter,InputFormat,OutputFormat等等。
最后,我們將以通過討論框架一些有用的功能點(diǎn)(例如:DistributedCache,IsolationRunner等等)的方式來收尾。

Hadoop Map-Reduce核心功能描述

應(yīng)用程序通常會通過提供map和reduce來實(shí)現(xiàn)Mapper和Reducer接口,它們組成作業(yè)的核心。
Mapper
Mapper將輸入鍵值對(key/valuepair)映射到一組中間格式的鍵值對集合。
Map是一類將輸入記錄集轉(zhuǎn)換為中間格式記錄集的獨(dú)立任務(wù)。這種轉(zhuǎn)換的中間格式記錄集不需要與輸入記錄集的類型一致。一個給定的輸入鍵值對可以映射成0個或多個輸出鍵值對。
HadoopMap-Reduce框架為每一個InputSplit產(chǎn)生一個map任務(wù),而每個InputSplit是由對應(yīng)每個作業(yè)的InputFormat產(chǎn)生的。

概括地說,對Mapper的實(shí)現(xiàn)者需要重寫JobConfigurable.configure(JobConf)方法,這個方法需要傳遞一個JobConf參數(shù),目的是完成Mapper的初始化工作。然后,框架為這個任務(wù)的InputSplit中每個鍵值對調(diào)用一次map(WritableComparable,Writable,OutputCollector,Reporter)操作。之后,應(yīng)用程序可以通過重寫Closeable.close()方法來執(zhí)行相應(yīng)的清理工作。
輸出鍵值對不需要與輸入鍵值對的類型一致。一個給定的輸入鍵值對可以映射成0個或多個輸出鍵值對。通過調(diào)用OutputCollector.collect(WritableComparable,Writable)可以收集輸出的鍵值對。

應(yīng)用程序可以使用Reporter報(bào)告進(jìn)度,設(shè)定應(yīng)用級別的狀態(tài)消息,更新Counters(計(jì)數(shù)器),或者僅是表明自己運(yùn)行正常。
框架隨后會把與一個特定key關(guān)聯(lián)的所有中間過程的值(value)分成組,然后把它們傳給Reducer以產(chǎn)出最終的結(jié)果。用戶可以通過JobConf.setOutputKeyComparatorClass(Class)來指定具體負(fù)責(zé)分組的Comparator。
Mapper的輸出被排序后,就被劃分給每個Reducer。分塊的總數(shù)目和一個作業(yè)的reduce任務(wù)的數(shù)目是一樣的。用戶可以通過實(shí)現(xiàn)自定義的Partitioner來控制哪個key被分配去哪個Reducer。
用戶可選擇通過JobConf.setCombinerClass(Class)指定一個combiner,它負(fù)責(zé)對中間過程的輸出進(jìn)行本地的聚集,這會有助于降低從Mapper到Reducer數(shù)據(jù)傳輸量。
這些被排好序的中間過程的輸出結(jié)果通常是以SequenceFile格式的文件被存放的。應(yīng)用程序可以通過JobConf控制對這些中間結(jié)果是否進(jìn)行壓縮以及怎么壓縮,使用哪種ompressionCodec。本節(jié)關(guān)于Hadoop Map-Reduce相關(guān)內(nèi)容介紹到這里。
 

【編輯推薦】

  1. Hadoop MapReduce的簡單應(yīng)用Cascading詳解
  2. 如何實(shí)現(xiàn)Cassandra與Hadoop MapReduce的整合?
  3. Hadoop集群與Hadoop性能優(yōu)化
  4. HadoopHBase實(shí)現(xiàn)配置簡單的單機(jī)環(huán)境
  5. 深入剖析Hadoop HBase

 

 

 

責(zé)任編輯:佚名 來源: csdn.net
相關(guān)推薦

2014-03-18 10:16:58

SVM

2015-01-08 14:52:29

google云計(jì)算分布式計(jì)算框架

2023-01-03 13:30:14

C++代碼map

2024-01-10 08:47:48

Python函數(shù)Map()

2024-11-08 12:42:34

Rustmapfilter

2021-03-22 06:28:44

reducemap函數(shù)

2024-06-04 00:20:00

Python函數(shù)

2024-07-11 12:14:20

Pythonmapfilter

2022-03-01 08:40:34

StormHadoop批處理

2021-09-29 06:03:37

JavaScriptreduce() 前端

2022-12-11 09:27:01

MapReduceHadoop框架

2021-03-05 07:45:59

JSreducemap

2025-04-11 08:00:00

函數(shù)式編程Python

2010-07-21 10:18:41

Perl map函數(shù)

2021-08-11 06:57:16

ShuffleSpark核心

2019-04-22 15:24:24

HadoopSuffleMap端

2012-06-05 09:54:50

Windows Pho

2015-08-26 10:18:40

hbase

2024-08-19 00:01:00

2020-11-06 07:53:59

MapJavaHashMap
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號

色播五月综合| 看黄网站在线观看| 一区二区国产在线观看| 欧美资源在线观看| 99综合99| 久久久极品av| 成人av色网站| 一二美女精品欧洲| 神马久久资源| 亚洲免费小视频| 人人草在线视频| 亚洲国产日韩精品在线| 欧美24videosex性欧美| 日韩一区二区不卡| 最爽无遮挡行房视频在线| 日韩三级高清在线| 福利小视频在线| 亚洲美女视频网站| 99久久er| 中文字幕久久久| 伊人久久大香线蕉综合影院首页| 日韩中文字幕久久| 日韩欧洲国产| 国产精品久久久久久久久男| 日韩精品永久网址| 国产精品区一区二区三含羞草| 亚洲高清激情| 免费在线观看一区二区| 蜜桃视频第一区免费观看| 中国人体摄影一区二区三区| 成人福利视频网站| 4虎在线播放1区| 日本福利一区二区| 久久电影网站| 久久久成人av| 欧美日韩久久精品| 精品日本一区二区三区| 国产中文一区二区三区| www国产精品内射老熟女| 国产精品乱码人人做人人爱| 黄色直播在线| 91精品啪在线观看国产60岁| 欧美三级网站| 久久久免费在线观看| 国产精品88久久久久久| 国产精品一级久久久| 九色porny丨国产精品| 91黄色小网站| 欧美午夜精品久久久久久人妖| 91精品久久| 久久伊人精品一区二区三区| 欧美一级精品片在线看| 免费国产在线精品一区二区三区| 国产aⅴ综合色| 人与动性xxxxx免费视频| 7777精品伊人久久久大香线蕉完整版| 伊人久久综合一区二区| 欧美一级淫片aaaaaaa视频| 黄色欧美日韩| 欧美日韩亚洲一| 色欧美88888久久久久久影院| 北岛玲heyzo一区二区| 欧美在线播放视频| 日韩和欧美一区二区三区| 久久久久久久少妇| 欧美精品18+| 第一区第二区在线| 欧美精彩一区二区三区| 欧美国产成人精品| 性xxxxfjsxxxxx欧美| 97视频在线看| 免费精品99久久国产综合精品| 国产成人综合美国十次| 日韩欧美国产三级| 久草成人资源| www.99riav| 欧美性猛交xxxx免费看漫画| av免费在线一区| 不卡视频一区二区| 亚洲国产精品ⅴa在线观看| 97超碰资源站在线观看| 日韩av电影在线免费播放| 黄页网站大全一区二区| 一区二区三区高清在线视频| 在线看欧美日韩| 小嫩嫩精品导航| 成人网18免费网站在线| 日韩av影片在线观看| 自拍欧美日韩| ·天天天天操| 热re99久久精品国产66热| 国产亚洲一区二区手机在线观看| 4438x亚洲最大成人网| 欧美男女交配| 精品国产一二三区| v天堂福利视频在线观看| 国产成人午夜精品| 亚洲精品久久久久久国产精华液| 国产精选在线| 99三级在线| 中文字幕一区二区三中文字幕| а√在线天堂官网| 国产精品区一区二区三在线播放 | 人妻av无码专区| 欧美日韩aaaaaa| 国产视频福利在线| 国产日韩精品推荐| 国产福利电影一区二区三区| 欧美黄网站在线观看| 成人av在线一区二区三区| 少妇激情一区二区三区| 中文字幕亚洲欧美日韩2019| 九九**精品视频免费播放| 一本色道无码道dvd在线观看| 欧美一区二区三区思思人| 日韩1区在线| 日本一极黄色片| 日韩一中文字幕| 国内外成人在线| gogo高清午夜人体在线| 国产精品免费网站| 成人免费一区二区三区视频| 日韩一区二区三区色| 久久久久久久久久久99| 亚洲视频在线视频| 国产成a人亚洲| 亚洲精品555| 免费不卡av在线| 中文字幕在线亚洲| 成人三级伦理片| 精品自拍视频| av黄色在线网站| 欧美大片在线免费观看| 久久精品一区二区三区不卡牛牛| 久久久久久久性潮| 日本免费不卡一区二区| 久色乳综合思思在线视频| 91原创在线视频| av国产精品| 777视频在线| 欧美一级淫片丝袜脚交| 夜夜嗨av一区二区三区网页| 加勒比久久综合| 天堂在线看视频| 99re在线视频观看| 日韩欧美亚洲一区二区| 日本欧美一区二区三区| 亚洲一级少妇| 北条麻妃在线一区| 国产成一区二区| 欧美色播在线播放| 亚洲在线日韩| 女子免费在线观看视频www| 一区二区不卡在线| 亚洲女人天堂网| 日本一区二区在线不卡| 天堂99x99es久久精品免费| 最新地址在线观看| 亚洲综合中文字幕在线| 欧美一区二区成人| 东方欧美亚洲色图在线| 99re热精品视频| 男男激情在线| 欧美爱爱视频网站| 精品国产一区二区三区久久久| 中文字幕中文字幕在线一区 | 亚洲一区二区在线视频| 欧美黄污视频| 国产探花视频在线观看| 日本xxxxxxxxxx75| 日韩欧美在线网站| 亚洲欧美日韩网| 亚洲精品狠狠操| 久久亚洲精华国产精华液| 欧美电影《睫毛膏》| 伊人精品视频| 久久一留热品黄| 日韩欧美一区在线| 国产激情久久久| 97中文字幕在线| 亚洲永久精品免费| 国产伦久视频在线观看| 亚洲大胆av| 色综合咪咪久久| 91成人在线视频| 国产www免费| 欧美成人毛片| 国产午夜精品在线观看| 日韩中文字幕在线免费观看| 黄色录像特级片| av中文在线资源库| 美女写真久久影院| 黄页网站视频在线观看| 国产精品免费视频一区二区 | 91a在线视频| 国产精品美女免费看| 91sa在线看| 668精品在线视频| 国产精品日韩高清| 久久久久久伊人|