日本搞逼视频_黄色一级片免费在线观看_色99久久_性明星video另类hd_欧美77_综合在线视频

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > 互聯網 > 通過簡單的Word Count講解MapReduce原理以及Java實現

通過簡單的Word Count講解MapReduce原理以及Java實現

來源:程序員人生   發布時間:2014-10-04 08:00:00 閱讀次數:2524次

MapReduce原理:

      MapReduce采用"分而治之"的思想,把對大規模數據集的操作,分發給一個主節點管理下的各個分節點共同完成,然后通過整合各個節點的中間結果,得到最終結果。簡單地說,MapReduce就是"任務的分解與結果的匯總"

 

  在Hadoop中,用于執行MapReduce任務的機器角色有兩個:一個是JobTracker;另一個是TaskTrackerJobTracker是用于調度工作的,TaskTracker是用于執行工作的。一個Hadoop集群中只有一臺JobTracker

 

  在分布式計算中,MapReduce框架負責處理了并行編程中分布式存儲、工作調度、負載均衡、容錯均衡、容錯處理以及網絡通信等復雜問題,把處理過程高度抽象為兩個函數:mapreducemap負責把任務分解成多個任務,reduce負責把分解后多任務處理的結果匯總起來。

 

需要注意的是,用MapReduce來處理的數據集(或任務)必須具備這樣的特點:待處理的數據集可以分解成許多小的數據集,而且每一個小數據集都可以完全并行地進行處理。

Hadoop中,每個MapReduce任務都被初始化為一個Job,每個Job又可以分為兩種階段:map階段和reduce階段。這兩個階段分別用兩個函數表示,即map函數和reduce函數。map函數接收一個形式的輸入,然后同樣產生一個形式的中間輸出,Hadoop函數接收一個如形式的輸入,然后對這個value集合進行處理,每個reduce產生01個輸出,reduce的輸出也是形式的。

下面以一個最簡單的例子說明:

單詞計數是最簡單也是最能體現MapReduce思想的程序之一,可以稱為MapReduce"Hello World",該程序的完整代碼可以在Hadoop安裝包的"src/examples"目錄下找到。單詞計數主要完成功能是:統計一系列文本文件中每個單詞出現的次數,如下圖所示。

 

package org.apache.hadoop.examples;

 

import java.io.IOException;

 

import java.util.StringTokenizer;

 

import org.apache.hadoop.conf.Configuration;

 

import org.apache.hadoop.fs.Path;

 

import org.apache.hadoop.io.IntWritable;

 

import org.apache.hadoop.io.Text;

 

import org.apache.hadoop.mapreduce.Job;

 

import org.apache.hadoop.mapreduce.Mapper;

 

import org.apache.hadoop.mapreduce.Reducer;

 

import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;

 

import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

 

import org.apache.hadoop.util.GenericOptionsParser;

 

public class WordCount {

 

  public static class TokenizerMapper

 

      extends Mapper {

 

      private final static IntWritable one = new IntWritable(1);

 

      private Text word = new Text();

 

 

 

      public void map(Object key, Text value, Context context)

 

        throws IOException, InterruptedException {

 

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生

------分隔線----------------------------

上一篇 軟考之算法

下一篇 我的簡歷

分享到:
------分隔線----------------------------
為碼而活
積分:4237
15粉絲
7關注
欄目熱點
關閉
程序員人生
主站蜘蛛池模板: a级片在线免费看 | 国产精品国产精品国产专区不蜜 | 91久久精品一区二区 | 亚洲综合一区在线 | 国产美女一区二区三区 | 中文字幕视频 | 麻豆b2b| 99久久精品视频免费 | 免费一级毛片在线观看 | 亚洲精品乱码久久久久久写真 | 黄色三级小视频 | 丰满少妇高潮惨叫久久久一 | 国产尤物视频 | 国产a一区二区 | 国产精品视频yy9099 | 日韩国产精品久久久久久亚洲 | 国产精品999999| 在线视频中文字幕 | 国产麻豆 | 99午夜| 午夜精品久久久久久久久久蜜桃 | 久久久久久国产精品 | 91久久精品一区 | 免费在线日韩av | 亚洲精品视频免费观看 | 国产一区二区中文字幕 | 国产视频污| 久久国产免费看 | 欧美精品福利视频 | 久久久精品免费观看 | 国产在线不卡视频 | 亚洲视频在线看 | 99精品视频在线观看免费播放 | 免费看a网站 | 国产成人一区二区三区 | 国产精品二区三区 | 91久久夜色精品国产九色 | 国产精品一区二区在线 | 国产精品视频免费看 | 天堂电影在线观看 | 欧美在线一区二区三区 |