2021年广西南方电网校园招聘考试计算机知识点:案例分析
- 案例分析
伪代码如下:
Map(K,V)
{
For each word w in V
{
Collect( w, 1 );
}
Reduce(K,V[])
{
int count = 0;
For each v in V
{
count += v;
}
Collect(K,count);
}
}
下面就根据MapReduce的四个执行步骤对这一算法进行详细的介绍。
- 根据文件所包含的信息分割(Split)文件,在这里把文件的每行分割为一组,共三组,如图2-5所示。这一步由系统自动完成。
- 对分割之后的每一对<key,value>利用用户定义的Map进行处理,再生成新的<key,value>对,如图2-6所示。
- Map输出之后有一个内部的Fold过程,和第一步一样,都是由系统自动完成的,如图2-7所示。
编辑推荐:
下载Word文档
温馨提示:因考试政策、内容不断变化与调整,长理培训网站提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准! (责任编辑:长理培训)
点击加载更多评论>>