电话:0731-83595998
导航

2021年广西南方电网校园招聘考试计算机知识点:案例分析

来源: 2020-05-18 09:22
  1. 案例分析
单词计数(Word Count)是一个经典的问题,也是能体现MapReduce设计思想的最简单算法之一。该算法主要是为了完成对文字数据中所出现的单词进行计数,如图2-4所示。
 
伪代码如下:
Map(K,V)
{
For each word w in V
{
Collect( w, 1 );
}
Reduce(K,V[])
{
int count = 0;
For each v in V
{
count += v;
}
Collect(K,count);
}
}
 
下面就根据MapReduce的四个执行步骤对这一算法进行详细的介绍。
  1. 根据文件所包含的信息分割(Split)文件,在这里把文件的每行分割为一组,共三组,如图2-5所示。这一步由系统自动完成。
  2. 对分割之后的每一对<key,value>利用用户定义的Map进行处理,再生成新的<key,value>对,如图2-6所示。
  3. Map输出之后有一个内部的Fold过程,和第一步一样,都是由系统自动完成的,如图2-7所示。
经过Fold步骤之后的输出与结果已经非常接近,再由用户定义的Reduce步骤完成最后的工作即可,
 

编辑推荐:

下载Word文档

温馨提示:因考试政策、内容不断变化与调整,长理培训网站提供的以上信息仅供参考,如有异议,请考生以权威部门公布的内容为准! (责任编辑:长理培训)

网络课程 新人注册送三重礼

已有 22658 名学员学习以下课程通过考试

网友评论(共0条评论)

请自觉遵守互联网相关政策法规,评论内容只代表网友观点!

最新评论

点击加载更多评论>>

精品课程

更多
10781人学习

免费试听更多

相关推荐
图书更多+
  • 电网书籍
  • 财会书籍
  • 其它工学书籍
拼团课程更多+
  • 电气拼团课程
  • 财会拼团课程
  • 其它工学拼团
热门排行

长理培训客户端 资讯,试题,视频一手掌握

去 App Store 免费下载 iOS 客户端