Hadoop:MapReduce作业配置与提交
2016-07-21 09:22
183 查看
Hadoop高级课程:MapReduce作业配置与提交,在MapReduce中,每个作业由两部分组成:应用程序和作业配置。其中,作业配置内容包括环境配置和用户自定义配置两部分。环境配置由Hadoop自动添加,主要由mapred-default.xml和mapred-site.xml两个文件中的配置选项组合而成;用户自定义配置则由用户自己根据作业特点个性化定制而成,比如用户可设置作业名称,以及Mapper/Reducer、Reduce Task个数等。在新旧两套API中,作业配置接口发生了变化,首先通过一个例子感受一下使用上的不同。
旧API作业配置实例:
JobConf job = new JobConf(new Configuration(), MyJob.class);
job.setJobName("myjob");
job.setMapperClass(MyJob.MyMapper.class);
job.setReducerClass(MyJob.MyReducer.class);
JobClient.runJob(job);
新API作业配置实例:
Configuration conf = new Configuration();
Job job = new Job(conf, "myjob ");
job.setJarByClass(MyJob.class);
job.setMapperClass(MyJob.MyMapper.class);
job.setReducerClass(MyJob.MyReducer.class);
System.exit(job.waitForCompletion(true) ? 0 : 1);
从以上两个实例可以看出,新版API用Job类代替了JobConf和JobClient两个类,这样,仅使用一个类的同时可完成作业配置和作业提交相关功能,进一步简化了作业编写方式。我们将在第5章介绍作业提交的相关细节,本小节重点从设计角度分析新旧两套API中作业配置的相关实现细节。来源:CUUG官网
旧API作业配置实例:
JobConf job = new JobConf(new Configuration(), MyJob.class);
job.setJobName("myjob");
job.setMapperClass(MyJob.MyMapper.class);
job.setReducerClass(MyJob.MyReducer.class);
JobClient.runJob(job);
新API作业配置实例:
Configuration conf = new Configuration();
Job job = new Job(conf, "myjob ");
job.setJarByClass(MyJob.class);
job.setMapperClass(MyJob.MyMapper.class);
job.setReducerClass(MyJob.MyReducer.class);
System.exit(job.waitForCompletion(true) ? 0 : 1);
从以上两个实例可以看出,新版API用Job类代替了JobConf和JobClient两个类,这样,仅使用一个类的同时可完成作业配置和作业提交相关功能,进一步简化了作业编写方式。我们将在第5章介绍作业提交的相关细节,本小节重点从设计角度分析新旧两套API中作业配置的相关实现细节。来源:CUUG官网
相关文章推荐
- Hadoop:配置文件介绍
- opencv学习笔记(1)
- Hadoop:MapReduce回调机制
- linux的mysql的
- linux中任务的调度
- Opencv中在图片上显示文本
- 访问网站不存在的页面的时候跳转到指定页面,不需要报文件不存在
- Linux学习笔记--Linux目录结构
- linux 中getopt和getopt_long 用法解析
- 【linux c】指针与数组的区别_学习笔记_012
- OpenGL ES像素着色器
- 2_1OpenGL北斗星群
- Linux中fork()函数详解
- opencv 基于KNN的手写数字字符识别
- 虚拟化 - 每天5分钟玩转 OpenStack(2)
- 先安装windows7_64bit,再安装Centos7,windows7的启动项不出现
- OPenGL ES Shader
- u-boot与linux内核间的参数传递过程分析
- linux--文件编程(4)
- Linux内核驱动之主次编号