您的位置：首页 > 运维架构

在hadoop中如何进入本地调试、及如何设置split的大小

2015-12-16 15:36 274 查看

在mapreduce中，如果想进入debug模式进行调试，则需要在main函数中去掉下面一行代码：

Configuration conf = new Configuration();

conf.set("mapred.job.tracker", "master:9001");//这行不能要，否则进入集群模式，不能单步调试，不设置jobtracker默认进入本地模式

在hadoop中设置每个split大小

Job job = new Job(conf, "combine smallfiles map");

job.getConfiguration().setLong("mapreduce.input.fileinputformat.split.maxsize", (long)(113*1024*1024));//split的大小设置为113M

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： Hadoop

相关文章推荐

详解HDFS Short Circuit Local Reads
Hadoop_2.1.0 MapReduce序列图
使用Hadoop搭建现代电信企业架构
单机版搭建Hadoop环境图文教程详解
hadoop常见错误以及处理方法详解
hadoop 单机安装配置教程
hadoop的hdfs文件操作实现上传文件到hdfs
hadoop实现grep示例分享
Apache Hadoop版本详解
linux下搭建hadoop环境步骤分享
hadoop client与datanode的通信协议分析
hadoop中一些常用的命令介绍
Hadoop单机版和全分布式(集群)安装
用PHP和Shell写Hadoop的MapReduce程序
hadoop map-reduce中的文件并发操作
Hadoop1.2中配置伪分布式的实例
java结合HADOOP集群文件上传下载
用python + hadoop streaming 分布式编程（一） -- 原理介绍，样例程序与本地调试
Hadoop安装感悟
Scala代码实现列出Hadoop 文件夹下面的所有文件

新的分享

新鲜开源：基于Prometheus的企业监控平台设计与实现 - 运维
民生银行日接入量15T的ELK日志平台（Apollo+ES源码改造） - 运维
邱盛昌：OPPO商业化数据体系建设实战
一篇吃透监控系统：常用组合方案和主流工具选型 - 运维
DevOps落地成不成，关键不在持续集成？ - 运维
mlops的一些记录
用Prometheus监控K8S，目前最实用的部署方式都说全了（有彩蛋） - 运维
asio 使用 openssl 示例
Netty源码研究笔记（4）——EventLoop系列
许北林：我为什么加入OpenHarmony生态？又为什么要做“启航KP”开发套件？
【直播回顾】OpenHarmony知识赋能五期第五课——多媒体子系统之视频解读
【直播回顾】如何成为一名优秀的OpenHamrony贡献者？

章节导航