yarn环境跑mapreduce报错某个container 600s未报告进度超时被杀
2016-01-01 17:20
471 查看
问题:
发现每次reduce阶段跑到98%,相关的container被杀。报出的log大概的意思:container 600s未报告进度超时被杀解决的方法:
在mapreduce程序里加上conf.set("mapred.task.timeout", "0"); //不检查超时
又一次打包执行,最后没有出现错误,可是执行非常长时间,总算执行完了,怀疑程序问题有大循环
最后检查reduce发现会有双层循环,有可能会很大,导致卡在reduce内部,长时间没有进行不论什么的读写,也就没有汇报他的进度情况
总结
问题的解决办法起于对于悬挂的task,假设NMr在一段时间(默认是10min。能够通过mapred.task.timeout属性值来设置。单位是毫秒)内一直没有收到它的进度报告。则把它标记为失效相关文章推荐
- [转] Edit Terrain foliage/texture at runtime
- Sicily.Handling e-mail addresses
- aix 下 实现goldengate 随os启动而自己主动启动的脚本
- Paint---ColorFilter
- AIX存储空间和VG分配
- 任务调度框架Quartz实例
- Paint---Typeface
- YARN (MRv2) ResourceManager High Availability
- ResourceManager High Availability
- 巧用过滤器和标签整理你的gmail邮件
- HDFS High Availability Using the Quorum Journal Manager
- Bitset<>用于unordered container时的默认hash函数
- 让 OpenKeychain 帮助处理你的加密
- Semi-Supervised Affinity Propagation with Soft Instance-Level Constraints 阅读笔记1
- <LeetCode OJ>Contains Duplicate【217】
- 详解Paint的各种set方法
- POJ - 1422 Air Raid 二分图最大匹配
- 自己总结 RTAI编译
- RTAI安装
- aircrack-ng on OSX 从零开始