线上机器由于不同构导致的配置问题
2012-04-11 18:08
246 查看
线上有16台测试scribe的机群,配置结束后,跑benchmark,没有问题。可是跑过一段时间后,发现很多job被pending住,报的错是:
经过google查询后,确定是由于磁盘空间不足导致的。
df -h 后发现 / 下面磁盘已经被占满,当时百思不得其解,到底是谁在占用了/ 目录下面的磁盘呢。
后来在同事的提醒下才发现,这一批机器是不同构的,有10台左右挂载了12个硬盘,有6台只挂载了10个硬盘,所以当用脚本搭建时都是按照12个硬盘来搭建写日志,就写到了/data10 /data11下面,附属于 / 所以很快 / 目录就被写满了。
从新配置后,重启解决问题。
Error initializing attempt_201204030722_0004_m_000002_0: ENOENT: No such file or directory at org.apache.hadoop.io.nativeio.NativeIO.chmod(Native Method) at org.apache.hadoop.fs.FileUtil.execSetPermission(FileUtil.java:692) at org.apache.hadoop.fs.FileUtil.setPermission(FileUtil.java:647) at org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:509) at org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:344) at org.apache.hadoop.mapred.JobLocalizer.initializeJobLogDir(JobLocalizer.java:239) at org.apache.hadoop.mapred.DefaultTaskController.initializeJob(DefaultTaskController.java:196) at org.apache.hadoop.mapred.TaskTracker$4.run(TaskTracker.java:1226) at java.security.AccessController.doPrivileged(Native Method) at javax.security.auth.Subject.doAs(Subject.java:416) at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1093) at org.apache.hadoop.mapred.TaskTracker.initializeJob(TaskTracker.java:1201) at org.apache.hadoop.mapred.TaskTracker.localizeJob(TaskTracker.java:1116) at org.apache.hadoop.mapred.TaskTracker$5.run(TaskTracker.java:2404) at java.lang.Thread.run(Thread.java:636)
经过google查询后,确定是由于磁盘空间不足导致的。
df -h 后发现 / 下面磁盘已经被占满,当时百思不得其解,到底是谁在占用了/ 目录下面的磁盘呢。
后来在同事的提醒下才发现,这一批机器是不同构的,有10台左右挂载了12个硬盘,有6台只挂载了10个硬盘,所以当用脚本搭建时都是按照12个硬盘来搭建写日志,就写到了/data10 /data11下面,附属于 / 所以很快 / 目录就被写满了。
从新配置后,重启解决问题。
相关文章推荐
- VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题(转)
- 安装oracle数据库后遇到数据入库为乱码的问题-由于oracle编码和系统编码不同导致
- VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题
- 今天的问题以后不会再出现,host配置文件导致机器老连不上其他主机
- VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题
- Cannot resolve the collation conflict between "Chinese_PRC_CI_AS" and "SQL_L及由于排序规则不同导致查询结果为空的问题
- VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题(转)
- (ZT) 解决VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题
- VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题
- java中父类与子类, 不同的两个类中的因为构造函数由于递归调用导致栈溢出问题
- 解决Table td设置了相同百分比,由于文字个数不同导致列宽不同问题
- VC中字符串由于版本不同而导致的错误问题
- 跨平台C++软件开发中,由于不同操作系统对Unicode的支持差异,而导致的一些问题及解决方案。
- VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题
- 一台linux机器配置多个物理网卡,导致的上不了网的问题
- chrome 来自服务器的响应包含重复标头。此问题通常是由于网站或代理配置不正确导致的。只有网站或代理管理员才能解决此问题
- VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题
- 解决VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题
- 【原】解决VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题
- VS2008编译的程序在某些机器上运行提示“由于应用程序配置不正确,应用程序未能启动”的问题