PBS pro 有资源但作业排队的问题处理
2015-12-14 11:24
543 查看
一:据客户反映,明明有资源并且pbs_server, pbs_sched, pbs_mom服务运行正常,但是作业状态任然为Q (排队)?
1.首先查看pbs_server的日志,发现如下信息
# cd /var/spool/PBS/server_logs
# cat 20151214
2.查看pbs_sched的日志,日志信息如下
# cd /var/spool/PBS/sched_logs
# cat 20151214
由此得出结论,作业不能运行,是因为license的问题
3.于是查看pbs license的日志
# cd /usr/local/altair/security/
# cat altair_lic_xmhysgi4700.log
发现不停的显示以下信息
4.根据以上日志可知是由于lmgrd进程”死掉“的时候,系统没有清除lmgrd进程使用的端口(如果系统没有正常关机,就会出现这种情况)
5.根据以上日志可知,应该关掉所有和lmgrd有关的进程后,重启license服务
# pkill -f lmgrd //如果用/etc/init.d/altairlmgrd stop关闭lmgrd进程,有时候会关不彻底
# /etc/init.d/altairlmgrd start
# /etc/init.d/pbs restart
1.首先查看pbs_server的日志,发现如下信息
# cd /var/spool/PBS/server_logs
# cat 20151214
2.查看pbs_sched的日志,日志信息如下
# cd /var/spool/PBS/sched_logs
# cat 20151214
由此得出结论,作业不能运行,是因为license的问题
3.于是查看pbs license的日志
# cd /usr/local/altair/security/
# cat altair_lic_xmhysgi4700.log
发现不停的显示以下信息
4.根据以上日志可知是由于lmgrd进程”死掉“的时候,系统没有清除lmgrd进程使用的端口(如果系统没有正常关机,就会出现这种情况)
5.根据以上日志可知,应该关掉所有和lmgrd有关的进程后,重启license服务
# pkill -f lmgrd //如果用/etc/init.d/altairlmgrd stop关闭lmgrd进程,有时候会关不彻底
# /etc/init.d/altairlmgrd start
# /etc/init.d/pbs restart
相关文章推荐
- RedHat 5.8 安装Oracle 11gR2_Grid集群
- mysql集群之MMM简单搭建
- MySQL的集群配置的基本命令使用及一次操作过程实录
- MySQL slave_net_timeout参数解决的一个集群问题案例
- Redis 集群搭建和简单使用教程
- Windows Server 2003 下配置 MySQL 集群(Cluster)教程
- tomcat6_apache2.2_ajp 负载均衡加集群实战分享
- 用apache和tomcat搭建集群(负载均衡)
- Red Hat Linux,Apache2.0+Weblogic9.2负载均衡集群安装配置
- Hadoop单机版和全分布式(集群)安装
- java结合HADOOP集群文件上传下载
- Spring3.2.0和Quartz1.8.6集群配置
- (Weblogic Portal 9.2.3集群)Oracle数据库初始化报PF_MARKUP...
- HBase基本原理
- HDFS DatanodeProtocol——sendHeartbeat
- HDFS DatanodeProtocol——register
- Hadoop集群提交作业问题总结
- Hadoop源码分析 HDFS ClientProtocol——addBlock
- Hadoop源码分析HDFS ClientProtocol——create