您的位置:首页 > 其它

PBS pro 有资源但作业排队的问题处理

2015-12-14 11:24 543 查看
一:据客户反映,明明有资源并且pbs_server, pbs_sched, pbs_mom服务运行正常,但是作业状态任然为Q (排队)?

1.首先查看pbs_server的日志,发现如下信息

# cd /var/spool/PBS/server_logs

# cat 20151214



2.查看pbs_sched的日志,日志信息如下

# cd /var/spool/PBS/sched_logs

# cat 20151214



由此得出结论,作业不能运行,是因为license的问题

3.于是查看pbs license的日志

# cd /usr/local/altair/security/

# cat altair_lic_xmhysgi4700.log

发现不停的显示以下信息



4.根据以上日志可知是由于lmgrd进程”死掉“的时候,系统没有清除lmgrd进程使用的端口(如果系统没有正常关机,就会出现这种情况)

5.根据以上日志可知,应该关掉所有和lmgrd有关的进程后,重启license服务

# pkill -f lmgrd         //如果用/etc/init.d/altairlmgrd stop关闭lmgrd进程,有时候会关不彻底

# /etc/init.d/altairlmgrd start

# /etc/init.d/pbs restart
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  pbs 集群 作业状态Q