您的位置:首页 > 其它

DP备份任务失败原因解析

2016-01-27 15:47 453 查看
以JDC为例,DP的备份任务失败troubleshooting流程为:

1)/etc/opt/omni/server/datalist下都是备份的job code。

如果要查看一个job code,可以more 此文件夹下的某个datalist,输入如下:



最上面的两个脚本pre和post,内容是一样的,都是check split,开始查一遍,最后再查一遍。
下面的ESL_1DRV13到12是执行此job的drive优先顺序,默认的是dr13优先,如果执行job时这个dr busy,就会按顺序再往下找,直到找到合适的,如下图所示,这种情况虽然job仍然可以ok执行,但是会报错,会被打电话通知.
2016/1/29更新:
如果drive busy,查看drive状态的命令:
#/UMA 1/2/3 [带库ID]
#stat d
能看到full 还是 empty

2)monidb -session [session ID] -report



上图有一个输出是:loading media frm slot 85 to device /dev/rtape/tape711_bestn,这个是说从85槽调磁带到drive.

3)/home/work/cs 30/grep [session ID],或者进到/home/work下,./cs 30 |grep [session ID/datalist]




上面这种情况会出现报错.如上图,complete/failure,但是按第二步的命令monidb -session [session ID] -report会有下面的输出:



会看到其实是complete ok的,所以force ok 就可以了。
总结其实就是more /etc/opt/omni/server/datalist/[ID] 和/home/work/cs|grep session/datalist ID 这俩命令配合来看。

4)按照第二步的命令,omnidb -session [session id] -report,有时会出现下面的报错:



这种mount request cancel的报错一般就是磁带不够的意思。

5)针对未分离而报错的copy的处理方法:
还是根据命令omnidb -session 【session ID】-report,会有下面的报错:



在最前面说的pre和post这两个脚本是检查是否split的,这个就是在最初执行pre时发现还未分离,即还在copy状态,所以报错,这时需要手动执行分离操作,命令为:
/opt/Navisphere/bin/naviseccli -user sysadmin -password sysadmin -address 【IP】 -scope 0 snapview -fractureclone -name CLONE_ID -cloneid 0100000000000000

然后通知chops rerun这个任务。


内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  job