HP unix集群一个节点无法服务遇到的诡异问题
2012-03-27 15:50
323 查看
昨晚客户的HP集群数据库服务器出现点问题,断电后网络交换机由于某些原因重新配置了。数据库一个节点(节点2)一直起不来,另一个节点(节点1)正常对外提供服务。crs_stat -t,发现节点2部分资源在节点1上启动,其余的2上得资源都是offline状态(ons,gsd,vip,lis,.inst),手动启动,crs_start 资源名,顺序单个我都试过,都是报错:
CRS-0223: Resource 资源名 has placement error.
crs_stop -all,停掉全部资源,先启动节点一的资源srvctl start nodeapps -n oracle1,再启动节点2的资源,依然报错如上.
cmviewcl -v发现节点2和其包都是down的状态
后面的state分别是halted,blocked
关闭集群(hp集群和数据库集群)后再启动,cmview -v状态依旧
对两个节点分别vgdisplay
节点1(正常节点)oracle1:
有一个/dev/orabak是位启动状态
节点2:
/dev/oracle
/dev/oracle1
/dev/oracle2等均是如下提示:
vgdisplay: 卷组未启动。
vgdisplay: 不能显示卷组 "/dev/vglock"。
尝试如下:
cd /etc
mv lamtab lamtab.bak
vgscan -v
vgchange -a s oracle2
问题依旧
将lamtab.bak还原后将未启动的卷组激活
cmrunnode
可以启动,未有异常信息,但是cmview的时候仍然是down状态
支持的工程师说可能是hp的bug
也尝试了重启节点2的机器,不能解决问题。
最后将两个节点服务器全部重启,问题解决。
CRS-0223: Resource 资源名 has placement error.
crs_stop -all,停掉全部资源,先启动节点一的资源srvctl start nodeapps -n oracle1,再启动节点2的资源,依然报错如上.
cmviewcl -v发现节点2和其包都是down的状态
后面的state分别是halted,blocked
关闭集群(hp集群和数据库集群)后再启动,cmview -v状态依旧
对两个节点分别vgdisplay
节点1(正常节点)oracle1:
有一个/dev/orabak是位启动状态
节点2:
/dev/oracle
/dev/oracle1
/dev/oracle2等均是如下提示:
vgdisplay: 卷组未启动。
vgdisplay: 不能显示卷组 "/dev/vglock"。
尝试如下:
cd /etc
mv lamtab lamtab.bak
vgscan -v
vgchange -a s oracle2
问题依旧
将lamtab.bak还原后将未启动的卷组激活
cmrunnode
可以启动,未有异常信息,但是cmview的时候仍然是down状态
支持的工程师说可能是hp的bug
也尝试了重启节点2的机器,不能解决问题。
最后将两个节点服务器全部重启,问题解决。
相关文章推荐
- Liferay 集群中在一个节点上上传照片另外一个节点无法看到的问题的解决
- ElasticSearch集群未连接 无法发现节点(windows环境)以及windows环境下设置服务 不能自动启动的问题
- 遇到一个IE升级到IE8之后脚本无法跑的问题。那么对于这样的问题,我们需要如何去处理?
- Hadoop集群中改变了其中一个节点的主机名之后 的ssh连接问题
- 利用Oracle.DataAccess调用Function的遇到的一个诡异问题
- mongoDB 从单节点迁移到分布式集群 遇到的问题
- mongodb副本集中其中一个节点宕机无法重启的问题
- vue -(问题系列)节点Sass无法为您的当前环境找到绑定:OS X 64位和Node.js 8.x(遇到)
- 使用一个框架遇到问题,搜索到的办法都尝试了,无法解决,该怎么办
- 记一个诡异的.net framework问题造成的系统问题(visual studio不能build或不能正常运行代码,所有基于.net framework的代码无法运行)
- 今天遇到vs2008的一个诡异问题
- VMWARE NAT模式下虚拟机集群节点无法连接外网问题解决
- VMware VirtualCenter Server服务无法启动--一个很妖的问题
- 最近搭建HBase集群时遇到了一个问题,快把我逼疯啦,请各位大神帮我看看该怎么改啊!!!!!
- 遇到问题----win7安装apache服务出现 <OS 10013> 以一种访问权限不允许的方式做了一个访问套接字的尝试
- 一个由于网络问题导致的服务无法使用——调试过程总结
- 遇到问题----win7安装apache服务出现 <OS 10013> 以一种访问权限不允许的方式做了一个访问套接字的尝试
- 遇到一个诡异的regedit.exe程序问题
- 启动MYSQL服务时遇到问题(MySQL 服务无法启动。服务没有报告任何错误。)
- hbase全分布式遇到的问题3--集群中有没有配置好ip映射的节点