Ambari集群移动现有复制到另外地方或更改ip地址,导致各项服务组件上为黄色问号代表心跳丢失的解决方案(图文详解)(博主推荐)
2017-11-29 21:46
766 查看
[b]前言[/b]
最近,是在做集群搬移工作,大家肯定会遇到如下的场景。
(1) 比如,你新购买的电脑,初步者学习使用Ambari集群。从旧电脑复制到新电脑这边来。
(2) 比如,你公司Ambari集群的ip,因业务或其他情况需要,暂时需要更改ip。
(3) 比如,你更改了主机名。
(4)也许其他的原因。
扩展
黄色问号表示: Heartbeat Lost
即所有的服务都心跳丢失了。。重启ambari-server和ambari-agent都不能解决。
解决途径
1、 查看个节点之间是否可以相互通信,若ssh连接不上,有可能是该节点关机了,没有打开,手动开启该节点,再次验证是否可互通。
2、 在主节点启动ambari-server restart和ambari-agent restart,为了保证其它节点也成功启动,在其它从节点也要进行:ambari-agent restart操作。
3、 遇到问题
3.1 mysql server start失败
在启动过程中,经常出现mysql服务启动失败。查看失败信息,找到是在哪个节点的mysql服务不能正常启动,一般报错是mysql.sock这个问题,解决方法:在对应节点上进行处理:mv /var/lib/mysql/mysql.sock /var/lib/mysql/mysql.sock_bk. 然后再次启动ambari服务。一般即可。
3.2 datanode start 失败
1)关闭集群全部的服务 #ambari-service stop
2)修改目录所有者 #cd /data1/hadoop/
#chown –R hdfs:hadoop hdfs/
3)重启集群服务 #ambari-service start 并且在ambari的界面start All所有组件。
4、
下次可以试着通过手动启动来看看,出现的问题
如果过你通过手动启动的话,你就应该能看到报错的信息。
如果你的ip改变了,怎么来解决?
如果你的主机名改变了,怎么来解决?
[b]最后,重新启动所有节点上的ambari-server 和 ambari-agent[/b]
其他节点,不多赘述。
解决
欢迎大家,加入我的微信公众号:大数据躺过的坑 免费给分享
同时,大家可以关注我的个人博客:
http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/
详情请见:http://www.cnblogs.com/zlslch/p/7473861.html
人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。
目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获
以及对应本平台的QQ群:161156071(大数据躺过的坑)
最近,是在做集群搬移工作,大家肯定会遇到如下的场景。
(1) 比如,你新购买的电脑,初步者学习使用Ambari集群。从旧电脑复制到新电脑这边来。
(2) 比如,你公司Ambari集群的ip,因业务或其他情况需要,暂时需要更改ip。
(3) 比如,你更改了主机名。
(4)也许其他的原因。
扩展
linux虚拟机系统的复制或克隆后续问题解决!
[b]问题详情[/b]黄色问号表示: Heartbeat Lost
即所有的服务都心跳丢失了。。重启ambari-server和ambari-agent都不能解决。
解决途径
1、 查看个节点之间是否可以相互通信,若ssh连接不上,有可能是该节点关机了,没有打开,手动开启该节点,再次验证是否可互通。
2、 在主节点启动ambari-server restart和ambari-agent restart,为了保证其它节点也成功启动,在其它从节点也要进行:ambari-agent restart操作。
3、 遇到问题
3.1 mysql server start失败
在启动过程中,经常出现mysql服务启动失败。查看失败信息,找到是在哪个节点的mysql服务不能正常启动,一般报错是mysql.sock这个问题,解决方法:在对应节点上进行处理:mv /var/lib/mysql/mysql.sock /var/lib/mysql/mysql.sock_bk. 然后再次启动ambari服务。一般即可。
3.2 datanode start 失败
1)关闭集群全部的服务 #ambari-service stop
2)修改目录所有者 #cd /data1/hadoop/
#chown –R hdfs:hadoop hdfs/
3)重启集群服务 #ambari-service start 并且在ambari的界面start All所有组件。
4、
下次可以试着通过手动启动来看看,出现的问题
如果过你通过手动启动的话,你就应该能看到报错的信息。
如果你的ip改变了,怎么来解决?
如果你的主机名改变了,怎么来解决?
[b]最后,重新启动所有节点上的ambari-server 和 ambari-agent[/b]
[bigdata@ambigdata1 ~]$ sudo service ambari-server stop Using python /usr/bin/python2 Stopping ambari-server Ambari Server stopped [bigdata@ambigdata1 ~]$ sudo service ambari-agent stop Verifying Python version compatibility... Using python /usr/bin/python2 Found ambari-agent PID: 7495 Stopping ambari-agent Removing PID file at /var/run/ambari-agent/ambari-agent.pid ambari-agent successfully stopped [bigdata@ambigdata1 ~]$ sudo service ambari-server start Using python /usr/bin/python2 Starting ambari-server Ambari Server running with administrator privileges. Organizing resource files at /var/lib/ambari-server/resources... Server PID at: /var/run/ambari-server/ambari-server.pid Server out at: /var/log/ambari-server/ambari-server.out Server log at: /var/log/ambari-server/ambari-server.log Waiting for server start.................... Ambari Server 'start' completed successfully. [bigdata@ambigdata1 ~]$ sudo service ambari-agent start Verifying Python version compatibility... Using python /usr/bin/python2 Checking for previously running Ambari Agent... Starting ambari-agent Verifying ambari-agent process status... Ambari Agent successfully started Agent PID at: /var/run/ambari-agent/ambari-agent.pid Agent out at: /var/log/ambari-agent/ambari-agent.out Agent log at: /var/log/ambari-agent/ambari-agent.log [bigdata@ambigdata1 ~]$
其他节点,不多赘述。
解决
欢迎大家,加入我的微信公众号:大数据躺过的坑 免费给分享
同时,大家可以关注我的个人博客:
http://www.cnblogs.com/zlslch/ 和 http://www.cnblogs.com/lchzls/
详情请见:http://www.cnblogs.com/zlslch/p/7473861.html
人生苦短,我愿分享。本公众号将秉持活到老学到老学习无休止的交流分享开源精神,汇聚于互联网和个人学习工作的精华干货知识,一切来于互联网,反馈回互联网。
目前研究领域:大数据、机器学习、深度学习、人工智能、数据挖掘、数据分析。 语言涉及:Java、Scala、Python、Shell、Linux等 。同时还涉及平常所使用的手机、电脑和互联网上的使用技巧、问题和实用软件。 只要你一直关注和呆在群里,每天必须有收获
以及对应本平台的QQ群:161156071(大数据躺过的坑)
相关文章推荐
- Ambari学习18_ 更换服务器IP地址后,Ambari各项服务心跳丢失(heartbeat lost)的解决方案
- 更换服务器IP地址后,Ambari各项服务心跳丢失(heartbeat lost)的解决方案
- CentOS6.5下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)
- Ambari集群里操作时典型权限问题put: `/home/bigdata/1.txt': No such file or directory的解决方案(图文详解)
- CentOS6.5下Ambari安装搭建部署大数据集群(图文分五大步详解)(博主强烈推荐)
- ubuntu系统复制到其他地方或克隆后,如何正确修改IP及MAC地址的解决方案(图文详解)
- Ubuntu14.04下Mongodb官网安装部署步骤(图文详解)(博主推荐)
- Ubuntu14.04下Neo4j图数据库官网安装部署步骤(图文详解)(博主推荐)
- 如何走上更高平台分享传递干货知识:(开通个人微信公众号:大数据躺过的坑)(图文详解)(博主推荐)
- [Oracle 11g r2(11.2.0.4.0)]案例分析5-丢失网络心跳导致的集群重新配置
- 如何在IDEA里给大数据项目导入该项目的相关源码(博主推荐)(图文详解)
- Ubuntu14.04下Mongodb官网卸载部署步骤(图文详解)(博主推荐)
- 基于CentOS6.5下Suricata(一款高性能的网络IDS、IPS和网络安全监控引擎)的搭建(图文详解)(博主推荐)
- ambari集群里如何正确删除历史修改记录(图文详解)
- 安装cloudermanager时出现org.spingframework.web.bind.***** host[] is not present at AnnotationMethodHandlerAdapter.java line 738 ****错误(图文详解)(博主推荐)
- [Oracle 11g r2(11.2.0.4.0)]案例分析6-丢失磁盘心跳导致的集群重新配置
- 给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解)
- 用maven来创建scala和java项目代码环境(图文详解)(Intellij IDEA(Ultimate版本)、Intellij IDEA(Community版本)和Scala IDEA for Eclipse皆适用)(博主推荐)
- 基于Ubuntu14.04下Suricata(一款高性能的网络IDS、IPS和网络安全监控引擎)的搭建(图文详解)(博主推荐)