【数据平台】关于Hadoop集群namenode format安全事故
2017-09-25 14:13
681 查看
1、问题:重启namenode后提示连接失败,居然执行了format命令,出现了很严重的安全事故。
2、教训:对于生产集群,一定要建立运维安全体系,对于高危命令要做权限控制。
3、对于备份的理解:
1)由于所操作的集群namenode和secondary namenode是同一台机子,secondary只发挥在namenode当机下充当namenode的作用,而没有独立保存元数据结构和日志,导致无法从secondary恢复数据。
2)对于dfs.namenode.name.dir路径下namenode保存的fsimage_和edits_要预先做备份,最好是设置双路径,以便从fsimage_和edits_中恢复。
hdfs-site.xml
<property>
<name>dfs.namenode.name.dir</name>
<value>/data/hadoop-2.7.2/current/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/data/hadoop-2.7.2/current/data</value>
</property>core-site.xml
上面三个路径的数据在format前要注意备份。
4、对于format前的工作,要先前上面三个路径备份后再执行。
5、hadoop的集群有不同的情况,生产的集群和研发的集群在安全级别上有不同的管理。
6、checkpoint参考:http://www.cnblogs.com/hanyuanbo/archive/2012/07/25/2608698.html
2、教训:对于生产集群,一定要建立运维安全体系,对于高危命令要做权限控制。
3、对于备份的理解:
1)由于所操作的集群namenode和secondary namenode是同一台机子,secondary只发挥在namenode当机下充当namenode的作用,而没有独立保存元数据结构和日志,导致无法从secondary恢复数据。
2)对于dfs.namenode.name.dir路径下namenode保存的fsimage_和edits_要预先做备份,最好是设置双路径,以便从fsimage_和edits_中恢复。
hdfs-site.xml
<property>
<name>dfs.namenode.name.dir</name>
<value>/data/hadoop-2.7.2/current/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/data/hadoop-2.7.2/current/data</value>
</property>core-site.xml
<property> <name>hadoop.tmp.dir</name> <value>/data/hadoop-2.7.2/current/tmp</value> </property>
上面三个路径的数据在format前要注意备份。
4、对于format前的工作,要先前上面三个路径备份后再执行。
5、hadoop的集群有不同的情况,生产的集群和研发的集群在安全级别上有不同的管理。
6、checkpoint参考:http://www.cnblogs.com/hanyuanbo/archive/2012/07/25/2608698.html
相关文章推荐
- 大数据平台搭建-hadoop/hbase集群的搭建
- Hadoop集群管理 Namenode的目录数据结构
- 关于Hadoop安全集群和非安全集群间Distcp的使用
- Hadoop集群让数据分析平台化
- 大数据平台 Hadoop 的分布式集群环境搭建
- 你的大数据安全么?“Hadoop集群遭遇勒索软件*** ”
- 你的大数据安全么?“Hadoop集群遭遇勒索软件攻击 ”
- 关于hadoop 2.7.1 集群安装及其平台上的实验
- Hadoop 新建集群namenode format
- 关于Hadoop伪分布式每次启动都要format namenode
- 离线部署 CDH 5.12.1 及使用 CDH 部署 Hadoop 大数据平台集群服务
- [Hadoop数据分析平台:第一周]关于Google矩阵和PageRank的求解方法
- 每一天都有更多的数据、用户和应用在加入Apache Hadoop这个日益壮大的集群中来。虽然对于整个数据驱动的组织来说这是一个好消息,但对于安全管理员和监察人员来说,如何让终端用户在现存的Hadoop
- 大数据平台Hadoop的分布式集群环境搭建
- Hadoop的集群数据、mapreduce管理及安全机制介绍
- 离线部署 CDH 5.12.1 及使用 CDH 部署 Hadoop 大数据平台集群服务
- 关于hadoop namenode -format不成功的问题
- Flume传数据到Hadoop双namenode集群传数据可能出现的问题
- hadoop集群搭建(一)HDFS的namenode的HA搭建
- Hadoop2.2.0完全分布式集群平台安装与设置-入门级手把手