您的位置:首页 > 大数据

初探大数据-开发环境安装-实战二

2018-03-02 16:24 281 查看
软件存放目录
hadoop/hadoop
/home/hadoop
    software: 存放的是安装的软件包
    app : 存放的是所有软件的安装目录
    data: 存放的是课程中所有使用的测试数据目录
    source: 存放的是软件源码目录

Hadoop环境搭建
1) 下载Hadoop
    http://archive.cloudera.com/cdh5/cdh/5/
    2.6.0-cdh5.7.0

    wget http://archive.cloudera.com/cdh5/cdh/5/hadoop-2.6.0-cdh5.7.0.tar.gz
2)安装jdk
    下载
    解压到app目录:tar -zxvf jdk-7u51-linux-x64.tar.gz -C ~/app/
    验证安装是否成功:~/app/jdk1.7.0_51/bin      ./java -version
    建议把bin目录配置到系统环境变量(~/.bash_profile)中
        export JAVA_HOME=/home/hadoop/app/jdk1.7.0_51
        export PATH=$JAVA_HOME/bin:$PATH

3)机器参数设置
    hostname: hadoop001
    
    修改机器名: /etc/sysconfig/network
        NETWORKING=yes
        HOSTNAME=hadoop001

    设置ip和hostname的映射关系: /etc/hosts
        192.168.199.200 hadoop001
        127.0.0.1 localhost

    ssh免密码登陆(本步骤可以省略,但是后面你重启hadoop进程时是需要手工输入密码才行)
        ssh-keygen -t rsa
        cp ~/.ssh/id_rsa.pub ~/.ssh/authorized_keys

4)Hadoop配置文件修改: ~/app/hadoop-2.6.0-cdh5.7.0/etc/hadoop
    hadoop-env.sh
        export JAVA_HOME=/home/hadoop/app/jdk1.7.0_51

    core-site.xml
        <property>
            <name>fs.defaultFS</name>
            <value>hdfs://hadoop001:8020</value>
        </property>    

        <property>
            <name>hadoop.tmp.dir</name>
            <value>/home/hadoop/app/tmp</value>
        </property>    

    hdfs-site.xml
        <property>
            <name>dfs.replication</name>
            <value>1</value>
        </property>
5)格式化HDFS
    注意:这一步操作,只是在第一次时执行,每次如果都格式化的话,那么HDFS上的数据就会被清空
    bin/hdfs namenode -format
6)启动HDFS
    sbin/start-dfs.sh
    验证是否启动成功:
        jps
            DataNode
            SecondaryNameNode
            NameNode
        浏览器
            http://hadoop001:50070/
7)停止HDFS
    sbin/stop-dfs.sh
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐