您的位置:首页 > 运维架构

安装hadoop1.2.1(参考hadoop实战第二版)

2015-06-15 17:41 417 查看
准备:

  安装jdk和ssh。

1. 官网下载hadoop1.2.1

  hadoop-1.2.1.tar.gz

  http://hadoop.apache.org/releases.html

2. 解压到/home/hadoop/目录下

3. 伪分布式hadoop配置

  可以把伪分布式的hadoop看做只有一个节点的集群,在这个集群中,这个节点既是Master,也是Slave;既是NameNode,也是DataNode;既是JobTracker,也是TaskTracker。伪分布式的配置过程很简单,只需要修改几个文件。进入conf文件夹,修改配置文件。

指定JDK的安装位置:修改hadoop-env.sh如下

#添加jdk路径
export JAVA_HOME=/usr/lib/jvm7/jdk1.7.0_79


修改core-site.xml

<!-- 配置HDFS的地址及端口号-->
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>


修改hdfs-site.xml

  该文件用来配置hdfs,配置的默认备份方式是3,单机版的hadoop中需要改为1.

<!-- 设置HDFS备份方式 -->
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>


修改mapred-site.xml

该文件是MapReduce的配置文件,配置JobTracker的地址和端口。

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>


4. 在启动hadoop之前,需要格式化hadoop的文件系统hdfs。

  hadoop namenode -format

5. 启动所有进程

  bin/start-all.sh

6. 打开浏览器输入网址

  http://localhost:50030(MapReduce的web页面)

  http://localhost:50070(HDFS的web页面)

WordCount:

1. 在file文件夹下创建两个文件

echo "hello world" > file0.txt
echo "hello hadoop" > file1.txt


2. 将新创建的两个文件上传到HDFS

hadoop dfs -put file /input


3. 编译WordCount.java

javac -classpath ~/hadoop/hadoop-1.2.1/hadoop-core-1.2.1.jar:~/hadoop/hadoop-1.2.1/lib/commons-cli-1.2.jar ~/hadoop/WordCount/WordCount.java -d ~/hadoop/WordCountJar


4. 打包class文件

jar -cvf wordcount.jar ./*.class


5. 在hadoop中运行wordcount.jar文件

hadoop jar wordcount.jar WordCount input output


6. HDFS常用命令(待编辑)

hadoop dfs -mkdir /file              在HDFS上新建文件夹

hadoop dfs -put input1.txt /input  把本地文件input1.txt传到HDFS的/tmp/input目录下

hadoop dfs -get  input1.txt /tmp/input/input1.txt  把HDFS文件拉到本地

hadoop dfs -ls /tmp/output                  列出HDFS的某目录
hadoop dfs -cat /tmp/ouput/output1.txt  查看HDFS上的文件

hadoop dfs -rmr /home/less/hadoop/tmp/output  删除HDFS上的目录

hadoop dfsadmin -report 查看HDFS状态,比如有哪些datanode,每个datanode的情况

hadoop dfsadmin -safemode leave  离开安全模式

hadoop dfsadmin -safemode enter  进入安全模式
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: