Ubuntu14.04下安装Hadoop2.4.0 (伪分布模式)
2015-09-12 21:20
465 查看
源文地址:http://www.cnblogs.com/kinglau/p/3796164.html
/usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop启动时的配置信息。
编辑器中打开此文件
sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xml
![](http://images.cnitblog.com/blog/12097/201406/191129065672565.png)
在该文件的<configuration></configuration>之间增加如下内容:
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
保存、关闭编辑窗口。
最终修改后的文件内容如下:
![](http://images.cnitblog.com/blog/12097/201406/191129071926922.png)
/usr/local/hadoop/etc/hadoop/yarn-site.xml包含了MapReduce启动时的配置信息。
编辑器中打开此文件
sudo gedit yarn-site.xml
![](http://images.cnitblog.com/blog/12097/201406/191129078172280.png)
在该文件的<configuration></configuration>之间增加如下内容:
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容如下
![](http://images.cnitblog.com/blog/12097/201406/191129082548581.png)
默认情况下,/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件,我们要复制该文件,并命名为mapred.xml,该文件用于指定MapReduce使用的框架。
复制并重命名
cp mapred-site.xml.template mapred-site.xml
编辑器打开此新建文件
sudo gedit mapred-site.xml
![](http://images.cnitblog.com/blog/12097/201406/191129085517138.png)
在该文件的<configuration></configuration>之间增加如下内容:
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容如下
![](http://images.cnitblog.com/blog/12097/201406/191129091928266.png)
/usr/local/hadoop/etc/hadoop/hdfs-site.xml用来配置集群中每台主机都可用,指定主机上作为namenode和datanode的目录。
创建文件夹,如下图所示
![](http://images.cnitblog.com/blog/12097/201406/191129102232682.png)
你也可以在别的路径下创建上图的文件夹,名称也可以与上图不同,但是需要和hdfs-site.xml中的配置一致。
编辑器打开hdfs-site.xml
在该文件的<configuration></configuration>之间增加如下内容:
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/hdfs/data</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容如下:
![](http://images.cnitblog.com/blog/12097/201406/191129109426068.png)
hdfs namenode -format
只需要执行一次即可,如果在hadoop已经使用后再次执行,会清除掉hdfs上的所有数据。
经过上文所描述配置和操作后,下面就可以启动这个单节点的集群
执行启动命令:
sbin/start-dfs.sh
执行该命令时,如果有yes /no提示,输入yes,回车即可。
接下来,执行:
sbin/start-yarn.sh
执行完这两个命令后,Hadoop会启动并运行
执行 jps命令,会看到Hadoop相关的进程,如下图:
![](http://images.cnitblog.com/blog/12097/201406/191129114898168.png)
浏览器打开 http://localhost:50070/,会看到hdfs管理页面
![](http://images.cnitblog.com/blog/12097/201406/191129120361268.png)
浏览器打开http://localhost:8088,会看到hadoop进程管理页面
![](http://images.cnitblog.com/blog/12097/201406/191129127706126.png)
dfs上创建input目录
bin/hadoop fs -mkdir -p input
![](http://images.cnitblog.com/blog/12097/201406/191129130674684.png)
把hadoop目录下的README.txt拷贝到dfs新建的input里
hadoop fs -copyFromLocal README.txt input
![](http://images.cnitblog.com/blog/12097/201406/191129132704213.png)
运行WordCount
hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output
![](http://images.cnitblog.com/blog/12097/201406/191129134733742.png)
可以看到执行过程
![](http://images.cnitblog.com/blog/12097/201406/191129142235371.png)
运行完毕后,查看单词统计结果
hadoop fs -cat output/*
在Ubuntu14.04下安装Hadoop2.4.0 (单机模式)基础上配置
一、配置core-site.xml
/usr/local/hadoop/etc/hadoop/core-site.xml 包含了hadoop启动时的配置信息。编辑器中打开此文件
sudo gedit /usr/local/hadoop/etc/hadoop/core-site.xml
![](http://images.cnitblog.com/blog/12097/201406/191129065672565.png)
在该文件的<configuration></configuration>之间增加如下内容:
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
保存、关闭编辑窗口。
最终修改后的文件内容如下:
![](http://images.cnitblog.com/blog/12097/201406/191129071926922.png)
二、配置yarn-site.xml
/usr/local/hadoop/etc/hadoop/yarn-site.xml包含了MapReduce启动时的配置信息。编辑器中打开此文件
sudo gedit yarn-site.xml
![](http://images.cnitblog.com/blog/12097/201406/191129078172280.png)
在该文件的<configuration></configuration>之间增加如下内容:
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
<value>org.apache.hadoop.mapred.ShuffleHandler</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容如下
![](http://images.cnitblog.com/blog/12097/201406/191129082548581.png)
三、创建和配置mapred-site.xml
默认情况下,/usr/local/hadoop/etc/hadoop/文件夹下有mapred.xml.template文件,我们要复制该文件,并命名为mapred.xml,该文件用于指定MapReduce使用的框架。
复制并重命名
cp mapred-site.xml.template mapred-site.xml
编辑器打开此新建文件
sudo gedit mapred-site.xml
![](http://images.cnitblog.com/blog/12097/201406/191129085517138.png)
在该文件的<configuration></configuration>之间增加如下内容:
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容如下
![](http://images.cnitblog.com/blog/12097/201406/191129091928266.png)
四、配置hdfs-site.xml
/usr/local/hadoop/etc/hadoop/hdfs-site.xml用来配置集群中每台主机都可用,指定主机上作为namenode和datanode的目录。创建文件夹,如下图所示
![](http://images.cnitblog.com/blog/12097/201406/191129102232682.png)
你也可以在别的路径下创建上图的文件夹,名称也可以与上图不同,但是需要和hdfs-site.xml中的配置一致。
编辑器打开hdfs-site.xml
在该文件的<configuration></configuration>之间增加如下内容:
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/usr/local/hadoop/hdfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/usr/local/hadoop/hdfs/data</value>
</property>
保存、关闭编辑窗口
最终修改后的文件内容如下:
![](http://images.cnitblog.com/blog/12097/201406/191129109426068.png)
五、格式化hdfs
hdfs namenode -format
只需要执行一次即可,如果在hadoop已经使用后再次执行,会清除掉hdfs上的所有数据。
六、启动Hadoop
经过上文所描述配置和操作后,下面就可以启动这个单节点的集群
执行启动命令:
sbin/start-dfs.sh
执行该命令时,如果有yes /no提示,输入yes,回车即可。
接下来,执行:
sbin/start-yarn.sh
执行完这两个命令后,Hadoop会启动并运行
执行 jps命令,会看到Hadoop相关的进程,如下图:
![](http://images.cnitblog.com/blog/12097/201406/191129114898168.png)
浏览器打开 http://localhost:50070/,会看到hdfs管理页面
![](http://images.cnitblog.com/blog/12097/201406/191129120361268.png)
浏览器打开http://localhost:8088,会看到hadoop进程管理页面
![](http://images.cnitblog.com/blog/12097/201406/191129127706126.png)
七、WordCount验证
dfs上创建input目录bin/hadoop fs -mkdir -p input
![](http://images.cnitblog.com/blog/12097/201406/191129130674684.png)
把hadoop目录下的README.txt拷贝到dfs新建的input里
hadoop fs -copyFromLocal README.txt input
![](http://images.cnitblog.com/blog/12097/201406/191129132704213.png)
运行WordCount
hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.4.0-sources.jar org.apache.hadoop.examples.WordCount input output
![](http://images.cnitblog.com/blog/12097/201406/191129134733742.png)
可以看到执行过程
![](http://images.cnitblog.com/blog/12097/201406/191129142235371.png)
运行完毕后,查看单词统计结果
hadoop fs -cat output/*
![](http://images.cnitblog.com/blog/12097/201406/191129155043329.png)
相关文章推荐
- Ubuntu 默认壁纸历代记
- Ubuntu Remix Cinnamon 20.04 评测:Ubuntu 与 Cinnamon 的完美融合
- 关于Ubuntu 11.10启动提示waiting for the network configuration的问题
- 在 Ubuntu 桌面中使用文件和文件夹
- ubuntu下chrome无法同步问题解决
- 详解HDFS Short Circuit Local Reads
- Ubuntu Linux使用体验
- 使用 GNOME 优化工具自定义 Linux 桌面的 10 种方法
- 以Ubuntu 9.04为例 将工作环境迁移到 Linux
- Hadoop_2.1.0 MapReduce序列图
- 使用Hadoop搭建现代电信企业架构
- VirtualBox虚拟机XP与宿主机Ubuntu互访共享文件夹
- 从USB安装Ubuntu Server 10.04.3 图文详解
- Ubuntu 15.04 正式版发布下载
- Linux-Ubuntu 10.04安装Cadence-ic610 方法总结图解
- Ubuntu 12.04和Windows 7双系统安装图解
- 开机出现:grub rescue的修复方法
- Ubuntu连接Android真机调试
- 你应该选择 Ubuntu 还是 Fedora?
- 100 个最佳 Ubuntu 应用(中)