linux安装Hadoop-单机环境
2015-03-20 21:08
369 查看
如今大数据各种火,看看各种招聘网址,大数据、数据挖掘起薪20W啊,各种诱惑,所以,自己也学学大数据相关。
具体大数据什么,能做什么,发展史等等,我在这里就不描述了,网上一大堆,再说,个人从来不记什么东西发展史什么的,浪费脑细胞。
本文主要是作为个人的学习笔记,如果有不对之处,欢迎指正。
首先肯定是从环境的搭建开始。
使用上面命令后,会在~/home/{username}/.ssh/下生成两个加密文件,id_rsa(私钥)和id_rsa.pub(公钥)。
然后进入.ssh目录,将id_rsa.pub中的内容追加到authorized_keys文件中:cat id_rsa.pub >> authorized_keys;
如果是Ubuntu,则此时已经可以使用ssh免密码登陆,如果是centos环境,则需要修改.ssh目录权限和authorized_keys权限,如下:
将压缩文件解压到某目录下(tar -zxvf hadoop-2.5.2.tar.gz)。
添加Hadoop环境变量(vim /etc/profile,将如下内容添加到文件中)。
修改Hadoop配置
进入Hadoop目录下/home/shipg/soft/hadoop/hadoop-2.5.2/etc/hadoop,修改hadoop-env.sh文件中JAVA_HOME值,如下我的配置:
此时,单机版Hadoop环境已经安装完成。
首先在Hadoop跟目录下创建input目录(mkdir input),在input目录中随便拷贝一份文件进去,或者自己写些内容到此目录下,此处将README.txt拷贝进input目录。
然后执行如下命令执行单词统计:
此命令大概意思为:执行hadoop-mapreduce-example-2.5.2-sources.jar包中的WordCount类,数据源在input目录,将最终结果输出到output目录下。执行命令后可看到如下图所示表示执行成功。
此时,在Hadoop跟目录下你会发现多出了output目录,其中统计结果即放在此目录下。
至此,Hadoop单机版即安装并验证结果完成。
具体大数据什么,能做什么,发展史等等,我在这里就不描述了,网上一大堆,再说,个人从来不记什么东西发展史什么的,浪费脑细胞。
本文主要是作为个人的学习笔记,如果有不对之处,欢迎指正。
首先肯定是从环境的搭建开始。
个人环境配置
Linux | Centos7 |
JDK | jdk7u25 |
Hadoop | 2.5.2 |
安装步骤
1:安装SSH
使用yum install openssh-server安装ssh服务(Centos7默认已经安装ssh)2:配置ssh免密码登陆
ssh-keygen -t rsa -P ''
使用上面命令后,会在~/home/{username}/.ssh/下生成两个加密文件,id_rsa(私钥)和id_rsa.pub(公钥)。
然后进入.ssh目录,将id_rsa.pub中的内容追加到authorized_keys文件中:cat id_rsa.pub >> authorized_keys;
如果是Ubuntu,则此时已经可以使用ssh免密码登陆,如果是centos环境,则需要修改.ssh目录权限和authorized_keys权限,如下:
chmod 700 .ssh chmod 600 authorized_keys此时,则可以直接使用ssh免密码登陆了:ssh localhost验证结果。
3:安装配置JDK
jdk的安装配置此处也不在描述,相信搞java的童鞋都能搞定。4:安装Hadoop
下载Hadoop(可在官方提供的镜像地址下载:http://mirror.bit.edu.cn/apache/hadoop/common/)选择hadoop-2.5.2.tar.gz下载。将压缩文件解压到某目录下(tar -zxvf hadoop-2.5.2.tar.gz)。
添加Hadoop环境变量(vim /etc/profile,将如下内容添加到文件中)。
export HADOOP_HOME={Hadoop目录}/hadoop-2.5.2 export HADOOP_COMMON_HOME=$HADOOP_HOME export HADOOP_HDFS_HOME=$HADOOP_HOME export HADOOP_MAPRED_HOME=$HADOOP_HOME export HADOOP_YARN_HOME=$HADOOP_HOME export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop export CLASSPATH=.:$HADOOP_HOME/lib:$CLASSPATH export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH保存退出,病执行如下命令试修改生效:
source /etc/profile
修改Hadoop配置
进入Hadoop目录下/home/shipg/soft/hadoop/hadoop-2.5.2/etc/hadoop,修改hadoop-env.sh文件中JAVA_HOME值,如下我的配置:
export JAVA_HOME=/usr/java/jdk1.7.0_75保存退出
此时,单机版Hadoop环境已经安装完成。
5:验证结果
使用Hadoop自带的wordcount来验证安装结果。首先在Hadoop跟目录下创建input目录(mkdir input),在input目录中随便拷贝一份文件进去,或者自己写些内容到此目录下,此处将README.txt拷贝进input目录。
然后执行如下命令执行单词统计:
bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.5.2-sources.jar org.apache.hadoop.examples.WordCount input output
此命令大概意思为:执行hadoop-mapreduce-example-2.5.2-sources.jar包中的WordCount类,数据源在input目录,将最终结果输出到output目录下。执行命令后可看到如下图所示表示执行成功。
此时,在Hadoop跟目录下你会发现多出了output目录,其中统计结果即放在此目录下。
cat part-r-00000即可看到对README.txt文件中各个单词的统计结果。
至此,Hadoop单机版即安装并验证结果完成。
相关文章推荐
- linux(redhat)环境下Hadoop 2.2.0安装部署(单机伪分布式)
- Linux环境Hadoop单机模式安装详解
- 使用Cygwin模拟Linux环境安装配置运行基于单机的Hadoop
- 使用Cygwin模拟Linux环境安装配置运行基于单机的Hadoop
- linux hadoop 单机安装
- linux下单机安装hadoop
- Hadoop 2.0.3在Linux环境下单机部署
- Linux环境下的Hadoop安装
- Linux下,Hadoop环境的安装配置
- Linux下Hadoop集群环境的安装配置
- Hadoop 在Linux 单机上伪分布式 的安装过程
- Hadoop2.0单机环境安装部署
- Hadoop Linux 环境搭建(安装、配置)
- ubuntu12.04下安装hadoop-1.0.3 并搭建单机伪分布式运行环境(一)
- 在linux环境下安装hadoop环境和配置
- 在Linux系统中配置Hadoop环境(1)---在虚拟机上安装Linux Ubuntu系统
- linux下从安装JDK到安装ssh到hadoop单机伪分布式部署
- 在单机上安装、配置MPI 并行环境(Linux版)
- ubuntu13.04环境hadoop1.2.1单机模式安装
- Hadoop单机环境安装配置(Ubuntu 12.04)