Hadoop 学习笔记二 单机安装
2015-06-24 09:18
405 查看
在Ubuntu下安装Hadoop2.7.0
安装环境:Ubuntu kylin 14.04安装一般分为如下几步:
安装运行环境
修改主机名和用户名
配置静态IP地址
配置SSH无密码连接
安装JDK
配置Hadoop
格式化HDFS
启动Hadoop并验证安装
下载地址:
http://www.apache.org/dyn/closer.cgi/hadoop/common/下载压缩包:
http://mirrors.cnnic.cn/apache/hadoop/common/hadoop-2.7.0/
新增用户
sudo addgroup hadoopsudo adduser -ingroup hadoop hadoop
sudo gedit /etc/sudoers
在文件里给hadoop权限:
hadoop ALL=(ALL) ALL
sudo reboot
然后用hadoop账号登陆系统。
安装ssh
sudo apt-get install openssh-serversudo /etc/init.d/ssh start
ps -e | grep ssh
ssh-keygen -t rsa -P “”
生成的文件里:
id_rsa 私钥 id_rsa.pub 公钥
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
ssh localhost
安装java
sudo apt-get install openjdk-7-jdkupdate-alternatives –config java
我这里安装了jdk1.6、jdk1.7,使用中的是jdk1.7,记录它的路径
/usr/lib/jvm/java-7-openjdk-amd64
安装hadoop
sudo mkdir /usr/local/hadoopsudo chmod 774 /usr/local/hadoop
sudo mv hadoop-2.7.0.tar.gz /usr/local
sudo tar xzf hadoop-2.7.0.tar.gz
sudo mv hadoop-2.7.0/* /usr/local/hadoop
配置
sudo gedit ~/.bashrc如果这时报下面错误,把终端关上重开一次。
error: XDG_RUNTIME_DIR not set in the environment.
把下面内容复制到文件末尾:
#HADOOP VARIABLES START export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64 export HADOOP_INSTALL=/usr/local/hadoop export PATH=$PATH:$HADOOP_INSTALL/bin export PATH=$PATH:$HADOOP_INSTALL/sbin export HADOOP_MAPRED_HOME=$HADOOP_INSTALL export HADOOP_COMMON_HOME=$HADOOP_INSTALL export HADOOP_HDFS_HOME=$HADOOP_INSTALL export YARN_HOME=$HADOOP_INSTALL export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_INSTALL/lib/native export HADOOP_OPTS="-Djava.library.path=$HADOOP_INSTALL/lib" #HADOOP VARIABLES END
source ~/.bashrc
sudo gedit /usr/local/hadoop/etc/hadoop/hadoop-env.sh
修改如下:
#export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-amd64
测试
cd /usr/local/hadoopmkdir input
cp README.txt input
bin/hadoop jar share/hadoop/mapreduce/sources/hadoop-mapreduce-examples-2.7.0-sources.jar org.apache.hadoop.examples.WordCount input output
运行结果:
cat output/*
这时可以看到输出结果:
相关文章推荐
- nginx.conf文件详解及调优
- Linux enca命令
- nginx FastCGI错误Primary script unknown解决办法
- CentOS上如何把Web服务器从Apache换到nginx
- Hadoop项目实战-用户行为分析之编码实践
- Canopy算法原理
- 更换apache到nginx的操作过程全记录
- CentOS安装scp命令的软件包openssh-clients(注意思路)
- 【C/C++】Linux下使用system()函数一定要谨慎
- 架构师速成4.2-幼儿园要学会如何高效学习
- 架构师速成4.2-幼儿园要学会如何高效学习 分类: 架构师速成 2015-06-24 09:10 409人阅读 评论(2) 收藏
- 如何在云服务提供商的平台上使用Docker Machine
- Linux vmstat命令实战详解
- linux之sort用法 linux之sort用法
- neutron-openvswitch-agent crash error!
- Linux 环境变量与文件查找
- 实例解说Linux命令行uniq (转)
- 架构师速成4.1-幼儿园要学会如何学习(转载自36氪)
- 架构师速成4.1-幼儿园要学会如何学习(转载自36氪) 分类: 架构师速成 2015-06-24 09:05 114人阅读 评论(0) 收藏
- linux下查看系统进程占用的句柄数