VirtualBox搭建Hadoop2.7.2环境(1)——伪分布式
2016-02-02 18:03
489 查看
1. 软件
软件/OS | 版本 |
---|---|
Hadoop | 2.7.2 |
Ubuntu | 14.04 (32位) |
VirtualBox | 4.3.24 |
openjdk | 1.7.0_91 |
ssh | - |
rsync | - |
2.下载安装软件包
1) 下载解压Hadoop 2.7.2tar -xf hadoop-2.7.2.tar.gz ~/
2) 命令行安装
sudo apt-get install rsync
sudo apt-get install ssh
sudo apt-get install openjdk-7-jdk
3. 配置环境
1) 软件配置/etc/profile
export JAVA_HOME=/usr/lib/jvm/java-7-openjdk-i386
#HADOOP export HADOOP_HOME=~/hadoop-2.7.2 export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"
2) ssh配置
$ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa //生成秘钥 $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys //公钥加入信任列表 $ chmod 0600 ~/.ssh/authorized_keys //设置为所有者读写权限
3) Hadoop配置
1) etc/hadoop/core-site.xml
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration>
2) etc/hadoop/hdfs-site.xml:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
3) etc/hadoop/hadoop-env.sh
# The java implementation to use. export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-i386
4. Hadoop实施
1) 格式化文件系统$ bin/hdfs namenode -format
2) 启动NameNode守护进程和DataNode守护进程
$ sbin/start-dfs.sh
3) 网页访问NameNode
http://localhost:50070/
4) 创建执行MapReduce任务所需要的HDFS目录
$ bin/hdfs dfs -mkdir /user
$ bin/hdfs dfs -mkdir /user/ckelsel
5) 待分析数据放入分布式文件系统
$ bin/hdfs dfs -put etc/hadoop input
6) 执行自带的分析用例
$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input output 'dfs[a-z.]+'
7) 将输出结果从分布式文件系统拷贝到本地,检验结果
$ bin/hdfs dfs -get output output
$ cat output/*
8) 测试结束,关闭守护进程
$ sbin/stop-dfs.sh
相关文章推荐
- Image Watch——OpenCV中的神器
- [原创] zabbix学习之旅七:如何远程操作被监控机器
- Linux下运行C程序
- 杀进程启动服务
- 查看linux服务器硬盘IO读写负载
- linux 定时自动异地备份
- 2016打算做运维的人员必知必晓的知识
- Linux---挂载命令
- Linux中find批量删除空文件及空文件夹脚本
- 关于 tomcat 集群中 session 共享的三种方法
- zabbix监控应用连接数
- linux下查看opencv版本
- Linux下grep显示前后几行信息
- 修改Apache配置文件开启gzip压缩传输
- linux crontab用法
- centos下搭建docker私有仓库
- tomcat内存配置优化
- 嵌入式Linux之设备驱动程序
- linux常用命令
- Linux双网卡配置