hadoop入门级配置笔记(v1.2.1,win7 64位系统)
2015-04-06 21:49
225 查看
1、安装JDK,配置环境变量,这个没商量,不会的自己百度;
2、下载并安装cygwin,这样就可以在windows下使用命令行了,具体可以参考 http://jingyan.baidu.com/article/6b97984d83dfe51ca2b0bf0e.html,注意同时安装Net分类下面的openssh;
3、下载hadoop发行版本,解压到你想要的目录,修改conf/hadoop-env.sh将JAVA_HOME设置为Java安装根路径;
4、配置conf/hadoop-site.xml:
5、配置ssh,打开cygwin,执行ssh-host-config,一路yes,执行到Enter the value of CYGWIN for the daemon: [] ,输入ntsec,继续yes,然后输入两次相同的密码;
6、启动sshd,在cygwin中执行cygrunsrv --start sshd(停止cygrunsrv
--stop sshd);
7、生成密钥文件,在cygwin中执行ssh-keygen,输入保存的路径,建议放在{当前用户}/.ssh/id_rsa,cat
~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
8、测试ssh是否能够使用,在cygwin中执行ssh
localhost、yes、输入当前系统用户登录密码(如果有登录密码),出现类似Last login: Mon Apr 6 21:04:32 2015 from 127.0.0.1信息,则表明ssh可以正常使用;
9、替换jar包,由于在windows下面,官方包存在BUG,可以下载 http://dl2.iteye.com/upload/attachment/0089/3020/f0eb1170-bd77-31d6-bd76-49098c411cc3.jar,修改jar包名为hadoop-core-1.2.1,替换原有的jar包即可;
10、启动hadoop,在cygwin中进入${HADOOP_HOME}(hadoop解压后的目录,下面不再累述),执行bin/hadoop
namenode -format格式化一个新的分布式文件系统,执行bin/start-all.sh启动hadoop守护进程;
11、创建输入环境,在cygwin中分别执行mkdir
input、cp conf/*.xml input;
12、执行示例,在cygwin中执行 bin/hadoop
jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+';
13、将分布式文件系统上的文件copy到本地,在cygwin中执行 bin/hadoop
fs -get output output。
==================我是华丽丽的分割线======================
写在最后:
此文档是参考官方入门教程 http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html 补充和改正的,本人也是初步接触hadoop,以上是我在搭建hadoop环境时,遇到大量问题后总结出来的,其中肯定存在不足,希望能给刚入门的带来指导作用,若有不足,请指正。如果在搭建的过程中出现什么问题,欢迎回复本帖或者发邮件
zhipingcai@qq.com,我们一同学习。
2、下载并安装cygwin,这样就可以在windows下使用命令行了,具体可以参考 http://jingyan.baidu.com/article/6b97984d83dfe51ca2b0bf0e.html,注意同时安装Net分类下面的openssh;
3、下载hadoop发行版本,解压到你想要的目录,修改conf/hadoop-env.sh将JAVA_HOME设置为Java安装根路径;
4、配置conf/hadoop-site.xml:
<span style="font-family:SimSun;font-size:14px;"><configuration> <property> <name>fs.default.name</name> <value>hdfs://localhost:9000</value> </property> <property> <name>mapred.job.tracker</name> <value>localhost:9001</value> </property> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration></span>
5、配置ssh,打开cygwin,执行ssh-host-config,一路yes,执行到Enter the value of CYGWIN for the daemon: [] ,输入ntsec,继续yes,然后输入两次相同的密码;
6、启动sshd,在cygwin中执行cygrunsrv --start sshd(停止cygrunsrv
--stop sshd);
7、生成密钥文件,在cygwin中执行ssh-keygen,输入保存的路径,建议放在{当前用户}/.ssh/id_rsa,cat
~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
8、测试ssh是否能够使用,在cygwin中执行ssh
localhost、yes、输入当前系统用户登录密码(如果有登录密码),出现类似Last login: Mon Apr 6 21:04:32 2015 from 127.0.0.1信息,则表明ssh可以正常使用;
9、替换jar包,由于在windows下面,官方包存在BUG,可以下载 http://dl2.iteye.com/upload/attachment/0089/3020/f0eb1170-bd77-31d6-bd76-49098c411cc3.jar,修改jar包名为hadoop-core-1.2.1,替换原有的jar包即可;
10、启动hadoop,在cygwin中进入${HADOOP_HOME}(hadoop解压后的目录,下面不再累述),执行bin/hadoop
namenode -format格式化一个新的分布式文件系统,执行bin/start-all.sh启动hadoop守护进程;
11、创建输入环境,在cygwin中分别执行mkdir
input、cp conf/*.xml input;
12、执行示例,在cygwin中执行 bin/hadoop
jar hadoop-examples-*.jar grep input output 'dfs[a-z.]+';
13、将分布式文件系统上的文件copy到本地,在cygwin中执行 bin/hadoop
fs -get output output。
==================我是华丽丽的分割线======================
写在最后:
此文档是参考官方入门教程 http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html 补充和改正的,本人也是初步接触hadoop,以上是我在搭建hadoop环境时,遇到大量问题后总结出来的,其中肯定存在不足,希望能给刚入门的带来指导作用,若有不足,请指正。如果在搭建的过程中出现什么问题,欢迎回复本帖或者发邮件
zhipingcai@qq.com,我们一同学习。
相关文章推荐
- win7 64位搭建Mantis 缺陷管理系统(2)--配置及问题修复
- Win7 64位系统安装OpenCV2.3,并在VS2010中配置(下)
- Hadoop1.2.1集群安装配置笔记
- Hbase入门笔记( 二 )-- Hadoop单机环境配置
- Hadoop1.2.1安装笔记3:hadoop配置
- 配置安装OpenCV(VS2010+OpenCV 2.4.3 + 64位系统+Win7)
- 在VS2010配置MPI--win7下64位系统
- Hadoop(1.2.1) 常用配置-------笔记
- 在win7 64位系统中配置免安装的mysql5.6.16
- Hbase入门笔记( 二 )-- Hadoop单机环境配置
- Win7 64位系统安装OpenCV2.3,并在VS2010中配置(上)
- 64位Win7下编译hadoop 1.2.1问题解决
- Hbase入门笔记( 二 )-- Hadoop单机环境配置
- Win7 64位系统下VS2010配置OpenCV2.4.4
- WIN7(64位)系统发现数据源ODBC里面没有配置access数据源连接&System, System32, Syswow64 概述
- Win7 64位系统安装OpenCV2.3,并在VS2010中配置(下)
- 在win7 64位系统下配置IIS
- hadoop 1.2.1 配置 学习笔记(一)
- win7 64位系统 配置php最新版开发环境(php+Apache+mysql)
- win7 64位系统中mysql免安装版配置