Haddop本机安装
2015-07-28 10:13
162 查看
做一下笔记,以后在安装可以再用
Hadoop之父Doug Cutting
Lucence
全球第一个开源的全文检索引擎工具包
完整的查询引擎和索引引擎
部分文本分析引擎
开发人员可在此基础上建立完整的全文检索引擎
Nutch
开源的基于Lucence的网页搜索引擎
加入了网页抓取、解析功能
类似于谷歌的商业搜索引擎
谷歌的论文
Google File System
Mapreduce:Simplfied Data Processing on Large Clusters
版本有五个分支
0.20.1分支:稳定版是1.2.1
0.21.0
0.22.0
0.23.0(第二代)
2.0.0-a:第一个稳定版2.2.0,最新稳定版是2.7.x
为了初学者,首先使用第一版的Hadoop来学习。也就是1.2.1
1、下载
2、
设置环境变量
设置用户路径
export HADOOP_HOME=/home/dh/usr/hadoop/
export PATH=/home/dh/usr/hadoop/bin:${PATH}
修改配置文件
修改conf/hadoop.env.sh下的java路径
3、修改SSH免密码登录
默认没有安装ssh
sudo apt-get install openssh-server
普通用户终端下:
ssh-keygen //生成空口令对
ssh-keygen -t rsa -P
一路回车
将生成的公钥id_rsa.pub 内容追加到authorized_keys
cat id_rsa.pub >> authorized_keys
Hadoop之父Doug Cutting
Lucence
全球第一个开源的全文检索引擎工具包
完整的查询引擎和索引引擎
部分文本分析引擎
开发人员可在此基础上建立完整的全文检索引擎
Nutch
开源的基于Lucence的网页搜索引擎
加入了网页抓取、解析功能
类似于谷歌的商业搜索引擎
谷歌的论文
Google File System
Mapreduce:Simplfied Data Processing on Large Clusters
版本有五个分支
0.20.1分支:稳定版是1.2.1
0.21.0
0.22.0
0.23.0(第二代)
2.0.0-a:第一个稳定版2.2.0,最新稳定版是2.7.x
为了初学者,首先使用第一版的Hadoop来学习。也就是1.2.1
1、下载
2、
设置环境变量
设置用户路径
export HADOOP_HOME=/home/dh/usr/hadoop/
export PATH=/home/dh/usr/hadoop/bin:${PATH}
修改配置文件
修改conf/hadoop.env.sh下的java路径
3、修改SSH免密码登录
默认没有安装ssh
sudo apt-get install openssh-server
普通用户终端下:
ssh-keygen //生成空口令对
ssh-keygen -t rsa -P
一路回车
将生成的公钥id_rsa.pub 内容追加到authorized_keys
cat id_rsa.pub >> authorized_keys
相关文章推荐
- 转载:Linux文件系统(五)---三大缓冲区之buffer块缓冲区
- 国内外.top域名注册量TOP15:35互联跌至第十二名
- linux 处理僵尸进程
- Android Media架构
- linux查找目录下的所有文件中是否含有某个字符串
- rlwrap安装(解决Linux下无法使用上下键)
- 八点掌握网站设计的要领
- 在Mac系统上安装Tomcat
- Linux执行脚本
- linux 内核 内存管理 slub算法原理
- nginx重启找不到pid
- linux串口应用
- .NET应用架构设计—四色原型模式(色彩造型、域无关的模型)(概念版)
- linux 内核 内存管理 slub算法原理
- 使用 Grafana+collectd+InfluxDB 打造现代监控系统
- OpenGL制作会旋转的矩形
- UltraEdit 配置 shell 语法高亮
- 中国最早论坛聚合门户:大旗网突然关站
- 利用Python编写linux自动备份脚本
- linux内核__get_free_page,kmalloc,vmalloc的区别,内核对内存的管理