Kettle(Pentaho DataIntegration) 安装Hadoop-2.2.0插件
2014-01-22 22:18
253 查看
1 安装前的准备工作
1.1 Pentaho Data Integration
当前的CE 版本Pentaho Data Integration 是5.0.1,下载地址:http://www.pentaho.com/download/。你也可以尝试企业版EE,这里不做介绍了。下载完成后,压缩到指定的目录下。
1.2 Hadoop 2.2.0
下载最新稳定版本的Hadoop 2.2.0,下载地址:
https://hadoop.apache.org/releases.html
2 安装步骤
2.1 配置 PID Hadoop插件
进入hadoop-configurations目录下,复制chd42,并重命名为hadoop-2.2.0,并且清空client目录下的jar包。完成后,将Hadoop安装目录下share目录下的所有jar包复制到client目录下,包括hadoop
lib下jar包。清除client同级别的jar中的protobuf-java-2.4.0.jar使用protobuf-java-2.5.0.jar替代。
2.2 添加配置
将hadoop的安装目录下的配置文件复制到PID的插件hadoop-2.2.0 下,hadoop安装路径etc/hadoop/,重要的文件包括:core-site.xml,hdfd-site.xml,mapred-site.xml,yarn-site.xml,slaves等,到hadoop-2.2.0目录下。
2.3 修改PID插件的配置文件
在~/data-integration/plugins/pentaho-big-data-plugin目录下,找到plugin.properties文件。修改一行数据:
active.hadoop.configuration=hadoop-2.2.0
3.测试
测试这个配置是否成功,最简单的方法是建立job任务。创建一个job, 添加开始按钮和Hadoocopy File 组件。
点击浏览HDFS文件按钮,弹出框中配置Hadoop链接配置,点击Connect按钮。如果成功的话,下面的面板中会显示HDFS的树形文件结构。
转载,请写明出处:http://blog.csdn.net/greatelite/article/details/18676005
相关文章推荐
- Kettle(Pentaho DataIntegration) 安装Hadoop-2.2.0插件
- Kettle(PentahoDataIntegration)安装Hadoop-2.2.0插件
- Kettle(Pentaho DataIntegration)实现Hadoop-2.2.0 文件复制
- Eclipse 安装Hadoop-2.2.0插件
- 在eclipse上安装hadoop2.2.0插件
- Ubuntu配置hadoop单机+伪分布式环境+eclipse--安装eclipse并配置插件(四)
- windows下Eclipse安装hadoop1.1.2插件连接hadoop集群
- hadoop 2.6 Eclipse 插件编译/配置/安装
- hadoop2.6.0的eclipse插件安装
- hadoop2.2.0伪分布模式64位安装
- centos安装和配置hadoop2.2.0
- 在eclipse下安装开发hadoop程序的插件
- Hadoop2.2.0集群安装配置
- Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程~(心血之作啊~~)
- hadoop2.2.0安装与启动
- hadoop2.2.0编译、安装和测试
- Centos 6.5 hadoop 2.2.0 全分布式安装
- Ubuntu eclipse 安装hadoop插件
- Ubuntu 14.04 单机版 Hadoop2.2.0+hbase0.96.2 安装练习
- CentOS6.4安装hadoop2.2.0集群Pass总结