编译特定hadoop版本的spark
2016-05-10 13:33
387 查看
编译匹配Spark-1.2.0和Hadoop-2.4的版本,如下:
$SPARK_SRC/make-distribution.sh --tgz -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4 -Phive
如果想要编译特定hadoop版本的spark,首先必须在maven配置文件中,加入特定hadoop版本的配置
以hadoop 2.5.2为例:
Step-1:
将hadoop-2.5.2的配置加入到$SPARK_SRC/pom.xml的<profiles> 段中
and avro.mapred.classifier 的版本从Hadoop 2.5.2的发行包libs中找.]
Step-2:
编译完成之后,会在$SPARK_SRC目录下看到‘spark-1.2.0-bin-2.5.2.tgz’
refer:https://etushar89.wordpress.com/2014/12/28/building-apache-spark-against-specific-hadoop-version/
$SPARK_SRC/make-distribution.sh --tgz -Pyarn -Phadoop-2.4 -Dhadoop.version=2.4 -Phive
如果想要编译特定hadoop版本的spark,首先必须在maven配置文件中,加入特定hadoop版本的配置
以hadoop 2.5.2为例:
Step-1:
将hadoop-2.5.2的配置加入到$SPARK_SRC/pom.xml的<profiles> 段中
<profile> <id>hadoop-2.5.2</id> <properties> <hadoop.version>2.5.2</hadoop.version> <protobuf.version>2.5.0</protobuf.version> <jets3t.version>0.9.0</jets3t.version> <commons.math3.version>3.1.1</commons.math3.version> <avro.mapred.classifier>hadoop2</avro.mapred.classifier> </properties> </profile>[protobuf, jets3t, commons.math3
and avro.mapred.classifier 的版本从Hadoop 2.5.2的发行包libs中找.]
Step-2:
$SPARK_SRC/make-distribution.sh --tgz -Pyarn -Phadoop-2.5.2 -Dhadoop.version=2.5.2 -Phive
编译完成之后,会在$SPARK_SRC目录下看到‘spark-1.2.0-bin-2.5.2.tgz’
refer:https://etushar89.wordpress.com/2014/12/28/building-apache-spark-against-specific-hadoop-version/
相关文章推荐
- Apache提示You don't have permission to access / on this server问题解决
- 通哥运维笔记之Linux系统管理(二)
- 作为首席架构师,我是如何选择并落地架构方案的?
- 通哥运维笔记之apache开机启动脚本
- Linux进程含义知多少
- linux操作系统和应用系统设计
- 做了几年的运维,打算逐步分享出来,一起学习交流。
- Linux上使用Qt Creator进行C/C++开发
- System.arraycopy()实现数组之间的复制
- ganglia集群的搭建与hadoop集群的搭建
- 网上调查赚钱网站
- linux 常用命令
- 用于wordpress站点的nginx服务器配置(PHP)
- 八爪鱼招标网的百度权重升为2了,独立IP也从0快速发展为1000
- 每秒处理10万订单乐视集团支付架构
- linux camera ---1
- centos 7 开放 80端口
- 在centos上安装nfsen及插件
- Tomcat the java_home environment variable is not defined correctly
- Linux 文件系统类型介绍