CDH5.5自行编译支持sparkSQL,sparkR
2015-12-15 13:32
330 查看
第一步:编译支持hive的spark assembly
/article/7970601.html
第二步:让cloudera manager装的spark支持hql
/article/7970612.html
发现CDH5.5竟然把spark-sql,sparkR命令文件都没有放。R文件夹也没有。
第三步:拷贝文件和设置环境
把社区版的spark文件夹中R文件夹拷贝到CDH/lib/spark目录下,并把sbin和bin目录拷贝到CDH/lib/spark的bin和sbin。
sparkR --master yarn --executor-memory 1g
提示找不到hadoop的配置
IllegalArgumentException: requirement failed: Cannot read Hadoop config dir /opt/cloudera/parcels/CDH/lib/spark/conf/yarn-conf.
需要增加配置:
vi /etc/profile
source /etc/profile
export HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop
export HADOOP_CONF_DIR=/etc/hadoop/conf
export HADOOP_CMD=/opt/cloudera/parcels/CDH/bin/hadoop
export HIVE_HOME=/opt/cloudera/parcels/CDH/lib/hive
export SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin:$SCALA_HOME/bin
相关文章推荐
- 随机读取N条记录(MySQL、SQL Server、Access、Oracle、postgreSQL)
- Windows 系统安装 redis 服务
- Spark SQL 之 Performance Tuning & Distributed SQL Engine
- 《NoSQL精粹》读书摘要
- Redis和Memcache的区别分析
- SQL 分组后,获取每组中的最大值对应的数据
- sql思考
- 电脑上不安装Oracle时,C# 调用oracle数据库,Oracle客户工具
- oracle数据库大小写敏感配置
- Mysql中判断一个字段是不是为null注意点
- redis数据库理解
- 怎么解决mysql不允许远程连接的错误
- Oracle中将查询的结果放入一张自定义表中的例子
- mysql cmd 链接方法 导入sql
- 解析mysql索引
- 64位Win7下安装mysql教程(原创亲测可用)
- java对redis的基本操作
- 从源码编译postgresql
- 数据库作业
- mysql客户端(Navicat)远程登录操作遇到问题1142