您的位置:首页 > 数据库

CDH5.5自行编译支持sparkSQL,sparkR

2015-12-15 13:32 330 查看
第一步:编译支持hive的spark assembly

/article/7970601.html

第二步:让cloudera manager装的spark支持hql

/article/7970612.html

发现CDH5.5竟然把spark-sql,sparkR命令文件都没有放。R文件夹也没有。

第三步:拷贝文件和设置环境

把社区版的spark文件夹中R文件夹拷贝到CDH/lib/spark目录下,并把sbin和bin目录拷贝到CDH/lib/spark的bin和sbin。

sparkR --master yarn --executor-memory 1g

提示找不到hadoop的配置

IllegalArgumentException: requirement failed: Cannot read Hadoop config dir /opt/cloudera/parcels/CDH/lib/spark/conf/yarn-conf.



需要增加配置:

vi /etc/profile

source /etc/profile

export HADOOP_HOME=/opt/cloudera/parcels/CDH/lib/hadoop

export HADOOP_CONF_DIR=/etc/hadoop/conf

export HADOOP_CMD=/opt/cloudera/parcels/CDH/bin/hadoop

export HIVE_HOME=/opt/cloudera/parcels/CDH/lib/hive

export SPARK_HOME=/opt/cloudera/parcels/CDH/lib/spark

export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin:$SCALA_HOME/bin





内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: