您的位置：首页 > 运维架构 > Linux

Centos7 下 spark1.6.1_hadoop2.6 分布式集群环境搭建

2017-04-19 10:47 861 查看

摘要

在上一篇博客《Centos7 下 Hadoop 2.6.4 分布式集群环境搭建》

已经详细写了Hadoop 2.6.4 配置过程，下面详细介绍 Spark 1.6.1的安装过程。

Scala 安装

下载，解压

下载 Scala-2.11.8.tgz，解压到 /root/workspace/software/scala-2.10.4t 目录下

修改环境变量文件 /etc/profile

添加以下内容

export SCALA_HOME=/root/workspace/software/scala-2.10.4
export PATH=$PATH:$SCALA_HOME/bin

1
2
1
2

source 使之生效

source /etc/profile

1
1

验证 Scala 安装

slaver1-slaver4 部署 scala

slaver1 - slaver4 参照 master 机器安装步骤进行安装。

Spark 安装

下载，解压

下载 spark-1.6.1-bin-hadoop2.6.tgz，解压到/root/workspace/software/spark1.6.1_hadoop2.6目录下。

修改环境变量文件 /etc/profile, 添加以下内容。

export SPARK_HOME=/root/workspace/software/spark1.6.1_hadoop2.6/
export PATH=$PATH:XXX其他软件的环境变量:$SPARK_HOME/bin# 在最后添加:$SPARK_HOME/bin

1
2
1
2

source 使之生效

source /etc/profile

1
1

Spark 配置

spark-env.sh

进入 Spark 安装目录下的 /root/workspace/software/spark1.6.1_hadoop2.6/conf 目录，拷贝 spark-env.sh.template 到 spark-env.sh。

cp spark-env.sh.template spark-env.sh

1
1

编辑 spark-env.sh，在其中添加以下配置信息：

export SCALA_HOME=/root/workspace/software/scala-2.10.4
export JAVA_HOME=/usr/java/jdk1.7.0_80
export HADOOP_HOME=/root/workspace/software/hadoop-2.6.4
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SPARK_MASTER_IP=192.168.122.1
export SPARK_LOCAL_DIRS=/root/workspace/software/spark1.6.1_hadoop2.6
export SPARK_WORKER_MEMORY=20g

1
2
3
4
5
6
7
1
2
3
4
5
6
7

JAVA_HOME 指定 Java 安装目录；

SCALA_HOME 指定 Scala 安装目录；

SPARK_MASTER_IP 指定 Spark 集群 Master 节点的 IP 地址；

SPARK_WORKER_MEMORY 指定的是 Worker 节点能够分配给 Executors 的最大内存大小；

HADOOP_CONF_DIR 指定 Hadoop 集群配置文件目录。

SPARK_WORKER_MEMORY 我这边的机器内存32g，我设置内存为20g,更加自己的情况修改。