spark1.4.1配置及源码阅读
2015-08-11 00:00
302 查看
摘要: 本博客基于spark-1.4.1-bin-hadoop2.6,spark内存计算、易于编写、可完全替代map/reduce、流式计算、机器学习,优点不要太多
1.创建脚本
2.程序加入环境变量
3.系统加入环境变量
4.启动
5.查看进程是否启动
6.进入spark的web页面 http://spore:8080/
7.使用spark-shell
8.sparkUI http://spore:4040
源码阅读,查看spark支持哪些sql关键字:
spark\sql\catalyst\src\main\scala\org\apache\spark\sql\catalyst\SQLParser.scala
spark-sql自定义函数例子
http://colobu.com/2014/12/11/spark-sql-quick-start/
如果要使用bin/spark-sql这个命令
必须启动hive metastore且conf/hive-site.xml内必须要有hive.metastore.uris的配置,例如
启动bin/spark-sql,即可使用hive的HQL语句,速度可比hive快多了
spark优化
http://my.oschina.net/u/877759/blog/490053
1.创建脚本
cd /opt/spark-1.4.1-bin-hadoop2.6/conf cp spark-env.sh.template spark-env.sh cp slaves.template slaves
2.程序加入环境变量
vi spark-env.sh export JAVA_HOME=/opt/jdk1.7.0_75 export SCALA_HOME=/opt/scala-2.11.6 export HADOOP_CONF_DIR=/opt/hadoop-2.6.0/etc/hadoop # spark的work目录临时文件自动清理,清理频率每半小时 export SPARK_WORKER_DIR="/home/hadoop/spark/worker/" export SPARK_WORKER_OPTS="-Dspark.worker.cleanup.enabled=true -Dspark.worker.cleanup.interval=1800" vi slaves 填入各节点hostname
3.系统加入环境变量
vi /etc/profile export SPARK_HOME=/opt/spark-1.4.1-bin-hadoop2.6 export PATH=$SPARK_HOME/bin:$PATH
4.启动
cd ../sbin/ ./start-all.sh
5.查看进程是否启动
jps 4211 Master 4367 Worker
6.进入spark的web页面 http://spore:8080/
7.使用spark-shell
cd ../bin/ ./spark-shell
8.sparkUI http://spore:4040
源码阅读,查看spark支持哪些sql关键字:
spark\sql\catalyst\src\main\scala\org\apache\spark\sql\catalyst\SQLParser.scala
spark-sql自定义函数例子
http://colobu.com/2014/12/11/spark-sql-quick-start/
如果要使用bin/spark-sql这个命令
必须启动hive metastore且conf/hive-site.xml内必须要有hive.metastore.uris的配置,例如
<configuration> <property> <name>hive.metastore.uris</name> <value>thrift://byd0087:9083</value> </property> </configuration>
启动bin/spark-sql,即可使用hive的HQL语句,速度可比hive快多了
spark优化
http://my.oschina.net/u/877759/blog/490053
相关文章推荐
- Spark随谈——开发指南(译)
- Spark,一种快速数据分析替代方案
- [游戏资讯]《极品飞车16:亡命狂飙》配置需求公布
- 路由器备份配置
- 路由器的基本配置
- 路由器基础配置及传输协议
- 经典配置 Vlan篇
- 备份线路的配置
- 交换机如何配置 新手配置交换机详细教程
- 如何进行系统配置
- 路由器的配置与调试
- DOS下内存的配置
- IIS配置文件隐患
- Windows下Postgresql数据库的下载与配置方法
- redis中修改配置文件中的端口号 密码方法
- 解析如何在sqlserver代理中配置邮件会话
- C#自定读取配置文件类实例
- 运行Node.js的IIS扩展iisnode安装配置笔记
- Extjs4 GridPanel的主要配置参数详细介绍