您的位置：首页 > 其它

Spark生态之Alluxio学习12--spark调用alluxio-1.3.0配置

2016-11-10 14:55 531 查看

更多代码请见：https://github.com/xubo245/SparkLearning

Spark生态之Alluxio学习版本：alluxio（tachyon） 1.3.0，spark-1.5.2,hadoop-2.6.0

1.解释

alluxio-0.7.1 启动的时候spark集群直接可以调用，但是alluxio-1.3.0需要自动配置

2.代码：

2.1 下载

alluxio spark client

或者：

http://downloads.alluxio.org/downloads/files/1.3.0/alluxio-1.3.0-spark-client-jar-with-dependencies.jar

2.2 配置

请添加如下代码到spark/conf/spark-defaults.conf：

spark.driver.extraClassPath /home/hadoop/cloud/alluxio-1.3.0/jar/alluxio-1.3.0-spark-client-jar-with-dependencies.jar
spark.executor.extraClassPath /home/hadoop/cloud/alluxio-1.3.0/jar/alluxio-1.3.0-spark-client-jar-with-dependencies.jar

2.2 启动

重启spark集群

3.结果：

spark-shell可以操作alluxio集群

scala>  val rdd1= sc.textFile("hdfs://Master:9000//xubo/project/SparkSW/input/D1Line.fasta")
rdd1: org.apache.spark.rdd.RDD[String] = MapPartitionsRDD[1] at textFile at <console>:21

scala> rdd1.count
res0: Long = 78295

scala> rdd1.saveAsTextFile("alluxio://Master:19998/D1Line.fasta")

参考

【1】https://github.com/Alluxio/alluxio
【2】http://www.alluxio.org/
【3】http://spark.apache.org/docs/1.5.2/programming-guide.html
【4】https://github.com/xubo245/SparkLearning

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： spark tachyon 集群 alluxio

相关文章推荐

新的分享

章节导航