一 eclipse Spark 本地开发调试环境
2017-09-19 20:12
387 查看
一 配置JDK8
详细参考:http://jingyan.baidu.com/article/ab69b270c01a4d2ca7189f8c.html
二 配置Maven
安装mavenhttp://jingyan.baidu.com/article/d8072ac45d3660ec94cefd51.html
Maven在Eclipse中的配置
http://jingyan.baidu.com/article/db55b609a994114ba20a2f56.html
三 配置Hadoop
不需要实际安装Hadoop,下载插件包即可。windows64位平台的hadoop2.6插件包
解压包到目标文件夹,目标文件夹即Hadoop Home.
四 新建Maven工程
新建一个maven工程http://jingyan.baidu.com/article/375c8e19b5014c25f2a22912.html
引入Spark 包,在POM.XML 文件中dependencies元素下添加如下元素。
<dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>2.1.0</version> </dependency> <dependency> <groupId>org.apache.hadoop</groupId> <artifactId>hadoop-client</artifactId> <version>2.6.0</version> </dependency> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-mllib_2.11</artifactId> <version>2.1.0</version> </dependency>
五 测试代码
启动Spark代码//设置hadoop 环境变量,不设置也可以,会有烦人的报错。 System.setProperty("hadoop.home.dir", "E:/drawsky/bin"); SparkSession spark = SparkSession.builder() .appName("test") .master("local[*]") .config("hadoop.home.dir", "E:/drawsky/bin") .config("spark.sql.warehouse.dir","E/drawsky/SparkTest/spark-warehouse") .getOrCreate();
测试,计算wordCount
private static void countWords(SparkSession spark) { JavaRDD<String> st = spark.sparkContext() .textFile("G:/elasticsearch-5.3.2/LICENSE.txt", 1) .toJavaRDD(); JavaPairRDD<String, Integer> out =st .flatMap( line ->Arrays.asList(line.split(" ")).iterator() ) .groupBy(e -> e) .mapValues(x -> { Iterator<String> it = x.iterator(); int i = 0; while (it.hasNext()) { it.next(); i++; } return i; }); Map<String, Integer> map = out.collectAsMap(); 4000 System.out.println(map.toString()); }
在Eclipse中直接运行即可。
相关文章推荐
- Spark本地开发与远程调试环境搭建
- spark eclipse开发调试 本地单机模式
- spark eclipse 本地开发环境配置 以及应注意的问题
- Eclipse + genymotion 搭建Android开发环境并调试
- Eclipse+php插件+Xdebug搭建PHP完美开发/调试环境指
- 突破瓶颈,对比学习:Eclipse开发环境与VS开发环境的调试对比
- ubuntu14.04+eclipse(mars)+hadoop-2.7.1开发环境调试程序出现log4j:WARN no appenders could be found for logger。。
- eclipse开发spark程序配置本地运行
- 用Tomcat插件在Eclipse上搭建可跟踪调试的J2EE WEB开发环境
- Spark+ECLIPSE+JAVA+MAVEN windows开发环境搭建及入门实例【附详细代码】
- MyEclipse安装hadoop-eclipse-plugin,配置本地hadoop开发环境
- windows下用eclipse+goclipse插件+gdb搭建go语言开发调试环境
- windows下用eclipse+goclipse插件+gdb搭建go语言开发调试环境
- ubuntu12.04下在Eclipse中搭建BeagleBoneBlack的开发环境——远程在线运行&调试
- 微信开发一:本地环境部署及调试
- win10 系统 eclipse配置scala+spark开发环境
- hadoop 开发调试环境-eclipse配置记录
- 如何在Ubuntu上使用eclipse搭建PHP开发和调试环境
- 手把手教hadoop2.5.1+eclipse开发调试环境搭建(1)
- 突破瓶颈,对比学习:Eclipse开发环境与VS开发环境的调试对比