Eclipse+Maven+Scala Project+Spark | 编译并打包wordcount程序
2018-01-12 18:47
447 查看
学习用Eclipse+Maven来构建并打包一个简单的单词统计的例程。
本项目源码已托管于Github –>【Spark-wordcount】
在这个项目中,从pom.xml中可以观察到spark版本是
编译好的jar包中包含的class文件
参考资料:
[1].Using Scala IDE on Maven projects http://scala-ide.org/docs/tutorials/m2eclipse/
转载请注明出处:http://blog.csdn.net/coder__cs/article/details/79047053
本文出自【elon33的博客】
本项目源码已托管于Github –>【Spark-wordcount】
第一步 在EclipseIDE中安装Scala插件
在Eclipse中安装Scala插件第二步 创建Scala Project
创建Scala 项目第三步 给Scala项目注入maven依赖
将Scala 项目 转为 Maven 项目pom.xml
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd"> <modelVersion>4.0.0</modelVersion> <groupId>com.elon33.scala</groupId> <artifactId>WordCount</artifactId> <version>0.0.1-SNAPSHOT</version> <dependencies> <dependency> <groupId>org.apache.spark</groupId> <artifactId>spark-core_2.11</artifactId> <version>2.2.1</version> <scope>provided</scope> </dependency> </dependencies> <build> <sourceDirectory>src</sourceDirectory> <plugins> <plugin> <artifactId>maven-compiler-plugin</artifactId> <version>3.5.1</version> <configuration> <source>1.8</source> <target>1.8</target> </configuration> </plugin> <plugin> <groupId>net.alchim31.maven</groupId> <artifactId>scala-maven-plugin</artifactId> <version>3.3.1</version> </plugin> </plugins> </build> </project>
第四步 设置Scala Compiler 以及修改Scala Libarary Container版本
当设置完pom.xml,我们可以看到有一些错误出些,主要错误来源于编译器交叉编译,Scala源码包版本不对引起的。
在这个项目中,从pom.xml中可以观察到spark版本是
spark-core_2.11,因此Maven Dependencies中已经集成了
Scala2.11,因此可以通过指定编译器版本和源码包版本解决Errors。
第五步 Maven 编译打包
通过对项目进行 Maven Install 可以得到可运行的jar包编译好的jar包中包含的class文件
第六步 Spark 集群上运行
将jar包发送到Spark集群上运行spark-submit --class com.elon33.wordcount WordCount-0.0.1-SNAPSHOT.jar ../opt/modules/spark-2.2.1-bin-hadoop2.7/README.md ./wordcounts
第七步 计数结果
单词程序的统计结果[elon@hadoop scala]$ cd wordcounts/ [elon@hadoop wordcounts]$ ls part-00000 _SUCCESS [elon@hadoop wordcounts]$ cat part-00000 (package,1) (For,3) (Programs,1) (processing.,1) (Because,1) (The,1) (page](http://spark.apache.org/documentation.html).,1) ......
参考资料:
[1].Using Scala IDE on Maven projects http://scala-ide.org/docs/tutorials/m2eclipse/
转载请注明出处:http://blog.csdn.net/coder__cs/article/details/79047053
本文出自【elon33的博客】
相关文章推荐
- idea+maven+scala创建wordcount,打包jar并在spark on yarn上运行
- scala-eclipse 编写spark简单程序 WordCount
- idea+maven+scala创建wordcount,打包jar并在spark on yarn上运行(可以使用)
- maven构建Scala程序,实现spark的wordcount
- idea+maven+scala创建wordcount,打包jar并在spark on yarn上运行
- Spark实战----(1)使用Scala开发本地测试的Spark WordCount程序
- 第一个spark scala程序——wordcount
- JDK8+Scala2.11+spark-2.0.0+Intellij2017.3.4开发wordcount程序并在集群中运行
- 分别用Java、Scala、spark-shell开发wordcount程序及测试代码
- sbt 编译spark 的wordcount 程序
- 运行hadoop的WordCount程序——编译,打包,运行
- 用SBT编译Spark的WordCount程序
- 启动Spark Shell,在Spark Shell中编写WordCount程序,在IDEA中编写WordCount的Maven程序,spark-submit使用spark的jar来做单词统计
- Eclipse下运行Hadoop程序(以WordCount为例,使用Maven)
- 用SBT编译Spark的WordCount程序
- 使用eclipse开发spark程序 wordcount 事例
- sbt的安装以及用sbt编译打包scala编写的spark程序
- 使用命令行编译、打包、运行WordCount--不用eclipse
- Spark 程序 WordCount实现 Scala、Python
- 用SBT编译Spark的WordCount程序