您的位置：首页 > 编程语言 > Java开发

Eclipse 编写的spark版WordCount运行在spark上

2014-11-27 11:35 429 查看

1、代码编写

if (args.length != 3 ){
println("usage is org.test.WordCount <master> <input> <output>")
return
}
val sc = new SparkContext(args(0), "WordCount",
System.getenv("SPARK_HOME"), Seq(System.getenv("SPARK_TEST_JAR")))
val textFile = sc.textFile(args(1))
val result = textFile.flatMap(line => line.split("\\s+"))
.map(word => (word, 1)).reduceByKey(_ + _)
result.saveAsTextFile(args(2))

2、导出jar包，这里我命名为WordCount.jar

3、运行

bin/spark-submit --master spark://master:7077 /home/zkpk/Desktop/WordCount.jar hdfs://master:9000/dedup_in hdfs://master:9000/dedup_out

先记录下，第三部还没执行，抽空试试

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

idea运行spark的wordcount与eclipse运行spark的wordcount示例，及本地运行sparkpi
scala-eclipse 编写spark简单程序 WordCount
Idea中编写并运行Spark集群（WordCount）
win7下安装hadoop 2.6.0 的eclipse插件并编写运行WordCount程序
利用Scala编写Wordcount并在spark框架下运行
fedora17中hadoop2.2.0在eclipse下运行wordcount
eclipse运行wordcount
eclipse运行hadoop wordcount example
在linux下eclipse中运行hadoop自带的WordCount例子出现的两个错误
Eclipse运行Hadoop WordCount例程
在windows上用eclipse远程运行hadoop上的wordcount程序出现的问题，求解决
eclipse打包jar发布到linux下运行出错（java.lang.ClassNotFoundException: cmd.WordCount$MyMapper ）
【hadoop学习笔记】4.eclipse运行wordcount实例
linux下在eclipse上运行hadoop自带例子wordcount
Hadoop2.2.0源码分析（一）——Eclipse运行WordCount.java
解决Eclipse中运行WordCount出现 java.lang.ClassNotFoundException: org.apache.hadoop.examples.WordCount$TokenizerMapper问题【转】
Hadoop不用eclipse去编译运行WordCount
Eclipse运行wordcount步骤

新的分享

【Java面试】请简单说一下你对受检异常和非受检异常的理解
如何快速提高英飞凌单片机编译器 TASKING TriCore Eclipse IDE 编译速度
王者并发课-星耀1：群雄逐鹿-从鹿死谁手深入理解Java内存模型
【Java面试】Mybatis中#{}和${}的区别是什么？
【Java面试】请说一下ReentrantLock的实现原理？
Java 基础常见知识点&面试题总结(上)，2022 最新版！| JavaGuide
SpringCloud 声明式服务调用：Feign
自定义一个简单的SpringBoot-Starter
看Spring源码不得不会的@Enable模块驱动实现原理讲解
为什么Java有了synchronized之后还造了Lock锁这个轮子？
Spring Authorization Server 0.3.0 发布，官方文档正式上线
Java使用线程池和缓存提高接口QPS

章节导航