RDD Action 显示
2015-10-17 22:26
197 查看
RDD Action 显示
val nums = sc.parallelize(List(1,2,3,6,4,7,5))
nums.collect //会引起客户端内存溢出
//返回前k 个元素
nums.take(2)
//返回排序后的前k 个元素
nums.takeOrdered(2)
//返回第一个元素
nums.first
//返回随机k个元素
nums.takeSample(true,2) //不替换
nums.takeSample(false,2) //替换
nums.foreach(println)
//合并集合元素
nums(_+_)
key/value 返回一个hashmap 记录每一个key有多少个value
val a = sc.parallelize(List(("spark",1),("hadoop",1),("storm",1),("storm",1)))
a.countByKey
//将RDD保存到HDFS中
nums.saveAsTextFile("/aa")
val a = sc.parallelize(List(("spark",1),("hadoop",1),("storm",1),("storm",1)))
a.countByKey
res21: scala.collection.Map[String,Long] = Map(spark -> 1, hadoop -> 1, storm -> 2)
val nums = sc.parallelize(List(1,2,3,6,4,7,5))
nums.collect //会引起客户端内存溢出
//返回前k 个元素
nums.take(2)
//返回排序后的前k 个元素
nums.takeOrdered(2)
//返回第一个元素
nums.first
//返回随机k个元素
nums.takeSample(true,2) //不替换
nums.takeSample(false,2) //替换
nums.foreach(println)
//合并集合元素
nums(_+_)
key/value 返回一个hashmap 记录每一个key有多少个value
val a = sc.parallelize(List(("spark",1),("hadoop",1),("storm",1),("storm",1)))
a.countByKey
//将RDD保存到HDFS中
nums.saveAsTextFile("/aa")
val a = sc.parallelize(List(("spark",1),("hadoop",1),("storm",1),("storm",1)))
a.countByKey
res21: scala.collection.Map[String,Long] = Map(spark -> 1, hadoop -> 1, storm -> 2)
相关文章推荐
- spring里的工具类,摘自spring3.0.5版本
- (C语言)搜狗的一道在线编程题
- Ubuntu终端Terminal常用快捷键
- 接口继承多个
- 作业3 读后感
- c的两个坑:多个变量的定义和数组越界的访问
- postgresql数据库操作指令学习
- Spring核心框架 - AOP的起源及介绍
- java上传图片文件
- Dom4J操作xml文档
- GSL wrapper example codes
- 知已者明(转)
- Spring核心框架 - AOP的原理及源码解析
- C语言操作符++、--学习难点
- 第二章 构造函数语意学 编译器何时合成拷贝构造函数?
- Java基础---集合之常用集合类的区别和联系、collections、泛型
- J-Link JTAG/SWD接口
- 生化分析仪攻关及开发新措施
- 实现三级缓存
- Linux系统安装时分区的选择(推荐)