好程序员大数据学习路线分享Scala系列之集合操作函数
好程序员大数据学习路线继续为大家分享Scala系列之集合操作函数
4.6 集合的重要函数
4.6.1sum/max/min/count
在序列中查找最大或最小值是一个极常见的需求,如下:
val numbers = Seq(11, 2, 5, 1, 6, 3, 9)
numbers.max //11
numbers.min //1
更高级的例子,其中包含一个书的序列
case class Book(title: String, pages: Int)
val books = Seq( Book("Future of Scala developers", 85),
Book("Parallel algorithms", 240),
Book("Object Oriented Programming", 130),
Book("Mobile Development", 495) )
//Book(Mobile Development,495)
books.maxBy(book => book.pages)
//Book(Future of Scala developers,85)
books.minBy(book => book.pages)
如上所示,minBy & maxBy 方法解决了复杂数据的问题。你只需选择决定数据最大或最小的属性。
4.6.2 过滤
过滤一个数字 List,只获取奇数的元素。
val numbers = Seq(1,2,3,4,5,6,7,8,9,10) numbers.filter(n => n % 2 == 0)
val books = Seq( Book("Future of Scala developers", 85),
Book("Parallel algorithms", 240),
Book("Object Oriented Programming", 130),
Book("Mobile Development", 495) )
books.filter(book => book.pages >= 120)
4.6.3 Flatten
val abcd = Seq('a', 'b', 'c', 'd')
val efgj = Seq('e', 'f', 'g', 'h')
val ijkl = Seq('i', 'j', 'k', 'l')
val mnop = Seq('m', 'n', 'o', 'p')
val qrst = Seq('q', 'r', 's', 't')
val uvwx = Seq('u', 'v', 'w', 'x')
val yz = Seq('y', 'z')
val alphabet = Seq(abcd, efgj, ijkl, mnop, qrst, uvwx, yz)
//
// List(a, b, c, d, e, f, g, h, i, j, k, l, m, n, o, p, q, r, s, t,
// u, v, w, x, y, z)
alphabet.flatten
当有一个集合的集合,然后你想对这些集合的所有元素进行操作时,就会用到 flatten。
4.6.4集合之间的操作
差集、交集和并集
val num1 = Seq(1, 2, 3, 4, 5, 6)
val num2 = Seq(4, 5, 6, 7, 8, 9)
//List(1, 2, 3)
num1.diff(num2)
//List(4, 5, 6)
num1.intersect(num2)
//List(1, 2, 3, 4, 5, 6, 4, 5, 6, 7, 8, 9)
num1.union(num2)
上述示例中的 union 保留了重复的元素。如果我们不需要重复怎么办?这时可以使用 distinct 函数
//List(1, 2, 3, 4, 5, 6, 7, 8, 9)
num1.union(num2).distinct
下面是上述功能的图示:
4.6.5 map(映射)列表元素
map 是 Scala 集合最常用的一个函数。它的功能十分强大:
val numbers = Seq(1,2,3,4,5,6)
//List(2, 4, 6, 8, 10, 12)
numbers.map(n => n * 2)
val chars = Seq('a', 'b', 'c', 'd')
//List(A, B, C, D)
chars.map(ch => ch.toUpper)
map 函数的逻辑是遍历集合中的元素并对每个元素调用函数。
4.6.6 flatMap
flatMap 是由下列这两个函数组成的:
map & flatten
例子:
val abcd = Seq('a', 'b', 'c', 'd')
//List(A, a, B, b, C, c, D, d)
abcd.flatMap(ch => List(ch.toUpper, ch))
4.6.7 对整个集合进行条件检查
- val numbers = Seq(3, 7, 2, 9, 6, 5, 1, 4, 2)
- //ture numbers.forall(n => n < 10)
- //false numbers.forall(n => n > 5)
而 forall 函数就是为处理这类需求而创建的。
4.6.8 对集合进行分组
比如把某个集合拆分成偶数集和奇数集,partition 函数可以帮我们做到这一点:
val numbers = Seq(3, 7, 2, 9, 6, 5, 1, 4, 2)
//(List(2, 6, 4, 2), List(3, 7, 9, 5, 1))
numbers.partition(n => n % 2 == 0)
4.6.9 Fold
另一个流行的操作是 fold,通常可以考虑 foldLeft 和 foldRight。他们是从不同的方面做同样的工作:
val numbers = Seq(1, 2, 3, 4, 5)
//15 numbers.foldLeft(0)((res, n) => res + n)
val words = Seq("apple", "dog", "table")
//13 words.foldLeft(0)((resultLength, word) => resultLength + word.length)
foldLeft, reduceRight, and foldRight
方法foldLeft与reduceLeft工作方法很象,但是它让你指定一个值作为第一个元素。
scala> val a = Array(1, 2, 3)
a: Array[Int] = Array(1, 2, 3)
scala> a.reduceLeft(+)
res6: Int = 6
scala> a.foldLeft(100)(+)
res7: Int = 106
scala> a.foldLeft(200)(+)
res8: Int = 206
- 好程序员大数据学习路线分享Scala分支和循环
- 大数据Spark “蘑菇云”行动前传第22课:Scala集合和高级函数操作实战及Spark源码鉴赏.
- 好程序员大数据学习路线分享hive的运行方式
- 好程序员大数据学习路线hive内部函数
- 好程序员大数据学习路线分享hive的运行方式
- JNI接口学习(二)注册函数与操作简单数据类型
- hibernate学习系列-----(9)hibernate对集合属性的操作之Map集合篇
- Scala学习(6)——集合之高阶函数
- Scala 强大的集合数据操作示例
- 第22节:Scala集合和高级函数操作
- Scala学习教程笔记一之基础语法,条件控制,循环控制,函数,数组,集合
- 好程序员大数据学习路线之hive表的查询
- hibernate学习系列-----(8)hibernate对集合属性的操作之Collectioon集合篇
- Scala强大的集合数据操作代码示例
- 【修真院“善良”系列之十】初级Java程序员的学习路线
- 云星数据---Scala实战系列(精品版)】:Scala入门教程051-Scala实战源码-Scala implicit 操作02
- ASP.NET MVC WebApi 返回数据类型序列化控制(json,xml) 用javascript在客户端删除某一个cookie键值对 input点击链接另一个页面,各种操作。 C# 往线程里传参数的方法总结 TCP/IP 协议 用C#+Selenium+ChromeDriver 生成我的咕咚跑步路线地图 (转)值得学习百度开源70+项目
- 分享大数据学习路线导图、让你潜移默化的了解并入门大数据
- 大数据学习系列(3)-- 文件权限的操作
- List的一阶函数操作代码实战详解之Scala学习笔记-25