您的位置：首页 > 编程语言 > Java开发

Java8 Lambda表达式与Stream API (二): Stream API的使用

2017-05-09 17:57 756 查看

你要知道的Java8 匿名内部类、函数式接口、lambda表达式与Stream API都在这里

转载请注明出处 http://blog.csdn.net/u014205968/article/details/71484374

本文主要讲解

Java8 Stream API

，但是要讲解这一部分需要匿名内部类、lambda表达式以及函数式接口的相关知识，本文将分为两篇文章来讲解上述内容，读者可以按需查阅。

Java 匿名内部类、lambda表达式与函数式接口

Java Stream API

本文是本系列文章的第二篇，主要讲解

Stream API

，在学习

Stream API

之前要求读者有一定的

lambda表达式

基础，如果相关知识不了解可以参考本系列文章的第一篇Java 匿名内部类、lambda表达式与函数式接口。

Stream API

Java8

新增的

stream

功能非常强大，这里的

stream

和

Java IO

中的

stream

是完全不同概念的两个东西。本文要讲解的

stream

是能够对集合对象进行各种串行或并发聚集操作，

Stream API

依赖于前一篇文讲解的

lambda表达式

，只有当两者结合时才能极大的提高编程效率并且代码更易理解和维护。

Stream API

支持串行和并发的集合操作，这也是响应了现在多核处理器的需求，

Stream API

的并发采用的是我们熟悉的

fork/join

模式，手动编写并行代码很复杂也很容易出错，但是采用

Stream API

来进行集合对象上的并发操作你不需要编写任何多线程代码就能够轻而易举的实现并发操作，从而提高代码的运行效率，也极大的简化了编程难度。

聚集操作

在实际开发中，我们经常对一个集合内的对象进行一系列的操作，比如排序、查找、过滤、重组、数据统计等操作，通常情况下我们可能会采用

for循环

遍历的方式来逐一进行操作，这样的代码即复杂又难以维护，如果对性能有要求再进行多线程代码的编写就更加的复杂了，同时也更容易出错。

下面举一个栗子：

class User
{
private String userID;
private boolean isVip;
private int balance;

public User(String userID, boolean isVip, int balance)
{
this.userID = userID;
this.isVip = isVip;
this.balance = balance;
}

public boolean isVip()
{
return this.isVip;
}

public String getUserID()
{
return this.userID;
}

public int getBalance()
{
return this.balance;
}
}

public class HelloWorld
{
public static void main(String[] args)
{
ArrayList<User> users = new ArrayList<>();
users.add(new User("2017001", false, 0));
users.add(new User("2017002", true, 36));
users.add(new User("2017003", false, 98));
users.add(new User("2017004", false, 233));
users.add(new User("2017005", true, 68));
users.add(new User("2017006", true, 599));
users.add(new User("2017007", true, 1023));
users.add(new User("2017008", false, 9));
users.add(new User("2017009", false, 66));
users.add(new User("2017010", false, 88));

//普通实现方式
ArrayList<User> tempArray = new ArrayList<>();
ArrayList<String> idArray = new ArrayList<>(3);
for (User user: users)
{
if (user.isVip())
{
tempArray.add(user);
}
}
tempArray.sort(new Comparator<User>(){
public int compare(User o1, User o2) {
return o2.getBalance() - o1.getBalance();
}
});
for (int i = 0; i < 3; i++)
{
idArray.add(tempArray.get(i).getUserID());
}
for (int i = 0; i < idArray.size(); i++)
{
System.out.println(idArray.get(i));
}

//Stream API实现方式
//也可以使用parallelStream方法获取一个并发的stream，提高计算效率
Stream<User> stream = users.stream();
List<String> array = stream.filter(User::isVip).sorted((t1, t2) -> t2.getBalance() - t1.getBalance()).limit(3).map(User::getUserID).collect(Collectors.toList());
array.forEach(System.out::println);
}
}

上述代码首先定义了一个用户类，这个类保存用户是否是VIP、用户ID以及用户的余额，假如现在有一个需求，将VIP中余额最高的三个用户的ID找出来，传统的思路一般就是创建一个临时的

list

，然后逐一判断，将所有的VIP用户加入到这个临时的

list

中，然后调用集合类的

sort

方法根据余额排序，最后再遍历三次获取余额最高的三个用户的ID等信息。这样的方法看似简单，但代码写出来即混乱也不好看，如果用户量非常大，有几千万甚至几个亿，这样遍历的方式效率就会特别低，如果手工加上多线程的并发操作，代码就更加复杂了。

上述代码的第二部分使用

Stream API

的方式来计算，首先通过集合类获取了一个普通的

stream

，如果数据量大可以使用

parallelStream

方法获取一个并发的

stream

，这样接下来的计算程序员不需要编写任何多线程代码系统会自动进行多线程计算。获取了

stream

以后首先调用

filter

方法找到是否为VIP用户然后对VIP用户进行排序操作，接下来限制只获取三个用户的信息，然后将用户映射为用户ID，最后将该

stream

转换为集合类，两种实现方式的结果完全一样，但是明显的采用

Stream API

的代码更加简洁易懂。

Stream API

的编写大量依赖

lambda表达式

以及

lambda表达式

的

引用方法

和

引用构造器

，如果您对这一块不理解可以查阅文章Java 匿名内部类、lambda表达式与函数式接口。

如何使用Stream

A sequence of elements supporting sequential and parallel aggregate operations

上面是

Java

文档中定义的

Stream

，可以看出，

Stream

就是元素的集合，并且可以采用串行或并行的方式进行聚集操作。在使用时我们可以将

Stream

理解为一个迭代器，只不过这个迭代器更加高级，能够对其中的每一个元素进行我们规定的计算。

当我们要使用

Stream API

时，首先需要创建一个

Stream

对象，可以通过集合类的实例方法

stream

或

parallelStream

来获取一个普通的串行

stream

或是并行

stream

。也可以使用

Stream

、

IntStream

、

LongStream

或

DoubleStream

创建一个

Stream

对象，

Stream

是一个比较通用的流，可以代表任何引用数据类型，其他的则是指特定类型的流。最常用的就是通过一个集合类型来获取相应类型的

Stream

。

流的操作分为

中间操作 Intermediate

和

结束操作 Terminal

：

中间操作（Intermediate）：一个流可以采用链式调用的方式进行数个中间操作，主要目的就是打开流然后对这个流进行各种过滤、映射、聚集、统计操作等，如上述代码中的

filter

、

map

操作等。每一个操作结束后都会返回一个新的流，并且这些操作都是lazy的，也就是在进行结束操作时才会真正的进行计算，一次遍历就计算出所有结果。

结束操作（Terminal）：一个流只能执行一个结束操作，当执行了结束操作以后这个流就不能再被执行，也就是说不能再次进行中间操作或结束操作，所以结束操作一定是流的最后一个操作，如上述代码中的

collect

方法。当开始执行结束操作的时候才会对流进行遍历并且只一次遍历就计算出所有结果。

Stream的创建

通过集合类创建

通过集合创建

Stream

的方法是我们最常用的，集合类的实例方法

stream

和

parallelStream

可以获取相应的流。

ArrayList<User> users = new ArrayList<>();
users.add(new User("2017001", false, 0));
users.add(new User("2017002", true, 36));
users.add(new User("2017003", false, 98));
Stream<User> stream = users.stream();

通过数组构造

String[] str = {"Hello World", "Jiaming Chen", "Zhouhang Cheng"};
Stream<String> stream = Stream.of(str);

通过单个元素构造

Stream<Integer> stream = Stream.of(1, 2, 3, 4);

Stream与Array和Collection的转换

一般我们都会对

Stream

进行结束操作，用于获取一个数组或是集合类，通过数组和集合类创建

Stream

前文已经介绍了，这里介绍通过

Stream

获取数组或集合类。

String[] str = {"Hello World", "Jiaming Chen", "Zhouhang Cheng"};
Stream<String> stream = Stream.of(str);

String[] strArray = stream.toArray(String[]::new);
List<String> strList = stream.collect(Collectors.toList());
ArrayList<String> strArrayList = stream.collect(Collectors.toCollection(ArrayList::new));
Set<String> strSet = stream.collect(Collectors.toSet());

上面的代码分别将流转换为数组、List、ArrayList和Set类型，具体的参数可以查看官方API文档。

Stream 常用方法

filter

filter

的栗子前面已经举过了，

filter

函数需要传入一个实现

Predicate

函数式接口的对象，该接口的抽象方法

test

接收一个参数并返回一个

boolean

值，为

true

则保留，

false

则剔除，前文举的栗子就是判断是否为VIP用户，如果是就保留，不是就剔除。

原理如图所示：

map、flatMap

map

的栗子前面已经举过了，

map

函数需要传入一个实现

Function

函数式接口的对象，该接口的抽象方法

apply

接收一个参数并返回一个值，可以理解为映射关系，前文举的栗子就是将每一个用户映射为一个

userID

。

原理如图所示：

map

方法是一个一对一的映射，每输入一个数据也只会输出一个值。

flatMap

方法是一对多的映射，对每一个元素映射出来的仍旧是一个

Stream

，然后会将这个

子Stream

的元素映射到父集合中，栗子如下：

Stream<List<Integer>> inputStream = Stream.of(Arrays.asList(1), Arrays.asList(2, 3), Arrays.asList(4, 5, 6));
List<Integer> integerList = inputStream.flatMap((childList) -> childList.stream()).collect(Collectors.toList());
//将一个“二维数组”flat为“一维数组”
integerList.forEach(System.out::println);

limit、skip

limit

用于限制获取多少个结果，与数据库中的

limit

作用类似，

skip

用于排除前多少个结果。

sorted

sorted

的栗子前面也举过了，

sorted

函数需要传入一个实现

Comparator

函数式接口的对象，该接口的抽象方法

compare

接收两个参数并返回一个整型值，作用就是排序，与其他常见排序方法一致。

distinct

distinct

用于剔除重复，与数据库中的

distinct

用法一致。

findFirst

findFirst

方法总是返回第一个元素，如果没有则返回空，它的返回值类型是

Optional<T>

类型，接触过

swift

的同学应该知道，这是一个可选类型，如果有第一个元素则

Optional

类型中保存的有值，如果没有第一个元素则该类型为空。

Stream<User> stream = users.stream();
Optional<String> userID = stream.filter(User::isVip).sorted((t1, t2) -> t2.getBalance() - t1.getBalance()).limit(3).map(User::getUserID).findFirst();
userID.ifPresent(uid -> System.out.println("Exists"));

min、max

min

可以对整型流求最小值，返回

OptionalInt

。

max

可以对整型流求最大值，返回

OptionalInt

。

这两个方法是结束操作，只能调用一次。

allMatch、anyMatch、noneMatch

allMatch

：

Stream

中全部元素符合传入的

predicate

返回 true

anyMatch

：

Stream

中只要有一个元素符合传入的

predicate

返回 true

noneMatch

：

Stream

中没有一个元素符合传入的

predicate

返回 true

reduce

reduce

方法用于组合

Stream

元素，它可以提供一个初始值然后按照传入的计算规则依次和

Stream

中的元素进行计算，因此上文介绍的

min

、

max

都可以看做是

reduce

的一种实现。

举个栗子：

IntStream is = IntStream.range(0, 10);
System.out.println(is.reduce(0, Integer::sum));

IntStream intStream = IntStream.range(0, 10);
System.out.println(intStream.reduce((o1, o2) -> o1 + o2));

Stream<String> stream = Stream.of("Hello", "World", "Jiaming", "Chen");
System.out.println(stream.reduce("", String::concat));

第一个

IntStream

调用的

reduce

方法设置了一个初始值，因此最终

reduce

计算的结果一定有值，该方法调用

Integer

的类方法

sum

用于计算

Stream

的总和。

第二个

IntStream

调用

reduce

方法时没有设置初始值，因此最终

reduce

计算的结果不一定有值，所以返回值类型是

Optional

类型，没有提供初始值时会自动将第一个和第二个元素先进行计算，但有可能不存在第一个或第二个元素，因此返回值是

Optional

类型。

Stream API的性能

这篇文章详细测试了

Stream API

的性能Java Stream API性能测试。

总的来说，对于复杂计算并且拥有多核CPU来说，使用

Stream API

进行并发计算速度最快，也推荐使用。对于计算比较简单，手工外部迭代性能更加。单核CPU尽量不要使用并发的

Stream API

计算。如果没有太高的性能要求，想要编写出简洁的代码还是推荐使用

Stream API

。

备注

由于作者水平有限，难免出现纰漏，如有问题还请不吝赐教。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： java lambda 函数式

相关文章推荐

新的分享

章节导航