您的位置:首页 > 编程语言 > Java开发

Java8揭秘(二)Java 8中的 Lambda表达式

2014-04-21 01:36 453 查看

第一章:Java8中的Lambda表达式

在这一章,我们说一说Lambda表达式的语法。我们将从经典的Java语法过渡到新式的Lambda表达式语法。

我们也会讲一讲Lambda表达式的原理-即在运行时Lambda表达式如何表示,涉及哪些字节码指令。

入门

如果你熟悉Groovy或者Ruby这些支持Lambda表达式的编程语言,那么你一开始可能会认为Java的Lambda表达式并不像其他编程语言中的那样简洁。在java中,Lambda表达式是SAM类型,SAM类型是一个具有单一抽象方法的接口。(对了,Java8接口可以包含非抽象方法了-即default/defender方法,我们将在后面讲到它)

举个例子,众所周知的Runnable接口就是SAM类型的:

Runnabler=()->System.out.println("helloLambda!");

Comparator接口也算一个:

Comparatorcmp=(x,y)->(x<y)?-1:((x>y)?1:0);

像下面这样写也可以:

Comparatorcmp=(x,y)->{

	return(x<y)?-1:((x>y)?1:0);

};

如此看来上面单行的Lambda表达式中隐含有return关键词。

我来用下面的例子提示一下,使用Java8之前的语法,如何实现同样的比较器代码:
Comparatorcmp=newComparator(){
@Override
publicintcompare(Integerx,Integer
y){
return(x<y)?
-1:((x>y)?1:0);
}
};
如你所见,在这两个例子中有相当一部分代码是相同的,相同部分正是Comparator的比较逻辑:

(x<y)?-1:((x>
y)?1:0)
当把经典风格java语法转变为Lambda表达式语法时,我们主要关注接口方法的参数和功能逻辑。

看另外一个例子。如果我打算写一个方法,此方法接收一个Lambda表达式作为参数,那么该怎么写?嗯…你得把方法参数声明成函数接口,然后才能传递Lambda表达式进来,如下所示:

InterfaceAction{
voidrun(Stringparam);
}

publicvoidexecute(Actionaction){
action.run("Hello!");
}
如果我们想要调用execute(..)方法,那么通常地做法,给execute方法传递一个Action的匿名实现类。如下所示:

execute(newAction{

	publicvoidrun(Stringparam){

System.out.println(param);

}

});

但是因为我们现在有函数接口做参数类型,所以我们可以用下面的方式调用execute(..):

execute((Stringparam)->System.out.println(param));
实际上,可以不需要声明Lambda表达式的参数类型:

execute(param->System.out.println(param));
一般来说,Lambda表达式的类型声明规则如下:要么为所有参数声明类型,要么去掉所有参数的类型声明。

既然这个Lambda表达式仅调用一个方法,且(该方法和函数接口中定义的方法)使用相同的参数,那么可以用方法引用(methodreference)替代这个Lambda表达式。如下所示:
execute(System.out::println);
但是,如果(调用的方法)使用参数形式有变,就不能使用方法引用了,得使用完整的Lambda表达式,如下面这种情况:
execute(s->System.out.println("*"+
s+"*"));
尽管Java本质上并没有函数类型(的变量),但是上面展示的语法已经相当不错,对于在java语言中应用Lambda表达式来说,我们也算有一个非常优雅的解决方案了。

函数接口

如刚才讲的,Lambda表达式在运行期表示为一个函数接口(functionalinterface)(或者说一个SAM类型),函数接口是一种只定义了一个抽象方法的接口。尽管JDK已经有一些接口都符合函数接口定义,比如Runnable和Comparator,但是这对API演进来说是显然不够的。我们又不能到处在代码里使用像Runnable这样的接口,因为这么做不合乎逻辑。

JDK8中新增了一个包,java.util.function,这个包里有一些专门给新增的API使用的函数接口。此处就不列出所有的函数接口了,有兴趣可以自行学习下java.util.function:)

下面列出几个java.util.function中定义的接口,都非常有趣:

Consumer<T>–在T上执行一个操作,无返回结果
Supplier<T>–无输入参数,返回T的实例
Predicate<T>–输入参数为T的实例,返回boolean值
Function<T,R>–输入参数为T的实例,返回R的实例

java.util.function中新定义了超过40个函数接口。通常可以从接口的名字看出其含义。举个例子,BiFunction和上面提到的Function接口非常相似,只是唯一不同点是BiFunction有两个输入参数而Function有一个。

我们可以从那些新接口中看到另一个常见模式,该模式是在一个接口继承另一个接口的时候,把多个参数声明成同一种类型。例如,BinaryOperator继承BiFunction,目的仅仅是为了把两个输入参数声明为同类型,如下所示:

@FunctionalInterfacepublicinterfaceBinaryOperatorextendsBiFunction<T,T,T>{}

为了强调接口是函数接口,可以使用新注释@FunctionalInterface,来防止你的团队成员往这个接口里增加方法。这个注释除了在运行时使用,还给javac用来验证该接口是否真是函数接口,其内部的抽象方法是否不多于一个。

下面代码不能正常编译:

@FunctionalInterfaceinterfaceAction{

voidrun(Stringparam);

voidstop(Stringparam);

}

编译器抛出错误:

java:Unexpected@FunctionalInterfaceannotation

Actionisnotafunctionalinterface

multiplenon-overridingabstractmethodsfoundininterfaceAction

而下面的会编译通过

@FunctionalInterfaceinterfaceAction{

voidrun(Stringparam);

defaultvoidstop(Stringparam){}

}

获取变量

如果Lambda表达式需要访问非静态变量或定义在其外部的对象,那么我们会碰到一种情况,就是Lambda表达式需要获取非体内变量,此时我们称之为一种“获取态”的Lambda表达式。

思考下面比较器的例子:

intminus_one=-1;

intone=1;

intzero=0;

Comparatorcmp=(x,y)->(x<y)?minus_one:((x>y)?one:zero);

为了使Lambda表达式生效,Lambda表达式获取的变量minus_one、one和zero必须是“实质的常量”。这意味着这些变量要么应该声明成final类型,要么不能二次赋值。

返回值是Lambda表达式

虽然在上面讲到的例子中,函数接口可以用作其他某个方法的参数,然而函数接口的用法并不限于当参数,函数接口还可以用作方法的返回值。也就是说我们可以从方法返回一个Lambda表达式,如下例子:

publicclassComparatorFactory{

publicComparatormakeComparator(){

returnInteger::compareUnsigned;

}

}

上面的例子展示了一段有效的方法代码,这个方法返回了一个方法引用。然而实际上仅像那样是不能从方法中返回一个方法引用的,其实编译器还会使用invokedynamic字节码指令,生成一些代码来使它成为一个方法调用,该方法调用返回一个Comparator接口的实例对象。因此客户端代码只认为自己是在使用一个接口:

Comparatorcmp=newComparatorFactory().makeComparator();

cmp.compare(10,-5);//-1

序列化Lambda表达式

前一部分中使用的那段代码,创建了一个Comparator实例对象,该实例对象可以让客户端代码使用。所有工作看似相当成功。但是,有个严重的问题,即是如果我们尝试序列化那个Comparator实例对象,代码就会抛出NotSerializableException异常。

因为序列化可能存在安全隐患,所以默认情况下,Lambda表达式不能序列化。为了能序列化,java8引入了所谓的类型关联(TypeIntersection),如下所示:

publicclassComparatorFactory{

publicComparatormakeComparator(){

return(Comparator&Serializable)Integer::compareUnsigned;

}

}

Serializable接口一般认为是标记性的接口,该接口中没有声明任何方法,因此Serializable接口也可以称作ZAM类型(ZAM即ZeroAbstractMethods)。

使用类型关联的一般规则如下:

SAM&ZAM1&ZAM2&ZAM3

也就是说,如果返回结果是SAM类型的,那么我们可以用SAM类型和一个甚至多个ZAM类型“相关联”。我们现在事实上认为作为返回结果的Comparator实例对象也是Serializable类型的。

经过上面对返回结果强制转换类型后,编译器在编译后的class文件中多生成了一个方法,如下所示:

privatestaticjava.lang.Object$deserializeLambda$(java.lang.invoke.SerializedLambda);

此外,通过使用invokedynamic字节码指令策略,当通过makeComparator()方法创建一个Comparator的实例对象的时候,编译器就会调用$deserializeLambda$(..)方法。

反编译Lambda表达式

现在给大家讲一讲这背后的实现原理。当我们在代码中使用Lambda表达式的时候,同时也了解下代码实际上是怎么编译的,这会很有趣。

目前(像Java7之前的版本),如果你想在java中模仿Lambda表达式,那么你得定义一个匿名内部类。这样会在编译后生成一个相应的class文件。如果你在代码中定义多个匿名内部类,那么这些匿名类只不过是在其相应的class文件名字中增加一个数字后缀。Lambda表达式编译后会是怎样呢?

仔细思考下面的代码:

publicclassMain{

@FunctionalInterfaceinterfaceAction{

voidrun(Strings);

}

publicvoidaction(Actionaction){

action.run("Hello!");

}

publicstaticvoidmain(String[]args){

newMain().action((Strings)->System.out.print("*"+s+"*"));

}

}

编译后产生两个类文件:Main.class和Main$Action.class,但并没有生成带编号的类,带编号的类通常在匿名类编译后产生。这样在Main.class中一定有什么东西,实现了我们在main方法中定义的Lambda表达式。(我们反编译下Main.class看看究竟)

$javap-pMain


Warning:BinaryfileMaincontainscom.zt.Main

Compiledfrom"Main.java"

publicclasscom.zt.Main{

publiccom.zt.Main();

publicvoidaction(com.zt.Main$Action);

publicstaticvoidmain(java.lang.String[]);

privatestaticjava.lang.ObjectLambda$0(java.lang.String);

}

哈!在编译后的class中生成了一个方法Lambda$0!-C-V选项会给我们展示实际的字节码和常量池定义。

下面的main方法揭示了invokedynamic指令用来分派方法调用。

publicstaticvoidmain(java.lang.String[]);

Code:

0:new#4//classcom/zt/Main

3:dup

4:invokespecial#5//Method"":()V

7:invokedynamic#6,0//InvokeDynamic#0:run:()Lcom/zt/Main$Action;

12:invokevirtual#7//Methodaction:(Lcom/zt/Main$Action;)V

15:return

可以在常量池中找到引导方法,该引导方法负责在运行时把所有内容链接起来:

BootstrapMethods:

0:#40invokestaticjava/lang/invoke/LambdaMetafactory.metaFactory:(\

Ljava/lang/invoke/MethodHandles$Lookup;Ljava/lang/String;\

Ljava/lang/invoke/MethodType;Ljava/lang/invoke/MethodHandle;\

Ljava/lang/invoke/MethodHandle;Ljava/lang/invoke/MethodType;)\

Ljava/lang/invoke/CallSite;

Methodarguments:

#41invokeinterfacecom/zt/Main$Action.run:(Ljava/lang/String;)Ljava/lang/Object;

#42invokestaticcom/zt/Main.Lambda$0:(Ljava/lang/String;)Ljava/lang/Object;

#43(Ljava/lang/String;)Ljava/lang/Object;

你可以看见到处都有MethodHandle的影子,但我们现在不会深入去讲MethodHandle。到现在,我们可以确认上面说的那个定义恰恰指的是生成的方法Lambda$0。

如果我定义一个名字是Lambda$0的静态方法会这么样?Lambda$0毕竟算一个有效标识符!于是,我定义了Lambda$0方法,如下所示:

PublicstaticvoidLambda$0(Strings){

return
null
;

}

结果编译失败,不允许我在代码中定义Lambda$0方法。

java:thesymbolLambda$0(java.lang.String)conflictswitha

compiler-synthesizedsymbolincom.zt.Main

这实际上告诉我们在编译过程中,在Main类里构建其他方法前就先构建的Lambda表达式。

总结

在此为本文的第一章做一个小结。我敢肯定,Lambda表达式在不久的将来会对Java产生巨大的影响。又因为Lambda表达式语法结构相当不错,所以一旦开发者认识到像Lambda这些特性有益于提升开发效率,那么我们将会看到Lambda表达式更广泛的应用。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: