您的位置:首页 > 编程语言 > Java开发

JAVA动态绑定的内部实现机制

2012-06-11 11:33 344 查看
原文链接

JAVA动态绑定的内部实现机制
JAVA虚拟机调用一个类方法时,它会基于对象引用的类型(通常在编译时可知)来选择所调用的方法。相反,当虚拟机调用一个实例方法时,它会基于对象实际的类型(只能在运行时得知)来选择所调用的方法,这就是动态绑定,是多态的一种。动态绑定为解决实际的业务问题提供了很大的灵活性,是一种非常优美的机制。

1 JAVA对象模型

JAVA虚拟机规范并没有规定JAVA对象在堆里是如何表示的。对象的内部表示也影响着整个堆以及垃圾收集器的设计,它由虚拟机的实现者决定。
JAVA对象中包含的基本数据由它所属的类及其所有超类声明的实例变量组成。只要有一个对象引用,虚拟机就必须能够快速地定位对象实例的数据。另外,它也必须能通过该对象引用访问相应的类数据(存储于方法区的类型信息),因此在对象中通常会有一个指向方法区的指针。当程序在运行时需要转换某个对象引用为另外一种类型时,虚拟机必须要检查这种转换是否被允许,被转换的对象是否的确是被引用的对象或者它的超类型。当程序在执行instanceof操作时,虚拟机也进行了同样的检查。所以虚拟机都需要查看被引用的对象的类数据。
不管虚拟机的实现使用什么样的对象表示法,很可能每个对象都有一个方法表因为方法表加快了调用实例方法时的效率。但是JAVA虚拟机规范并未要求必须使用方法表,所以并不是所有实现中都会使用它。
下面是一种JAVA对象的内存表示:



JAVA对象内存模型
方法数据存放在类的方法区中,包含一个方法的具体实现的字节码二进制。方法指针直接指向这个方法在内存中的起始位置,通过方法指针就可以找到这个方法。

2 动态绑定内部机制

方法表是一个指向方法区中的方法指针的数组。方法表中不包含static、private等静态绑定的方法,仅仅包含那些需要动态绑定的实例方法。
在方法表中,来自超类的方法出现在来自子类的方法之前,并且排列方法指针的顺序和方法在class文件中出现的顺序相同,这种排列顺序的例外情况是,被子类的方法覆盖的方法出现在超类中该方法第一次出现的地方。
例如有超类Base和子类Derive:

[java:nogutter]
view plaincopyprint?

public class Base { public Base() { } public void test() { System.out.println( "int Base" ); } public void print() { } } public class Derive extends Base { public Derive() { } public void test() { System.out.println( "int Derive" ); } public void sayHello() { } public static void main( String[] args ) { Base base = new Derive(); base.test(); } }

public class Base
{
public Base()
{
}

public void test()
{
System.out.println( "int Base" );
}

public void print()
{
}
}

public class Derive extends Base
{
public Derive()
{
}

public void test()
{
System.out.println( "int Derive" );
}

public void sayHello()
{
}

public static void main( String[] args )
{
Base base = new Derive();
base.test();
}
}


上例中的Base和Derive的方法表如下:



在这个例子里,test()方法在Base和Derive的方法表中都是同一个位置-位置1。在Base方法表中,test()指针是Base的test()方法内存地址;而在Derive方法表中,方法表的位置1放置的是Derive的test()方法内存地址。
当JAVA虚拟机执行base.test()时,通过base引用可以找到base所指向的实际对象的内存位置,现在虚拟机不知道base引用的实际对象是Base还是Derive。但是根据上面的对象内存模型,虚拟机从对象内存中的第一个指针“特殊结构指针”开始,可以找到实际对象的类型数据和Class实例,这样虚拟机就可以知道base引用的实际对象是Derive对。为了执行test(),虚拟机需要找到test()的字节码,方法的字节码存放在方法区中。虚拟机从对象内存中的第一个指针“特殊结构指针”开始,搜寻方法表的位置1,位置1指向的test()方法是Derive类的test()方法,这就是JAVA虚拟机将要执行的test()的字节码。现在,虚拟机知道了调用的实际对象是Derive对象,调用的实际test()方法是Derive类的test()方法,所以JAVA虚拟机能够正确执行-调用base引用的实际对象的方法而不是base引用本身的方法。
这是动态绑定的一种实现方式,根据不同的JAVA虚拟机平台和不同的实际约束,动态绑定可以有不同的内部实现机制。
补充:

程序语言的后期绑定机制作法因语言的不同而不同,但必得有某种“型别信息”被置于对象内。
一、使用父类类型的引用指向子类的对象;

二、该引用只能调用父类中定义的方法和变量;

三、如果子类中重写了父类中的一个方法,那么在调用这个方法的时候,将会调用子类中的这个方法;(动态连接、动态调用)

四、变量不能被重写(覆盖),”重写“的概念只针对方法,如果在子类中”重写“了父类中的变量,那么在编译时会报错。

SUN目前的JVM实现机制,类实例的引用就是指向一个句柄(handle)的指针,这个句柄是一对指针:

一个指针指向一张表格,实际上这个表格也有两个指针(一个指针指向一个包含了对象的方法表,另外一个指向类对象,表明该对象所属的类型); 另一个指针指向一块从java堆中为分配出来内存空间。

当你使用父类引用指向子类的时候,其实jvm已经使用了编译器产生的类型信息调整转换了。 这里你可以这样理解,相当于把不是父类中含有的函数从虚拟函数表中设置为不可见的。注意有可能虚拟函数表中有些函数地址由于在子类中已经被改写了,所以对象虚拟函数表中虚拟函数项目地址已经被设置为子类中完成的方法体的地址了。

Java把类型信息和函数信息分开放。Java中在继承以后,子类会重新设置自己的虚拟函数表,这个虚拟函数表中的项目有由两部分组成。从父类继承的虚拟函数和子类自己的虚拟函数。 虚拟函数调用是经过虚拟函数表间接调用的,所以才得以实现多态的。

引用变量决定了能使用的方法,而对象决定了将使用方法的哪个定义 : new使用某个类名而创建了对象,但该对象却存储至某个祖先类的变量中;变量决定了该变量能使用什么方法,但对象创建所使用的类都决定了将使用方法的哪个定义。 此外,这一规则的特例是:形参决定对象调用哪一种方法,而实参决定对象调用方法的哪一种定义。

JVM会在链接类的过程中,给类分配相应的method table内存空间。每个类对应一个方法表。这些都是存在于method area区中的。

JVM运行时,当代码索引到一个方法时,是根据它在方法表中的偏移量来实现访问的。(第一次执行到调用指令时,会将符号索引替换为对应的直接索引,执行解析)。由于invokevirtual调用的方法,在对应的类的method table中都有固定的位置,直接索引的值可以用偏移量来表示。(符号索引解析的最终目的是完成直接索引:对象方法和对象变量的调用都是用偏移量来表示直接索引的)

假定对象o是类C1,C2,C3,...和Cn的实例,C2是C1的子类,C3是C2的子类,...,Cn是Cn-1的子类。也就是说,C1是最通用的类,Cn是最具体的类。在java中,C1是Object类。如果o调用方法p,JVM在Cn,Cn-1,Cn-2,...C2,C1中查找方法p的实现。按照这种顺序直到找到为止。一旦找到这个实现,查找将停止并且调用第一个找到的实现。

virtual dispatch机制会首先从 receiver(调用该方法的对象)的类的实现中查找对应的方法,如果没找到,则去父类查找,直到找到函数并实现调用,而不是依赖于引用类型

所以动态绑定的内存机制是:
Shape a = new Circle();
1:在堆中分配Circle内存,并初始化,设置自己的虚拟函数表(表明函数所在方法表的地址,方法的)。2:类实例的引用就是指向一个句柄(handle)的指针,这个句柄是一对指针: 一个指针指向一张表格,实际上这个表格也有两个指针(一个指针指向一个包含了对象的方法表,另外一个指向类对象,表明该对象所属的类型);
另一个指针指向一块从java堆中为分配出来内存空间。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: