Java 的多态在 JVM 里原来是这样的

2014 年 8 月 24 日

多态

面向对象的编程语言里，「多态
」是一个至关重要的概念。我们常说，面向对象的本质，是 方法与数据的绑定
。那对于一个拥有继承关系的类之间，方法的绑定，是终是子类「重写」父类的方法，通过父类的引用指向子类的对象，实现运行时的多态。
说起来比较绕，我们先以仅次于Hello World 著名的「动物 – 狗」代码来说明多态，然后再来分析在 JVM 层面，多态是怎样实现的。

package com.example.demo;

public class Demo {

    public static void main(String[] args) {

        Animal a = new Animal();

        a.say();

        Dog d = new Dog();

        d.say();

        Animal ad = new Dog();

        ad.say();

    }

}

class Animal {

    public void say() {

        System.out.println("Animal say");

    }

    public void play() {

        System.out.println("play...");

    }

}

class Dog extends Animal {

    public void say() {

        System.out.println("Dog say");

    }

}

输出的内容对于习惯了面向对象的 Java 开发者来说都比较熟悉

Animal say Dog say Dog say

那虚拟机是怎样知道到底要调用 Animal 的 say 还是 Dog 的say呢？
咱们从字节码的层面来看一下。

0 new #2 3 dup 4 invokespecial #3 <com/example/demo/Animal.> 7 astore_1 8 aload_1 9 invokevirtual #4 12 new #5 15 dup 16 invokespecial #6 <com/example/demo/Dog.> 19 astore_2 20 aload_2 21 invokevirtual #7 24 new #5 27 dup 28 invokespecial #6 <com/example/demo/Dog.> 31 astore_3 32 aload_3 33 invokevirtual #4 36 return

你发现没有，在字节码的第9行，和第33行，分别对应到 d.say() 和 ad.say() ,但指令内容其实是一样的。这就神奇了。

在这两个方法执行前，第8行和第32行，会有一个aload的操作，前面的文章里有介绍过(

看看 JVM 是怎样消化字节码指令的 ~~

)，是把这两个对象的引用压到栈顶，给后面的操作用。这两个对象，一般也被称为方法的接收者(Receiver)，如果熟悉 Golang等语言的朋友，对这个概念也不陌生。

从9行和第33行看，无论是方法调用的字节码指令还是参数，都指向了常量池的第4项。都是一样的，但最终结果并不相同。这里的重点在于 invokevirtual 这个指令的多态指行查找过程，即根据对象的
vtable

在运行时定位方法。

啥是 vtable？

前面的内容提到指令执行时从栈顶获取当前方法的「 接收者
」，通过invokerirtual 来执行这个接者者对应的方法。注意这里的 virtual，和C++的虚方法类似。这个咱们不提，只说Java 的。

对象都有一个自己的「方法表」，这个表里除了自己的方法，还有从父类继承来的方法，甚至重写的父类的方法。所以，对应于重写
与重载
，体现在方法表里也有所区别。每个子类继承父类的时候，都将直接复制一份父类的方法表，而对于父类方法的重写，会直接更新方法表里相同顺序的这个方法。

而重载，本质上由于签名及参数的区别，是一个新的方法，在方法表里会是新增一个元素。

这里的这个 方法表
，就是咱们说的 vtable(Virtual Method Table)，表里的每个方法，对应的是它的实际执行入口地址。如果没有重写，那父类和子类的地址是一样的，都指向父类的实现。

如果子类重写之后，子类方法表里的这个方法的地址就指向了自己实现的版本。

而我们上面字节码处观察到的，两个 invokevirtual 对应的常量池索引序号是一样的，这样实现对于变换实现类型时，查找方法表只需要换个对象，索引依旧相同。

观察

理解了方法表大概的原理，我们来解剖下，上咱们的JVM「显微镜」（

Java虚拟机的显微镜 Serviceability Agent

）。

为了便于 Attach 到 Java 进程，可以在代码里加下 latch 进行 awiat 阻塞，启动 SA 就能观察了。

选择 ClassBrowser

在 Class列表里就能找到咱们上面创建的对象。@ 符号后面是这个对象对应的内存地址。复制上Dog的地址，再从菜单里选择Inspector，
你看 _vtable_len: 7

这是告诉我们 vtable 长度是7，里面有7个方法。
实际上咱们在这个类里只重写了父类 Animal 的 say方法，其它的是从 Animal 继承来的 play方法，以及超类 Object 里的 5个方法，大概这个样子

JVM 在首次加载类的时候，会解析类内包含的方法，方法解析之后就会计算当前类 vtable的大小。
可能你会问，Object 类内不止5个方法，为什么只算5个呢？而且我们新增其它static、 final 这一类的方法呢？
这里 vtable 只计算非static final 的，全部计算完就得出了vtable_len这个值。
每个 Java 的 Class 在 JVM 内部都会有一个自己的instanceKlass， vtable就分配在这个的最后。

整个instanceKlass的大小，在64位系统里大小是 0x1b8
，记住它，后面用的着。所以咱们上面看到了Dog 类的内存地址，继续找就能看到他其它方法对应的内存地址。
在Windows -> console 里执行这个：

mem 0x7C0060DD0 7

这个值怎么来的呢？是从对象的内存地址开始，加上 instanceKlass的大小。
0x7C0060DD0 = 0x00000007c0060c18 + 0x1b8
由于我们有7个方法，所以顺序查找7个地址。
所以你应该也发现了，Java 里对应这种重写的方法，是在类加载的时候，才能知道具体对应的是哪个方法，因此也被称为动态绑定或者迟绑定。
总结起来，这里的 vtable，相当于你的工具清单，有什么能力都做了罗列，像钢铁侠的各项技能，每个功能指向具体的超能力，在我们代码里可以把它理解成一个数组，数组的每个元素指向一个方法地址。
感兴趣的话，你加个static 的方法自己找找，看看在不在这里面呢？毕竟static方法执行不是有 invokestatic 指令嘛。
看点别的

怎样计算一个Java对象大小？这儿有几种方法~

听保洁的老大爷讲Java的垃圾回收

俯瞰Java 虚拟机

在 Java 里创建一个对象要经过哪些步骤？

看看 JVM 是怎样消化字节码指令的 ~~

你写下的try-catch-finally，在JVM看来不过是…

理解了1+2的过程，就理解了Java虚拟机

问题诊断神器BTrace

Java七武器系列霸王枪 — 线程状态分析 jstack

Tomcat的异步Servlet实现原理

监控诊断工具 Arthas 源码原理分析

Java虚拟机的显微镜 Serviceability Agent