2013年3月20日 星期三

你懂 JIT compiler 了嗎?

原文網址:http://plumbr.eu/blog/do-you-get-just-in-time-compilation

還記得最後一次被寫 C 的人笑是什麼時候的事情嗎? Java 真的有夠慢、慢到他們打死也不會考慮用這樣的語言? 其實從很多方面來看,這種講法還是成立啦。 但是在大型企業的軟體骨幹中(這是 Java 的典型用途), Java 的效能絕對可以跟其他技術相抗衡。 這可能都要感謝神奇的 JIT。 在解說 JIT compile 技巧前,讓我們先多講一些它的背景。

你可能還記得,Java 是一種 interpreted language。 大多數人都知道 Java compiler(javac)跟 C 的 compiler 不一樣, 並不是直接將 Java 的原始碼 compile 成處理器的指令。 相反地,它產生的是統一規格、與機器 binary 格式無關的 bytecode。 在執行期,JVM 會 interpret bytecode, 這是為甚麼 Java 在跨平台上會這麼成功的主要原因, 你可以在某個平台上寫完、build 一份,然後在其他的平台上頭執行。

另一方面,這也產生了一些不良影響。 其中最嚴重的是 interpret 通常比直接 compile 成 平台限定的原生 binary 碼來得慢。 Sun 在 90 年代後期就已經了解這個嚴重度, 當時他們請了 Cliff Click 博士來提供解決方案。

讓我們歡迎 HotSpot 出場~~ 這個名字源自於 JVM 辨別你程式當中「hot spot」的能力, hot spot 表示 bytecode 當中經常使用到的片段。 接著它們將目標對準大範圍的最佳化、以及將程式碼 compile 成特定處理器的指令。 這些最佳化以最少的 overhead 讓影響效能的關鍵 code 有很好的效能。 在某些情況下,調整好的最佳化 JVM 效能可能超過手工的 C++ 或 C。

JVM 當中負責這些最佳化的部份稱之為 Just in Time(JIT)compiler。 它利用了一個有趣的程式特性: 大多數時間都花在少數的程式碼上,幾乎所有程式都是這樣。 有別於將你的程式碼整個 compile, JIT(Java HotSpot VM)用 interpreter 立即執行程式、 然後在執行時分析你的程式碼,找出那些 hot spot。 Then it focuses the attention of a global native-code optimizer on the hot spots. 透過避免 compile 極少執行的程式碼, Java HotSpot compiler 可以把正更多注意力放在程式中影響效能的關鍵部份。 這代表你的 compile 時間整體來說不會增加。 在程式執行中會持續動態監測 hot spot, 所以它會根據你的 application 使用方式來即時調整效能。

JIT 用了很多技術來達到效能優勢,像是去除沒用的 code、 跳過邊界值檢查、移除多餘的載入、inline method...... 等等>

下面這個例子展示了 JIT 如何使用這些技術來達到更好的效能。 第一段程式碼是開發人員寫的,第二段程式碼是 HotSpot 認定這段很「hot」, 然後用上了最佳化的魔法:

  1. 還沒作最佳化的程式碼:

     class Calculator {
         Wrapper wrapper;
         public void calculate() {
             y = wrapper.get();
             z = wrapper.get();
             sum = y + z;
         }
     }
    
     class Wrapper {
         final int value;
         final int get() {
             return value;
         }
     }
  2. 最佳化過後的程式碼:

     class Calculator {
         Wrapper wrapper;
         public void calculate() {
             y = wrapper.value;
             sum = y + y;
         }
     }
    
     class Wrapper {
         final int value;
         final int get() {
             return value;
         }
     }

第一個 class 是開發人員寫的例子,第二個是 JIT 處理過後的樣本。 這裡頭包含了幾種最佳化的技術。讓我們來看一下最終結果是怎麼做到的:

  1. 還沒最佳化的程式碼。在還沒被判定成 hot spot 時,程式碼會這樣執行:

     class Calculator {
         Wrapper wrapper;
         public void calculate() {
             y = wrapper.get();
             z = wrapper.get();
             sum = y + z;
         }
     }
  2. inline method:用 b.value 取代 wrapper.get(), 不透過函數呼叫而直接存取 wrapper.value 來減少延遲。

     class Calculator {
         Wrapper wrapper;
         public void calculate() {
             y = wrapper.value;
             z = wrapper.value;
             sum = y + z;
         }
     }
  3. 移除多餘的載入:用 z = y 取代 z = wrapper.value, 所以只存取區域變數而不是 wrapper.value 來減少延遲。

     class Calculator {
         Wrapper wrapper;
         public void calculate() {
             y = wrapper.value;
             z = y;
             sum = y + z;
         }
     }
  4. copy propagation:用 y = y 取代 z = y, 沒有必要再用一個變數 z,因為 zy 會是相等的。

     class Calculator {
         Wrapper wrapper;
         public void calculate() {
             y = wrapper.value;
             y = y;
             sum = y + y;
         }
     }
  5. 消除不用的程式碼:y = y 是不必要的,可以消滅掉。

     class Calculator {
         Wrapper wrapper;
         public void calculate() {
             y = wrapper.value;
             sum = y + y;
         }
     }

這個小例子包含了幾個 JIT 用來提昇效能的強大技術。 希望它可以有助於了解這些威力強大的概念。

喜歡這篇文章嗎?我們肚子裡頭還有一堆咧。 請訂閱我們的 RSSTwitter 吧!

下面是這篇文章用到的參考資料(不包含那兩個憤怒的 C 開發人員):

2 則留言:

  1. 5.消除不用的程式碼:y = y 是不必要的,可以消滅掉。

    class Calculator {
    Wrapper wrapper;
    public void calculate() {
    y = wrapper.value;
    sum = y + y;
    }
    }

    上頭sum = y + y;是不是打錯了?應該是sum = y + z;對嗎?

    回覆刪除
  2. 不,沒有錯,倒讓我發現是第四步有個 typo。第四步的 sum = y + z; 應該是 sum = y + y;

    也就是說 JIT 在第四步就會發現 z 根本就是沒用的變數,所以會直接用 y 取代 z。

    回覆刪除