Don'tCare: 你懂 JIT compiler 了嗎？

原文網址：http://plumbr.eu/blog/do-you-get-just-in-time-compilation

還記得最後一次被寫 C 的人笑是什麼時候的事情嗎？ Java 真的有夠慢、慢到他們打死也不會考慮用這樣的語言？其實從很多方面來看，這種講法還是成立啦。但是在大型企業的軟體骨幹中（這是 Java 的典型用途）， Java 的效能絕對可以跟其他技術相抗衡。這可能都要感謝神奇的 JIT。在解說 JIT compile 技巧前，讓我們先多講一些它的背景。

你可能還記得，Java 是一種 interpreted language。大多數人都知道 Java compiler（javac）跟 C 的 compiler 不一樣，並不是直接將 Java 的原始碼 compile 成處理器的指令。相反地，它產生的是統一規格、與機器 binary 格式無關的 bytecode。在執行期，JVM 會 interpret bytecode，這是為甚麼 Java 在跨平台上會這麼成功的主要原因，你可以在某個平台上寫完、build 一份，然後在其他的平台上頭執行。

另一方面，這也產生了一些不良影響。其中最嚴重的是 interpret 通常比直接 compile 成平台限定的原生 binary 碼來得慢。 Sun 在 90 年代後期就已經了解這個嚴重度，當時他們請了 Cliff Click 博士來提供解決方案。

讓我們歡迎 HotSpot 出場～～這個名字源自於 JVM 辨別你程式當中「hot spot」的能力， hot spot 表示 bytecode 當中經常使用到的片段。接著它們將目標對準大範圍的最佳化、以及將程式碼 compile 成特定處理器的指令。這些最佳化以最少的 overhead 讓影響效能的關鍵 code 有很好的效能。在某些情況下，調整好的最佳化 JVM 效能可能超過手工的 C++ 或 C。

JVM 當中負責這些最佳化的部份稱之為 Just in Time（JIT）compiler。它利用了一個有趣的程式特性：大多數時間都花在少數的程式碼上，幾乎所有程式都是這樣。有別於將你的程式碼整個 compile， JIT（Java HotSpot VM）用 interpreter 立即執行程式、然後在執行時分析你的程式碼，找出那些 hot spot。 Then it focuses the attention of a global native-code optimizer on the hot spots. 透過避免 compile 極少執行的程式碼， Java HotSpot compiler 可以把正更多注意力放在程式中影響效能的關鍵部份。這代表你的 compile 時間整體來說不會增加。在程式執行中會持續動態監測 hot spot，所以它會根據你的 application 使用方式來即時調整效能。

JIT 用了很多技術來達到效能優勢，像是去除沒用的 code、跳過邊界值檢查、移除多餘的載入、inline method...... 等等>

下面這個例子展示了 JIT 如何使用這些技術來達到更好的效能。第一段程式碼是開發人員寫的，第二段程式碼是 HotSpot 認定這段很「hot」，然後用上了最佳化的魔法：

還沒作最佳化的程式碼：

 class Calculator {
     Wrapper wrapper;
     public void calculate() {
         y = wrapper.get();
         z = wrapper.get();
         sum = y + z;
     }
 }

 class Wrapper {
     final int value;
     final int get() {
         return value;
     }
 }

最佳化過後的程式碼：

 class Calculator {
     Wrapper wrapper;
     public void calculate() {
         y = wrapper.value;
         sum = y + y;
     }
 }

 class Wrapper {
     final int value;
     final int get() {
         return value;
     }
 }

第一個 class 是開發人員寫的例子，第二個是 JIT 處理過後的樣本。這裡頭包含了幾種最佳化的技術。讓我們來看一下最終結果是怎麼做到的：

還沒最佳化的程式碼。在還沒被判定成 hot spot 時，程式碼會這樣執行：

 class Calculator {
     Wrapper wrapper;
     public void calculate() {
         y = wrapper.get();
         z = wrapper.get();
         sum = y + z;
     }
 }

inline method：用 b.value 取代 wrapper.get()，不透過函數呼叫而直接存取 wrapper.value 來減少延遲。

 class Calculator {
     Wrapper wrapper;
     public void calculate() {
         y = wrapper.value;
         z = wrapper.value;
         sum = y + z;
     }
 }

移除多餘的載入：用 z = y 取代 z = wrapper.value，所以只存取區域變數而不是 wrapper.value 來減少延遲。

 class Calculator {
     Wrapper wrapper;
     public void calculate() {
         y = wrapper.value;
         z = y;
         sum = y + z;
     }
 }

copy propagation：用 y = y 取代 z = y，沒有必要再用一個變數 z，因為 z 跟 y 會是相等的。

 class Calculator {
     Wrapper wrapper;
     public void calculate() {
         y = wrapper.value;
         y = y;
         sum = y + y;
     }
 }

消除不用的程式碼：y = y 是不必要的，可以消滅掉。

 class Calculator {
     Wrapper wrapper;
     public void calculate() {
         y = wrapper.value;
         sum = y + y;
     }
 }

這個小例子包含了幾個 JIT 用來提昇效能的強大技術。希望它可以有助於了解這些威力強大的概念。

喜歡這篇文章嗎？我們肚子裡頭還有一堆咧。請訂閱我們的 RSS 或 Twitter 吧！

下面是這篇文章用到的參考資料（不包含那兩個憤怒的 C 開發人員）：

2 則留言:

Unknown2013年3月21日上午8:34
5.消除不用的程式碼：y = y 是不必要的，可以消滅掉。

class Calculator {
Wrapper wrapper;
public void calculate() {
y = wrapper.value;
sum = y + y;
}
}

上頭sum = y + y;是不是打錯了？應該是sum = y + z;對嗎？
回覆刪除
回覆
痞子軍團科技部2013年3月21日上午8:59
不，沒有錯，倒讓我發現是第四步有個 typo。第四步的 sum = y + z; 應該是 sum = y + y;

也就是說 JIT 在第四步就會發現 z 根本就是沒用的變數，所以會直接用 y 取代 z。

回覆刪除
回覆

新增留言

2013年3月20日 星期三

你懂 JIT compiler 了嗎？

2 則留言:

2013年3月20日星期三