原文網址:http://plumbr.eu/blog/do-you-get-just-in-time-compilation
還記得最後一次被寫 C 的人笑是什麼時候的事情嗎? Java 真的有夠慢、慢到他們打死也不會考慮用這樣的語言? 其實從很多方面來看,這種講法還是成立啦。 但是在大型企業的軟體骨幹中(這是 Java 的典型用途), Java 的效能絕對可以跟其他技術相抗衡。 這可能都要感謝神奇的 JIT。 在解說 JIT compile 技巧前,讓我們先多講一些它的背景。
你可能還記得,Java 是一種 interpreted language。
大多數人都知道 Java compiler(javac
)跟 C 的 compiler 不一樣,
並不是直接將 Java 的原始碼 compile 成處理器的指令。
相反地,它產生的是統一規格、與機器 binary 格式無關的 bytecode。
在執行期,JVM 會 interpret bytecode,
這是為甚麼 Java 在跨平台上會這麼成功的主要原因,
你可以在某個平台上寫完、build 一份,然後在其他的平台上頭執行。
另一方面,這也產生了一些不良影響。 其中最嚴重的是 interpret 通常比直接 compile 成 平台限定的原生 binary 碼來得慢。 Sun 在 90 年代後期就已經了解這個嚴重度, 當時他們請了 Cliff Click 博士來提供解決方案。
讓我們歡迎 HotSpot 出場~~ 這個名字源自於 JVM 辨別你程式當中「hot spot」的能力, hot spot 表示 bytecode 當中經常使用到的片段。 接著它們將目標對準大範圍的最佳化、以及將程式碼 compile 成特定處理器的指令。 這些最佳化以最少的 overhead 讓影響效能的關鍵 code 有很好的效能。 在某些情況下,調整好的最佳化 JVM 效能可能超過手工的 C++ 或 C。
JVM 當中負責這些最佳化的部份稱之為 Just in Time(JIT)compiler。 它利用了一個有趣的程式特性: 大多數時間都花在少數的程式碼上,幾乎所有程式都是這樣。 有別於將你的程式碼整個 compile, JIT(Java HotSpot VM)用 interpreter 立即執行程式、 然後在執行時分析你的程式碼,找出那些 hot spot。 Then it focuses the attention of a global native-code optimizer on the hot spots. 透過避免 compile 極少執行的程式碼, Java HotSpot compiler 可以把正更多注意力放在程式中影響效能的關鍵部份。 這代表你的 compile 時間整體來說不會增加。 在程式執行中會持續動態監測 hot spot, 所以它會根據你的 application 使用方式來即時調整效能。
JIT 用了很多技術來達到效能優勢,像是去除沒用的 code、 跳過邊界值檢查、移除多餘的載入、inline method...... 等等>
下面這個例子展示了 JIT 如何使用這些技術來達到更好的效能。 第一段程式碼是開發人員寫的,第二段程式碼是 HotSpot 認定這段很「hot」, 然後用上了最佳化的魔法:
還沒作最佳化的程式碼:
class Calculator { Wrapper wrapper; public void calculate() { y = wrapper.get(); z = wrapper.get(); sum = y + z; } } class Wrapper { final int value; final int get() { return value; } }
最佳化過後的程式碼:
class Calculator { Wrapper wrapper; public void calculate() { y = wrapper.value; sum = y + y; } } class Wrapper { final int value; final int get() { return value; } }
第一個 class 是開發人員寫的例子,第二個是 JIT 處理過後的樣本。 這裡頭包含了幾種最佳化的技術。讓我們來看一下最終結果是怎麼做到的:
還沒最佳化的程式碼。在還沒被判定成 hot spot 時,程式碼會這樣執行:
class Calculator { Wrapper wrapper; public void calculate() { y = wrapper.get(); z = wrapper.get(); sum = y + z; } }
inline method:用
b.value
取代wrapper.get()
, 不透過函數呼叫而直接存取wrapper.value
來減少延遲。class Calculator { Wrapper wrapper; public void calculate() { y = wrapper.value; z = wrapper.value; sum = y + z; } }
移除多餘的載入:用
z = y
取代z = wrapper.value
, 所以只存取區域變數而不是wrapper.value
來減少延遲。class Calculator { Wrapper wrapper; public void calculate() { y = wrapper.value; z = y; sum = y + z; } }
copy propagation:用
y = y
取代z = y
, 沒有必要再用一個變數z
,因為z
跟y
會是相等的。class Calculator { Wrapper wrapper; public void calculate() { y = wrapper.value; y = y; sum = y + y; } }
消除不用的程式碼:
y = y
是不必要的,可以消滅掉。class Calculator { Wrapper wrapper; public void calculate() { y = wrapper.value; sum = y + y; } }
這個小例子包含了幾個 JIT 用來提昇效能的強大技術。 希望它可以有助於了解這些威力強大的概念。
喜歡這篇文章嗎?我們肚子裡頭還有一堆咧。 請訂閱我們的 RSS 或 Twitter 吧!
下面是這篇文章用到的參考資料(不包含那兩個憤怒的 C 開發人員):
5.消除不用的程式碼:y = y 是不必要的,可以消滅掉。
回覆刪除class Calculator {
Wrapper wrapper;
public void calculate() {
y = wrapper.value;
sum = y + y;
}
}
上頭sum = y + y;是不是打錯了?應該是sum = y + z;對嗎?
不,沒有錯,倒讓我發現是第四步有個 typo。第四步的 sum = y + z; 應該是 sum = y + y;
回覆刪除也就是說 JIT 在第四步就會發現 z 根本就是沒用的變數,所以會直接用 y 取代 z。