編譯器線程安全
① 了解什麼叫做jit compiling,與傳統的編譯技術有何不同
java 應用程序的性能經常成為開發社區中的討論熱點。因為該語言的設計初衷是使用解釋的方式支持應用程序的可移植性目標,早期
Java 運行時所提供的性能級別遠低於 C 和
C++
之類的編譯語言。盡管這些語言可以提供更高的性能,但是生成的代碼只能在有限的幾種系統上執行。在過去的十年中,Java
運行時供應商開發了一些復雜的動態編譯器,通常稱作即時(Just-in-time,JIT)編譯器。程序運行時,JIT
編譯器選擇將最頻繁執行的方法編譯成本地代碼。運行時才進行本地代碼編譯而不是在程序運行前進行編譯(用 C 或
C++ 編寫的程序正好屬於後一情形),保證了可移植性的需求。有些 JIT 編譯器甚至不使用解釋程序就能編譯所有的代碼,但是這些編譯器仍然通過在程序執行時進行一些操作來保持 Java 應用程序的可移植性。
由於動態編譯技術的多項改進,在很多應用程序中,現代的 JIT 編譯器可以產生與 C 或 C++
靜態編譯相當的應用程序性能。但是,仍然有很多軟體開發人員認為 —— 基於經驗或者傳聞 ——
動態編譯可能嚴重干擾程序操作,因為編譯器必須與應用程序共享 CPU。一些開發人員強烈呼籲對 Java
代碼進行靜態編譯,並且堅信那樣可以解決性能問題。對於某些應用程序和執行環境而言,這種觀點是正確的,靜態編譯可以極大地提高 Java
性能,或者說它是惟一的實用選擇。但是,靜態地編譯 Java 應用程序在獲得高性能的同時也帶來了很多復雜性。一般的
Java 開發人員可能並沒有充分地感受到 JIT 動態編譯器的優點。
本文考察了 Java 語言靜態編譯和動態編譯所涉及的一些問題,重點介紹了實時 (RT) 系統。簡要描述了 Java
語言解釋程序的操作原理並說明了現代 JIT 編譯器執行本地代碼編譯的優缺點。介紹了 IBM 在 WebSphere Real Time 中發布的
AOT 編譯技術和它的一些優缺點。然後比較了這兩種編譯策略並指出了幾種比較適合使用 AOT
編譯的應用程序領域和執行環境。要點在於這兩種編譯技術並不互斥:即使在使用這兩種技術最為有效的各種應用程序中,它們也分別存在一些影響應用程序的優缺
點。
執行 Java 程序
Java 程序最初是通過 Java SDK 的 javac程序編譯成本地的與平台無關的格式(類文件)。可將此格式看作 Java
平台,因為它定義了執行 Java 程序所需的所有信息。Java 程序執行引擎,也稱作 Java 運行時環境(JRE),包含了為特定的本地平台實現
Java 平台的虛擬機。例如,基於 Linux 的 Intel x86 平台、Sun Solaris 平台和 AIX 操作系統上運行的 IBM
System p 平台,每個平台都擁有一個 JRE。這些 JRE 實現實現了所有的本地支持,從而可以正確執行為
Java 平台編寫的程序。
事實上,操作數堆棧的大小有實際限制,但是編程人員極少編寫超出該限制的方法。JVM 提供了安全性檢查,對那些創建出此類方法的編程人員進行通知。
Java 平台程序表示的一個重要部分是位元組碼序列,它描述了 Java
類中每個方法所執行的操作。位元組碼使用一個理論上無限大的操作數堆棧來描述計算。這個基於堆棧的程序表示提供了平台無關性,因為它不依賴任何特定本地平台
的 CPU 中可用寄存器的數目。可在操作數堆棧上執行的操作的定義都獨立於所有本地處理器的指令集。Java
虛擬機(JVM)規范定義了這些位元組碼的執行(參見 參考資料)。執行 Java 程序時,用於任何特定本地平台的任何 JRE 都必須遵守 JVM
規范中列出的規則。
因為基於堆棧的本地平台很少(Intel X87 浮點數協處理器是一個明顯的例外),所以大多數本地平台不能直接執行 Java 位元組碼。為了解決這個問題,早期的 JRE 通過解釋位元組碼來執行 Java 程序。即 JVM 在一個循環中重復操作:
◆獲取待執行的下一個位元組碼;
◆解碼;
◆從操作數堆棧獲取所需的操作數;
◆按照 JVM 規范執行操作;
◆將結果寫回堆棧。
這種方法的優點是其簡單性:JRE 開發人員只需編寫代碼來處理每種位元組碼即可。並且因為用於描述操作的位元組碼少於 255 個,所以實現的成本比較低。當然,缺點是性能:這是一個早期造成很多人對 Java 平台不滿的問題,盡管擁有很多其他優點。
解決與 C 或 C++ 之類的語言之間的性能差距意味著,使用不會犧牲可移植性的方式開發用於 Java 平台的本地代碼編譯。
編譯 Java 代碼
盡管傳聞中 Java 編程的 「一次編寫,隨處運行」
的口號可能並非在所有情況下都嚴格成立,但是對於大量的應用程序來說情況確實如此。另一方面,本地編譯本質上是特定於平台的。那麼 Java
平台如何在不犧牲平台無關性的情況下實現本地編譯的性能?答案就是使用 JIT 編譯器進行動態編譯,這種方法已經使用了十年(參見圖 1):
圖 1. JIT 編譯器
使用 JIT 編譯器時,Java
程序按每次編譯一個方法的形式進行編譯,因為它們在本地處理器指令中執行以獲得更高的性能。此過程將生成方法的一個內部表示,該表示與位元組碼不同但是其級
別要高於目標處理器的本地指令。(IBM JIT
編譯器使用一個表達式樹序列表示方法的操作。)編譯器執行一系列優化以提高質量和效率,最後執行一個代碼生成步驟將優化後的內部表示轉換成目標處理器的本
地指令。生成的代碼依賴運行時環境來執行一些活動,比如確保類型轉換的合法性或者對不能在代碼中直接執行的某些類型的對象進行分配。JIT
編譯器操作的編譯線程與應用程序線程是分開的,因此應用程序不需要等待編譯的執行。
圖 1 中還描述了用於觀察執行程序行為的分析框架,通過周期性地對線程取樣找出頻繁執行的方法。該框架還為專門進行分析的方法提供了工具,用來存儲程序的此次執行中可能不會改變的動態值。
因為這個 JIT 編譯過程在程序執行時發生,所以能夠保持平台無關性:發布的仍然是中立的 Java 平台代碼。C 和 C++ 之類的語言缺乏這種優點,因為它們在程序執行前進行本地編譯;發布給(本地平台)執行環境的是本地代碼。
挑戰
盡管通過 JIT 編譯保持了平台無關性,但是付出了一定代價。因為在程序執行時進行編譯,所以編譯代碼的時間將計入程序的執行時間。任何編寫過大型 C 或 C++ 程序的人都知道,編譯過程往往較慢。
為了克服這個缺點,現代的 JIT
編譯器使用了下面兩種方法的任意一種(某些情況下同時使用了這兩種方法)。第一種方法是:編譯所有的代碼,但是不執行任何耗時多的分析和轉換,因此可以快
速生成代碼。由於生成代碼的速度很快,因此盡管可以明顯觀察到編譯帶來的開銷,但是這很容易就被反復執行本地代碼所帶來的性能改善所掩蓋。第二種方法是:
將編譯資源只分配給少量的頻繁執行的方法(通常稱作熱方法)。低編譯開銷更容易被反復執行熱代碼帶來的性能優勢掩蓋。很多應用程序只執行少量的熱方法,因
此這種方法有效地實現了編譯性能成本的最小化。
動態編譯器的一個主要的復雜性在於權衡了解編譯代碼的預期獲益使方法的執行對整個程序的性能起多大作用。一個極端的例子是,程序執行後,您非常清楚哪些方
法對於這個特定的執行的性能貢獻最大,但是編譯這些方法毫無用處,因為程序已經完成。而在另一個極端,程序執行前無法得知哪些方法重要,但是每種方法的潛
在受益都最大化了。大多數動態編譯器的操作介於這兩個極端之間,方法是權衡了解方法預期獲益的重要程度。
Java 語言需要動態載入類這一事實對 Java
編譯器的設計有著重要的影響。如果待編譯代碼引用的其他類還沒有載入怎麼辦?比如一個方法需要讀取某個尚未載入的類的靜態欄位值。Java
語言要求第一次執行類引用時載入這個類並將其解析到當前的 JVM
中。直到第一次執行時才解析引用,這意味著沒有地址可供從中載入該靜態欄位。編譯器如何處理這種可能性?編譯器生成一些代碼,用於在沒有載入類時載入並解
析類。類一旦被解析,就會以一種線程安全的方式修改原始代碼位置以便直接訪問靜態欄位的地址,因為此時已獲知該地址。
IBM JIT
編譯器中進行了大量的努力以便使用安全而有效率的代碼補丁技術,因此在解析類之後,執行的本地代碼只載入欄位的值,就像編譯時已經解析了欄位一樣。另外一
種方法是生成一些代碼,用於在查明欄位的位置以前一直檢查是否已經解析欄位,然後載入該值。對於那些由未解析變成已解析並被頻繁訪問的欄位來說,這種簡單
的過程可能帶來嚴重的性能問題。
動態編譯的優點
動態地編譯 Java 程序有一些重要的優點,甚至能夠比靜態編譯語言更好地生成代碼,現代的 JIT 編譯器常常向生成的代碼中插入掛鉤以收集有關程序行為的信息,以便如果要選擇方法進行重編譯,就可以更好地優化動態行為。
關於此方法的一個很好的例子是收集一個特定 array操作的長度。如果發現每次執行操作時該長度基本不變,則可以為最頻繁使用的
array長度生成專門的代碼,或者可以調用調整為該長度的代碼序列。由於內存系統和指令集設計的特性,用於復制內存的最佳通用常式的執行速度通
常比用於復制特定長度的代碼慢。例如,復制 8
個位元組的對齊的數據可能需要一到兩條指令直接復制,相比之下,使用可以處理任意位元組數和任意對齊方式的一般復制循環可能需要 10 條指令來復制同樣的 8
個位元組。但是,即使此類專門的代碼是為某個特定的長度生成的,生成的代碼也必須正確地執行其他長度的復制。生成代碼只是為了使常見長度的操作執行得更快,
因此平均下來,性能得到了改進。此類優化對大多數靜態編譯語言通常不實用,因為所有可能的執行中長度恆定的操作比一個特定程序執行中長度恆定的操作要少得
多。
此類優化的另一個重要的例子是基於類層次結構的優化。例如,一個虛方法調用需要查看接收方對象的類調用,以便找出哪個實際目標實現了接收方對象的虛方法。
研究表明:大多數虛調用只有一個目標對應於所有的接收方對象,而 JIT
編譯器可以為直接調用生成比虛調用更有效率的代碼。通過分析代碼編譯後類層次結構的狀態,JIT
編譯器可以為虛調用找到一個目標方法,並且生成直接調用目標方法的代碼而不是執行較慢的虛調用。當然,如果類層次結構發生變化,並且出現另外的目標方法,
則 JIT
編譯器可以更正最初生成的代碼以便執行虛調用。在實踐中,很少需要作出這些更正。另外,由於可能需要作出此類更正,因此靜態地執行這種優化非常麻煩。
因為動態編譯器通常只是集中編譯少量的熱方法,所以可以執行更主動的分析來生成更好的代碼,使編譯的回報更高。事實上,大部分現代的
JIT
編譯器也支持重編譯被認為是熱方法的方法。可以使用靜態編譯器(不太強調編譯時間)中常見的非常主動的優化來分析和轉換這些頻繁執行的方法,以便生成更好
的代碼並獲得更高的性能。
這些改進及其他一些類似的改進所產生的綜合效果是:對於大量的 Java 應用程序來說,動態編譯已經彌補了與 C 和 C++ 之類語言的靜態本地編譯性能之間的差距,在某些情況下,甚至超過了後者的性能。
缺點
但是,動態編譯確實具有一些缺點,這些缺點使它在某些情況下算不上一個理想的解決方案。例如,因為識別頻繁執行的方法以及編譯這些方法需要時間,所以應用
程序通常要經歷一個准備過程,在這個過程中性能無法達到其最高值。在這個准備過程中出現性能問題有幾個原因。首先,大量的初始編譯可能直接影響應用程序的
啟動時間。不僅這些編譯延遲了應用程序達到穩定狀態的時間(想像 Web
伺服器經
歷一個初始階段後才能夠執行實際有用的工作),而且在准備階段中頻繁執行的方法可能對應用程序的穩定狀態的性能所起的作用也不大。如果 JIT
編譯會延遲啟動又不能顯著改善應用程序的長期性能,則執行這種編譯就非常浪費。雖然所有的現代 JVM
都執行調優來減輕啟動延遲,但是並非在所有情況下都能夠完全解決這個問題。
其次,有些應用程序完全不能忍受動態編譯帶來的延遲。如 GUI 介面之類互動式應用程序就是這樣的例子。在這種情況下,編譯活動可能對用戶使用造成不利影響,同時又不能顯著地改善應用程序的性能。
最後,用於實時環境並具有嚴格的任務時限的應用程序可能無法忍受編譯的不確定性性能影響或動態編譯器本身的內存開銷。
因此,雖然 JIT 編譯技術已經能夠提供與靜態語言性能相當(甚至更好)的性能水平,但是動態編譯並不適合於某些應用程序。在這些情況下,Java 代碼的提前(Ahead-of-time,AOT)編譯可能是合適的解決方案。
AOT Java 編譯
大致說來,Java 語言本地編譯應該是為傳統語言(如 C++ 或
Fortran)而開發的編譯技術的一個簡單應用。不幸的是,Java 語言本身的動態特性帶來了額外的復雜性,影響了 Java
程序靜態編譯代碼的質量。但是基本思想仍然是相同的:在程序執行前生成 Java 方法的本地代碼,以便在程序運行時直接使用本地代碼。目的在於避免
JIT 編譯器的運行時性能消耗或內存消耗,或者避免解釋程序的早期性能開銷。
挑戰
動態類載入是動態 JIT 編譯器面臨的一個挑戰,也是 AOT
編譯的一個更重要的問題。只有在執行代碼引用類的時候才載入該類。因為是在程序執行前進行 AOT
編譯的,所以編譯器無法預測載入了哪些類。就是說編譯器無法獲知任何靜態欄位的地址、任何對象的任何實例欄位的偏移量或任何調用的實際目標,甚至對直接調
用(非虛調用)也是如此。在執行代碼時,如果證明對任何這類信息的預測是錯誤的,這意味著代碼是錯誤的並且還犧牲了 Java 的一致性。
因為代碼可以在任何環境中執行,所以類文件可能與代碼編譯時不同。例如,一個 JVM
實例可能從磁碟的某個特定位置載入類,而後面一個實例可能從不同的位置甚至網路載入該類。設想一個正在進行 bug
修復的開發環境:類文件的內容可能隨不同的應用程序的執行而變化。此外,Java 代碼可能在程序執行前根本不存在:比如 Java
反射服務通常在運行時生成新類來支持程序的行為。
缺少關於靜態、欄位、類和方法的信息意味著嚴重限制了 Java 編譯器中優化框架的大部分功能。內聯可能是靜態或動態編譯器應用的最重要的優化,但是由於編譯器無法獲知調用的目標方法,因此無法再使用這種優化。
內聯
內聯是一種用於在運行時生成代碼避免程序開始和結束時開銷的技術,方法是將函數的調用代碼插入到調用方的函數中。但是內聯最大的益處可能是優化方可見的代碼的范圍擴大了,從而能夠生成更高質量的代碼。下面是一個內聯前的代碼示例:
int foo() { int x=2, y=3; return bar(x,y); }final int bar(int a, int b) { return a+b; }
如果編譯器可以證明這個 bar就是 foo()中調用的那個方法,則 bar中的代碼可以取代 foo()中對
bar()的調用。這時,bar()方法是 final類型,因此肯定是 foo()中調用的那個方法。甚至在一些虛調用例子中,動態 JIT
編譯器通常能夠推測性地內聯目標方法的代碼,並且在絕大多數情況下能夠正確使用。編譯器將生成以下代碼:
int foo() { int x=2, y=3; return x+y; }
在這個例子中,簡化前名為值傳播的優化可以生成直接返回
5的代碼。如果不使用內聯,則不能執行這種優化,產生的性能就會低很多。如果沒有解析
bar()方法(例如靜態編譯),則不能執行這種優化,而代碼必須執行虛調用。運行時,實際調用的可能是另外一個執行兩個數字相乘而不是相加的
bar方法。所以不能在 Java 程序的靜態編譯期間直接使用內聯。
AOT
代碼因此必須在沒有解析每個靜態、欄位、類和方法引用的情況下生成。執行時,每個這些引用必須利用當前運行時環境的正確值進行更新。這個過程可能直接影響
第一次執行的性能,因為在第一次執行時將解析所有引用。當然,後續執行將從修補代碼中獲益,從而可以更直接地引用實例、靜態欄位或方法目標。
另外,為 Java 方法生成的本地代碼通常需要使用僅在單個 JVM 實例中使用的值。例如,代碼必須調用 JVM
運行時中的某些運行時常式來執行特定操作,如查找未解析的方法或分配內存。這些運行時常式的地址可能在每次將 JVM 載入到內存時變化。因此 AOT
編譯代碼需要綁定到 JVM 的當前執行環境中,然後才能執行。其他的例子有字元串的地址和常量池入口的內部位置。
在 WebSphere Real Time 中,AOT 本地代碼編譯通過 jxeinajar工具(參見圖 2)來執行。該工具對 JAR 文件中所有類的所有方法應用本地代碼編譯,也可以選擇性地對需要的方法應用本地代碼編譯。結果被存儲到名為 Java eXEcutable (JXE) 的內部格式中,但是也可輕松地存儲到任意的持久性容器中。
您可能認為對所有的代碼進行靜態編譯是最好的方法,因為可以在運行時執行最大數量的本地代碼。但是此處可以作出一些權衡。編譯的方法越多,代碼佔用的內存
就越多。編譯後的本地代碼大概比位元組碼大 10 倍:本地代碼本身的密度比位元組碼小,而且必須包含代碼的附加元數據,以便將代碼綁定到 JVM
中,並且在出現異常或請求堆棧跟蹤時正確執行代碼。構成普通 Java 應用程序的 JAR
文件通常包含許多很少執行的方法。編譯這些方法會消耗內存卻沒有什麼預期收益。相關的內存消耗包括以下過程:將代碼存儲到磁碟上、從磁碟取出代碼並裝入
JVM,以及將代碼綁定到 JVM。除非多次執行代碼,否則這些代價不能由本地代碼相對解釋的性能優勢來彌補。
圖 2. jxeinajar
跟大小問題相違背的一個事實是:在編譯過的方法和解釋過的方法之間進行的調用(即編譯過的方法調用解釋過的方法,或者相反)可能比這兩類方法各自內部之間
進行的調用所需的開銷大。動態編譯器通過最終編譯所有由 JIT
編譯代碼頻繁調用的那些解釋過的方法來減少這項開銷,但是如果不使用動態編譯器,則這項開銷就不可避免。因此如果是選擇性地編譯方法,則必須謹慎操作以使
從已編譯方法到未編譯方法的轉換最小化。為了在所有可能的執行中都避免這個問題而選擇正確的方法會非常困難。
優點
雖然 AOT 編譯代碼具有上述的缺點和挑戰,但是提前編譯 Java 程序可以提高性能,尤其是在不能將動態編譯器作為有效解決方案的環境中。
可以通過謹慎地使用 AOT 編譯代碼加快應用程序啟動,因為雖然這種代碼通常比 JIT
編譯代碼慢,但是卻比解釋代碼快很多倍。此外,因為載入和綁定 AOT
編譯代碼的時間通常比檢測和動態編譯一個重要方法的時間少,所以能夠在程序執行的早期達到那樣的性能。類似地,互動式應用程序可以很快地從本地代碼中獲
益,無需使用引起較差響應能力的動態編譯。
RT 應用程序也能從 AOT 編譯代碼中獲得重要的收益:更具確定性的性能超過了解釋的性能。WebSphere Real Time
使用的動態 JIT 編譯器針對在 RT 系統中的使用進行了專門的調整。使編譯線程以低於 RT
任務的優先順序操作,並且作出了調整以避免生成帶有嚴重的不確定性性能影響的代碼。但是,在一些 RT 環境中,出現 JIT
編譯器是不可接受的。此類環境通常需要最嚴格的時限管理控制。在這些例子中,AOT
編譯代碼可以提供比解釋過的代碼更好的原始性能,又不會影響現有的確定性。消除 JIT
編譯線程甚至消除了啟動更高優先順序 RT 任務時發生的線程搶占所帶來的性能影響。
優缺點統計
動態(JIT)編譯器支持平台中立性,並通過利用應用程序執行的動態行為和關於載入的類及其層次結構的信息來生成高質量的代碼。但是
JIT
編譯器具有一個有限的編譯時預算,而且會影響程序的運行時性能。另一方面,靜態(AOT)編譯器則犧牲了平台無關性和代碼質量,因為它們不能利用程序的動
態行為,也不具有關於載入的類或類層次結構的信息。AOT 編譯擁有有效無限制的編譯時預算,因為 AOT
編譯時間不會影響運行時性能,但是在實踐中開發人員不會長期等待靜態編譯步驟的完成。
表 1 總結了本文討論的 Java 語言動態和靜態編譯器的一些特性:
表 1. 比較編譯技術
兩種技術都需要謹慎選擇編譯的方法以實現最高的性能。對動態編譯器而言,編譯器自身作出決策,而對於靜態編譯器,由開發人員作出選擇。讓
JIT 編譯器選擇編譯的方法是不是優點很難說,取決於編譯器在給定情形中推斷能力的好壞。在大多數情況下,我們認為這是一種優點。
因為它們可以最好地優化運行中的程序,所以 JIT 編譯器在提供穩定狀態性能方面更勝一籌,而這一點在大量的生產 Java
系統中最為重要。靜態編譯可以產生最佳的互動式性能,因為沒有運行時編譯行為來影響用戶預期的響應時間。通過調整動態編譯器可以在某種程度上解決啟動和確
定性性能問題,但是靜態編譯在需要時可提供最快的啟動速度和最高級別的確定性。表 2 在四種不同的執行環境中對這兩種編譯技術進行了比較:
表 2. 使用這些技術的最佳環境
圖 3 展示了啟動性能和穩定狀態性能的總體趨勢:
圖 3. AOT 和 JIT 的性能對比
使用 JIT 編譯器的初始階段性能很低,因為要首先解釋方法。隨著編譯方法的增多及 JIT
執行編譯所需時間的縮短,性能曲線逐漸升高最後達到性能峰值。另一方面,AOT 編譯代碼啟動時的性能比解釋的性能高很多,但是無法達到 JIT
編譯器所能達到的最高性能。將靜態代碼綁定到 JVM 實例中會產生一些開銷,因此開始時的性能比穩定狀態的性能值低,但是能夠比使用 JIT
編譯器更快地達到穩定狀態的性能水平。
沒有一種本地代碼編譯技術能夠適合所有的 Java
執行環境。某種技術所擅長的通常正是其他技術的弱項。出於這個原因,需要同時使用這兩種編譯技術以滿足 Java
應用程序開發人員的要求。事實上,可以結合使用靜態和動態編譯以便提供最大可能的性能提升 —— 但是必須具備平台無關性,它是 Java
語言的主要賣點,因此不成問題。
結束語
本文探討了 Java 語言本地代碼編譯的問題,主要介紹了 JIT 編譯器形式的動態編譯和靜態 AOT 編譯,比較了二者的優缺點。
雖然動態編譯器在過去的十年裡實現了極大的成熟,使大量的各種 Java 應用程序可以趕上或超過靜態編譯語言(如 C++ 或
Fortran)所能夠達到的性能。但是動態編譯在某些類型的應用程序和執行環境中仍然不太合適。雖然 AOT
編譯號稱動態編譯缺點的萬能解決方案,但是由於 Java 語言本身的動態特性,它也面臨著提供本地編譯全部潛能的挑戰。
這兩種技術都不能解決 Java 執行環境中本地代碼編譯的所有需求,但是反過來又可以在最有效的地方作為工具使用。這兩種技術可以相互補充。能夠恰當地使用這兩種編譯模型的運行時系統可以使很大范圍內的應用程序開發環境中的開發人員和用戶受益。
② java並發常識
1.java並發編程是什麼
1, 保證線程安全的三種方法: a, 不要跨線程訪問共享變數b, 使共享變數是final類型的c, 將共享變數的操作加上同步 2, 一開始就將類設廳搏計成線程安全的, 比在後期重新修復它,更容易。
3, 編寫多線程程序, 首先保證它是正確的, 其次再考慮性能。 4, 無狀態或只讀對象永遠是線程安全的。
5, 不要將一個共享變數 *** 在多線程環境下(無同步高伏羨或不可變性保護) 6, 多線程環境下的延遲載入需要同步的保護, 因為延遲載入會造成對象重復實例化 7, 對於volatile聲明的數值類型變數進行運算, 往往是不安全的(volatile只能保證可見性,不能保證原子性)。 詳見volatile原理與技巧中, 臟數據問題討論。
8, 當一個線程請求獲得它自己佔有的鎖時(同一把鎖的嵌套使用), 我們稱該鎖為可重入鎖。在jdk1。
5並發包中, 提供了可重入鎖的java實現-ReentrantLock。 9, 每個共享變數,都應該由一個唯一確定的鎖保護。
創建與變數相同數目的ReentrantLock, 使他們負責每個變數的線程安全。 10,雖然縮小同步塊的范圍, 可以提升系統性能。
但在保證原子性的情況下, 不可將原子操作分解成多個synchronized塊。 11, 在沒有同步的情況下, 編譯器與處理器運行時的指令執行順序可能完全出乎意料。
原因是, 編譯器或處理器為了優化自身執行效率, 而對指令進行了的重排序(reordering)。 12, 當一個線程在沒有同步的情況下讀取變數, 它可能會得到一個過期值, 但是至少它可以看到那個線程在當時設定的一個真實數值。
而不是憑空而來的值。 這種安全保證, 稱之為最低限的安全性(out-of-thin-air safety) 在開發並發應用程序時, 有時為了大幅度提高系統的吞吐量與性能, 會採用這種無保障的做法。
但是針對, 數值的運算, 仍舊是被否決的。 13, volatile變數,只能保證可見性, 無法保證原子性。
14, 某些耗時較長的網路操作或IO, 確保執行時, 不要佔有鎖。 15, 發布(publish)對象, 指的是使它能夠被當前范圍之外的代碼所使用。
(引用傳遞)對象逸出(escape), 指的是一個對象在尚未准備好時將它發布。 原則: 為防止逸出, 對象必須要被完全構造完後, 才可以被發布(最好的解決方式是採用同步) this關鍵字引用對象逸出 例子: 在構造函數中, 開啟線程, 並將自身對象this傳入線程, 造成引用傳遞。
而此時, 構造函數尚未執行完, 就會發生對象逸出了。 16, 必要時, 使用ThreadLocal變戚拍量確保線程封閉性(封閉線程往往是比較安全的, 但一定程度上會造成性能損耗)封閉對象的例子在實際使用過程中, 比較常見, 例如 hibernate openSessionInView機制, jdbc的connection機制。
17, 單一不可變對象往往是線程安全的(復雜不可變對象需要保證其內部成員變數也是不可變的)良好的多線程編程習慣是: 將所有的域都聲明為final, 除非它們是可變的。
2.Java線程並發協作是什麼
線程發生死鎖可能性很小,即使看似可能發生死鎖的代碼,在運行時發生死鎖的可能性也是小之又小。
發生死鎖的原因一般是兩個對象的鎖相互等待造成的。 在《Java線程:線程的同步與鎖》一文中,簡述死鎖的概念與簡單例子,但是所給的例子是不完整的,這里給出一個完整的例子。
/** * Java線程:並發協作-死鎖 * * @author Administrator 2009-11-4 22:06:13 */ public class Test { public static void main(String[] args) { DeadlockRisk dead = new DeadlockRisk(); MyThread t1 = new MyThread(dead, 1, 2); MyThread t2 = new MyThread(dead, 3, 4); MyThread t3 = new MyThread(dead, 5, 6); MyThread t4 = new MyThread(dead, 7, 8); t1。 start(); t2。
start(); t3。start(); t4。
start(); } } class MyThread extends Thread { private DeadlockRisk dead; private int a, b; MyThread(DeadlockRisk dead, int a, int b) { this。 dead = dead; this。
a = a; this。b = b; } @Override public void run() { dead。
read(); dead。write(a, b); } } class DeadlockRisk { private static class Resource { public int value; }。
3.如何學習Java高並發
1.學習 *** 並發框架的使用,如ConcurrentHashMAP,CopyOnWriteArrayList/Set等2.幾種並發鎖的使用以及線程同步與互斥,如ReentainLock,synchronized,Lock,CountDownLatch,Semaphore等3.線程池如Executors,ThreadPoolExecutor等4.Runable,Callable,RescureTask,Future,FutureTask等5.Fork-Join框架以上基本包含完了,如有缺漏請原諒。
4.並發編程的Java抽象有哪些呢
一、機器和OS級別抽象 (1)馮諾伊曼模型 經典的順序化計算模型,貌似可以保證順序化一致性,但是沒有哪個現代的多處理架構會提供順序一致性,馮氏模型只是現代多處理器行為的模糊近似。
這個計算模型,指令或者命令列表改變內存變數直接契合命令編程泛型,它以顯式的演算法為中心,這和聲明式編程泛型有區別。 就並發編程來說,會顯著的引入時間概念和狀態依賴 所以所謂的函數式編程可以解決其中的部分問題。
(2)進程和線程 進程抽象運行的程序,是操作系統資源分配的基本單位,是資源cpu,內存,IO的綜合抽象。 線程是進程式控制制流的多重分支,它存在於進程里,是操作系統調度的基本單位,線程之間同步或者非同步執行,共享進程的內存地址空間。
(3)並發與並行 並發,英文單詞是concurrent,是指邏輯上同時發生,有人做過比喻,要完成吃完三個饅頭的任務,一個人可以這個饅頭咬一口,那個饅頭咬一口,這樣交替進行,最後吃完三個饅頭,這就是並發,因為在三個饅頭上同時發生了吃的行為,如果只是吃完一個接著吃另一個,這就不是並發了,是排隊,三個饅頭如果分給三個人吃,這樣的任務完成形式叫並行,英文單詞是parallel。 回到計算機概念,並發應該是單CPU時代或者單核時代的說法,這個時候CPU要同時完成多任務,只能用時間片輪轉,在邏輯上同時發生,但在物理上是串列的。
現在大多數計算機都是多核或者多CPU,那麼現在的多任務執行方式就是物理上並行的。 為了從物理上支持並發編程,CPU提供了相應的特殊指令,比如原子化的讀改寫,比較並交換。
(4)平台內存模型 在可共享內存的多處理器體系結構中,每個處理器都有它自己的緩存,並且周期性的與主存同步,為什麼呢?因為處理器通過降低一致性來換取性能,這和CAP原理通過降低一致性來獲取伸縮性有點類似,所以大量的數據在CPU的寄存器中被計算,另外CPU和編譯器為了性能還會亂序執行,但是CPU會提供存儲關卡指令來保證存儲的同步,各種平台的內存模型或者同步指令可能不同,所以這里必須介入對內存模型的抽象,JMM就是其中之一。 二、編程模型抽象 (1)基於線程模型 (2)基於Actor模型 (3)基於STM軟體事務內存 …… Java體系是一個基於線程模型的本質編程平台,所以我們主要討論線程模型。
三、並發單元抽象 大多數並發應用程序都是圍繞執行任務進行管理的,任務是抽象,離散的工作單元,所以編寫並發程序,首要工作就是提取和分解並行任務。 一旦任務被抽象出來,他們就可以交給並發編程平台去執行,同時在任務抽象還有另一個重要抽象,那就是生命周期,一個任務的開始,結束,返回結果,都是生命周期中重要的階段。
那麼編程平台必須提供有效安全的管理任務生命周期的API。 四、線程模型 線程模型是Java的本質模型,它無所不在,所以Java開發必須搞清楚底層線程調度細節,不搞清楚當然就會有struts1,struts2的原理搞不清楚的基本災難(比如在struts2的action中塞入狀態,把struts2的action配成單例)。
用線程來抽象並發編程,是比較低級別的抽象,所以難度就大一些,難度級別會根據我們的任務特點有以下幾個類別 (1)任務非常獨立,不共享,這是最理想的情況,編程壓力為0。 (2)共享數據,壓力開始增大,必須引入鎖,Volatile變數,問題有活躍度和性能危險。
(3)狀態依賴,壓力再度增大,這時候我們基本上都是求助jdk 提供的同步工具。 五、任務執行 任務是一個抽象體,如果被抽象了出來,下一步就是交給編程平台去執行,在Java中,描述任務的一個基本介面是Runnable,可是這個抽象太有限了,它不能返回值和拋受檢查異常,所以Jdk5。
0有另外一個高級抽象Callable。 任務的執行在Jdk中也是一個底級別的Thread,線程有好處,但是大量線程就有大大的壞處,所以如果任務量很多我們並不能就創建大量的線程去服務這些任務,那麼Jdk5。
0在任務執行上做了抽象,將任務和任務執行隔離在介面背後,這樣我們就可以引入比如線程池的技術來優化執行,優化線程的創建。 任務是有生命周期的,所以Jdk5。
0提供了Future這個對象來描述對象的生命周期,通過這個future可以取到任務的結果甚至取消任務。 六、鎖 當然任務之間共享了數據,那麼要保證數據的安全,必須提供一個鎖機制來協調狀態,鎖讓數據訪問原子,但是引入了串列化,降低了並發度,鎖是降低程序伸縮性的原罪,鎖是引入上下文切換的主要原罪,鎖是引入死鎖,活鎖,優先順序倒置的絕對原罪,但是又不能沒有鎖,在Java中,鎖是一個對象,鎖提供原子和內存可見性,Volatile變數提供內存可見性不提供原子,原子變數提供可見性和原子,通過原子變數可以構建無鎖演算法和無鎖數據結構,但是這需要高高手才可以辦到。
5.Java高並發入門要怎麼學習
1、如果不使用框架,純原生Java編寫,是需要了解Java並發編程的,主要就是學習Doug Lea開發的那個java.util.concurrent包下面的API;2、如果使用框架,那麼我的理解,在代碼層面確實不會需要太多的去關注並發問題,反而是由於高並發會給系統造成很大壓力,要在緩存、資料庫操作上要多加考慮。
3、但是即使是使用框架,在工作中還是會用到多線程,就拿常見的CRUD介面來說,比如一個非常耗時的save介面,有多耗時呢?我們假設整個save執行完要10分鍾,所以,在save的時候,就需要採用非同步的方式,也就是單獨用一個線程去save,然後直接給前端返回200。
6.Java如何進行並發多連接socket編程呢
Java多個客戶端同時連接服務端,在現實生活中用得比較多。
同時執行多項任務,第一想到的當然是多線程了。下面用多線程來實現並發多連接。
import java。。
*; import java。io。
*; public class ThreadServer extends Thread { private Socket client; public ThreadServer(Socket c) { this。 client=c; } public void run() { try { BufferedReader in=new BufferedReader(new InputStreamReader(client。
getInputStream())); PrintWriter out=new PrintWriter(client。 getOutputStream()); Mutil User but can't parallel while (true) { String str=in。
readLine(); System。out。
println(str); out。 println("has receive。
"); out。
flush(); if (str。equals("end")) break; } client。
close(); } catch (IOException ex) { } finally { } } public static void main(String[] args)throws IOException { ServerSocket server=new ServerSocket(8000); while (true) { transfer location change Single User or Multi User ThreadServer mu=new ThreadServer(server。 accept()); mu。
start(); } } }J。
7.如何掌握java多線程,高並發,大數據方面的技能
線程:同一類線程共享代碼和數據空間,每個線程有獨立的運行棧和程序計數器(PC),線程切換開銷小。
(線程是cpu調度的最小單位)線程和進程一樣分為五個階段:創建、就緒、運行、阻塞、終止。多進程是指操作系統能同時運行多個任務(程序)。
多線程是指在同一程序中有多個順序流在執行。在java中要想實現多線程,有兩種手段,一種是繼續Thread類,另外一種是實現Runable介面.(其實准確來講,應該有三種,還有一種是實現Callable介面,並與Future、線程池結合使用。
8.java工程師需要掌握哪些知識
1.Core Java,就是Java基礎、JDK的類庫,很多童鞋都會說,JDK我懂,但是懂還不足夠,知其然還要知其所以然,JDK的源代碼寫的非常好,要經常查看,對使用頻繁的類,比如String, *** 類(List,Map,Set)等數據結構要知道它們的實現,不同的 *** 類有什麼區別,然後才能知道在一個具體的場合下使用哪個 *** 類更適合、更高效,這些內容直接看源代碼就OK了2.多線程並發編程,現在並發幾乎是寫服務端程序必須的技術,那對Java中的多線程就要有足夠的熟悉,包括對象鎖機制、synchronized關鍵字,concurrent包都要非常熟悉,這部分推薦你看看《Java並發編程實踐》這本書,講解的很詳細3.I/O,Socket編程,首先要熟悉Java中Socket編程,以及I/O包,再深入下去就是Java NIO,再深入下去是操作系統底層的Socket實現,了解Windows和Linux中是怎麼實現socket的4.JVM的一些知識,不需要熟悉,但是需要了解,這是Java的本質,可以說是Java的母體, 了解之後眼界會更寬闊,比如Java內存模型(會對理解Java鎖、多線程有幫助)、位元組碼、JVM的模型、各種垃圾收集器以及選擇、JVM的執行參數(優化JVM)等等,這些知識在《深入Java虛擬機》這本書中都有詳盡的解釋,或者去oracle網站上查看具體版本的JVM規范.5.一些常用的設計模式,比如單例、模板方法、代理、適配器等等,以及在Core Java和一些Java框架里的具體場景的實現,這個可能需要慢慢積累,先了解有哪些使用場景,見得多了,自己就自然而然會去用。
6.常用資料庫(Oracle、MySQL等)、SQL語句以及一般的優化7.JavaWeb開發的框架,比如Spring、iBatis等框架,同樣他們的原理才是最重要的,至少要知道他們的大致原理。8.其他一些有名的用的比較多的開源框架和包,ty網路框架,Apache mon的N多包,Google的Guava等等,也可以經常去Github上找一些代碼看看。
暫時想到的就這么多吧,1-4條是Java基礎,全部的這些知識沒有一定的時間積累是很難搞懂的,但是了解了之後會對Java有個徹底的了解,5和6是需要學習的額外技術,7-8是都是基於1-4條的,正所謂萬變不離其宗,前4條就是Java的靈魂所在,希望能對你有所幫助9.(補充)學會使用Git。如果你還在用SVN的話,趕緊投入Git的懷抱吧。
9.java 多線程的並發到底是什麼意思
一、多線程1、操作系統有兩個容易混淆的概念,進程和線程。
進程:一個計算機程序的運行實例,包含了需要執行的指令;有自己的獨立地址空間,包含程序內容和數據;不同進程的地址空間是互相隔離的;進程擁有各種資源和狀態信息,包括打開的文件、子進程和信號處理。線程:表示程序的執行流程,是CPU調度執行的基本單位;線程有自己的程序計數器、寄存器、堆棧和幀。
同一進程中的線程共用相同的地址空間,同時共享進進程鎖擁有的內存和其他資源。2、Java標准庫提供了進程和線程相關的API,進程主要包括表示進程的java.lang.Process類和創建進程的java.lang.ProcessBuilder類;表示線程的是java.lang.Thread類,在虛擬機啟動之後,通常只有Java類的main方法這個普通線程運行,運行時可以創建和啟動新的線程;還有一類守護線程(damon thread),守護線程在後台運行,提供程序運行時所需的服務。
當虛擬機中運行的所有線程都是守護線程時,虛擬機終止運行。3、線程間的可見性:一個線程對進程 *** 享的數據的修改,是否對另一個線程可見可見性問題:a、CPU採用時間片輪轉等不同演算法來對線程進行調度[java] view plainpublic class IdGenerator{ private int value = 0; public int getNext(){ return value++; } } 對於IdGenerator的getNext()方法,在多線程下不能保證返回值是不重復的:各個線程之間相互競爭CPU時間來獲取運行機會,CPU切換可能發生在執行間隙。
以上代碼getNext()的指令序列:CPU切換可能發生在7條指令之間,多個getNext的指令交織在一起。
③ php的幾個版本的區別
PHP5.2 以前:autoload, PDO 和 MySQLi, 類型約束
PHP5.2:JSON 支持
PHP5.3:棄用的功能,匿名函數,新增魔術方法,命名空間,後期靜態綁定,Heredoc 和 Nowdoc, const, 三元運算符,Phar
PHP5.4:Short Open Tag, 數組簡寫形式,Traits, 內置 Web 伺服器,細節修改
PHP5.5:yield, list() 用於 foreach, 細節修改
PHP5.6: 常量增強,可變函數參數,命名空間增強
④ [c++]如何編寫線程安全的DLL(轉帖)
DLL有個共同的特點就是都有一個初始化函數,一個資源釋放函數,其他幾個函數都是核心功能函數。而且這些DLL有時會被多個進程同時調用,這就牽扯到多進程的多線程調用DLL的問題。有點繞口,以下我根據我實踐中遇到的問題,分四種情況分享一下我解決此類問題的經驗:
1、動態庫只有一個導出函數。
這種情況非常少,也是最容易處理的情況。這種情況下編寫函數時,只需要考慮不要有沖突的全局數據就可以了。這里的全局數據包括了在堆中分配的數據塊和靜態全局變數等。如果存在這樣的全局數據,那麼進程中的不同線程訪問這個函數就會造成沖突。
解決辦法也很簡單,就是盡量用堆棧(stack)來解決問題。由於堆棧的所有人是線程,所以它必然是線程安全的。當然也要注意避免堆棧溢出。
我們都知道,如果要在函數再次調用時保留前一次調用的狀態,可以使用靜態變數。但如果你要保持函數的線程安全,那麼靜態變數是不能用的,因為靜態變數是全局的,是屬於進程的,也就是屬於進程內線程共享的。所以如果確實需要在同一線程中保持函數的狀態,相當於在不同次調用間傳遞參數,可以考慮使用靜態全局線程局部變數,即:
__declspec( thread ) int tls_i = 1;
該變數定義就使編譯器保證了tls_i是對應於每個線程的,即每個線程都一個tls_i的副本(),這樣必然就是線程安全的。
2、動態庫導出了多個函數,而且多個函數間存在數據傳遞。
就像前面說的,一般DLL都導出多個函數,一個初始化,一個資源釋放,其他為核心功能函數。這些函數間極有可能發生數據傳遞。如果一個初始化函數是在線程A中調用的,而核心功能函數是在線程B中調用的,那麼線程A初始化函數的資源就無法對應線程B中的核心功能,此外還有核心功能函數間的數據傳遞,這樣的DLL就不是線程安全的,必然導致錯誤。
解決辦法是由用戶(即使用DLL的人)保證這些導出函數是在一個線程中調用。但這樣會很大程度上限制介面的設計和用戶的使用自由度。所以最好的方法是函數只管自己的線程安全,不同函數傳遞數據用動態TLS,線程局部存儲。
比如:我在全局定義了一個變數,用於存儲當前線程局部存儲的index ID。
__declspec( thread ) int tls_i = 1;
當調用分配資源的函數時,調用動態TLS函數TlsAlloc,分配一個ID,將其記錄在全局的線程安全的tls_i變數,並通過TlsSetValue函數將數據保存在線程安全的區域;當調用獲取資源的函數時,通過TlsGetValue獲取資源,處理完成後,調用Tlsfree對TLS index釋放,以便新線程佔有。
這樣,只要DLL中每個函數保證其局部是線程安全的,函數間傳遞數據通過TLS(靜態和動態),就可以實現整個DLL的線程安全。
3、限制訪問DLL中某一函數的線程數目。
有時候,對於DLL中的某一個函數的訪問線程數目是有限制的,超過了限制其他線程就得等一定的時間,一定的時間過後如果還不能得到執行機會,那就返回超時。這樣的設計對用戶來說是友好的,而且很實用,有的商業程序確實是按照允許用戶訪問的通道數目來計價的。
對DLL中的函數做這樣的一個封裝,一般是簡單的待用Semaphore信號量,來解決。DLL初始化時調用CreateSemaphore函數對信號量進行初始化,其原型如下:
HANDLE CreateSemaphore(
LPSECURITY_ATTRIBUTES lpSemaphoreAttributes,
// pointer to security attributes
LONG lInitialCount, // initial count
LONG lMaximumCount, // maximum count
LPCTSTR lpName // pointer to semaphore-object name);對於信號量,它每WaitForSingleObject一次(當然是要進入),其狀態值(一個整數)就減1,使用完ReleaseSemaphore其狀態值就加1,當其狀態值為0時信號量就由有信號變為無信號。利用信號量的這一特性,我們在初始化時將信號量的初始值(第2個參數)設置為限制的線程訪問數目。在要限制訪問線程數目的函數內部,通過調用WaitForSingleOject獲取控制權,並指定一個等待時間(這個由配置文件指定),根據情況超時返回,使用完ReleaseSemaphore釋放對佔用,讓其他線程可以調用這個函數。
4、多進程情況下的多線程安全DLL。
現實情況是,多進程情況下,一般不是簡單的多進程共享一個Semaphore就可以了。多進程間需要互通很多信息。一般的解決辦法是,採用共享數據段。
#pragma data_seg("share")
int share_data;
#pragma data_seg()
通過pragam編譯器指令生成了一個名叫share的共享數據段,這樣對於變數share_data就可以多進程共享的了。