在Java平台上進行多線程編程的缺陷

Java 語言的並發編程

　　就其自身來說並發編程是一種技術提供了操作的同時執行不論是在單一系統上還是分布在大量系統上這類操作實際是一些指令順序例如單獨某個頂級任務的子任務這類操作能夠並行執行或者是作為線程或者是作為進程線程和進程之間的本質區別在於進程通常是獨立的(例如獨立的地址空間)所以只能通過系統提供的進程間通信機制進行交互而線程通常共享單一進程的狀態信息能夠直接共享系統資源和內存中的對象

　　可以使用下面兩種方法之一通過多個進程來實現並發第一種方法是在同一個處理器上運行進程由操作系統處理進程之間的上下文環境切換(可以理解這種切換要比同一進程內多線程之間的上下文環境切換更慢)第二種方法是構建大規模的並行和復雜的分布式系統在不同的物理處理器上運行多個進程

　　從內建支持的角度來說Java 語言通過線程提供並發編程;每個 JVM 都能支持許多線程同時執行可以用以下兩種方法之一在 Java 語言中創建線程

　　繼承 javalangThread 類在這種情況下已經重寫的子類的 run() 方法必須包含實現線程運行時行為的代碼要執行這個代碼需要實例化子類對象然後調用對象的 start() 方法這樣就可以在內部執行 run() 方法了

　　創建 Runnable 接口的定制實現這個接口只包含一個 run() 方法在這個方法中要放置應用程序代碼要執行這個代碼需要實例化實現類的對象然後在創建新 Thread 時把對象作為構造函數的參數傳入然後調用新創建的線程對象的 start() 方法開始執行控制的新線程

　　線程安全性和同步

　　如果 Java 對象中的某個方法能夠安全地運行在多線程環境中那麼就稱該方法是線程安全的要獲得這種安全性必須有一種機制通過該機制運行同一方法的多個線程就能夠同步其操作這樣在訪問相同的對象或代碼行時就會只允許一個線程被處理這種同步要求線程使用叫作信號的對象彼此進行溝通

　　有一種類型的信號叫作互斥信號或互斥體顧名思義這個信號對象的擁有權是互斥的也就是說在任意指定時間只有一個線程能夠擁有互斥體其他想獲得所有權的線程會被阻塞它們必須等待直到擁有互斥體的線程釋放互斥體如果多個線程按順序排隊等候同一互斥體那麼在當前擁有者釋放它的時候只有一個等候線程能夠得到它;其他線程將繼續阻塞

　　在年代初CAR Hoare 和其他人共同開發了一個叫作監視器的概念一個監視器就是一個代碼主體它的訪問受到互斥體的保護任何想執行這個代碼的線程都必須在代碼塊頂部得到關聯的互斥體然後在底部再釋放它因為在指定時間只有一個線程能夠擁有互斥體所以這就有效地保證了只有擁有它的線程才能執行監視器的代碼塊(受保護的代碼不需要相鄰 —— 例如Java 語言中的每個對象都有一個與之關聯的監視器)

　　任何想在 Java 語言中進行線程編程的開發人員都會立即把上面的內容當成 synchronized 關鍵字所帶來的效果可以確保包含在 synchronized 塊中的 Java 代碼在指定時間只被一個線程執行在內部可以由運行時將 synchronized 關鍵字轉換成某一種情況所有的競爭線程都試圖獲得與它們(指線程)正在操作的對象實例關聯的那個(惟一的一個)互斥體成功得到互斥體的線程將運行代碼然後在退出 synchronized 塊時釋放互斥體

　　等候和通知

　　wait/notify 構造在 Java 語言的線程間通信機制中也扮演了重要的角色基本的想法是一個線程需要的某個條件可以由另外一個線程促成這樣條件的 wait 就可以得到滿足一旦條件為真那麼引發條件的線程就會 notify 等候線程蘇醒並從中止的地方繼續進行

　　wait/notify 機制要比 synchronized 機制更難理解和判斷要想判斷出使用 wait/notify 的方法的行為邏輯就要求判斷出使用它的所有方法的邏輯一次判斷一個方法把該方法和其他方法隔離開是對整體系統行為得出錯誤結論的可靠方式顯然這樣做的復雜性會隨著要判斷的方法的數量增長而迅速提高

　　線程狀態

　　我前面提到過必須調用新創建的線程的 start() 方法來啟動它的執行但是僅僅是調用 start() 方法並不意味著線程會立即開始運行這個方法只是把線程的狀態從 new 變成 runnable只有在操作系統真正安排線程執行的時候線程狀態才會變成 running (從 runnable)

　　典型的操作系統支持兩種線程模型 —— 協作式和搶占式在協作式模型中每個線程對於自己對 CPU 的控制權要保留多久什麼時候放棄有最終意見在這個模型中因為可能存在某個無賴線程占住控制權不放所以其他線程可能永遠無法得到運行在搶占式模型中操作系統本身采用基於時鐘滴答的計時器基於這個計時器操作系統可以強制把控制權從一個線程轉移到另外一個線程在這種情況下決定哪個線程會得到下一次控制權的調度策略就有可能基於各種指標例如相對優先級某個線程已經等待執行的時間長短等等

　　如果出於某些原因處在 running 狀態的線程需要等候某個資源(例如等候設備的輸入數據到達或者等候某些條件已經設定的通知)或者在試圖獲得互斥體的時候被阻塞因此線程決定睡眠那麼這時它可以進入 blocked 狀態當睡眠周期到期預期輸入到達或者互斥體當前的擁有者將其釋放並通知等候線程可以再次奪取互斥體時阻塞的線程重新進入 runnable 狀態

　　當線程的 run() 方法完成時(或者正常返回或者拋出 RuntimeException 這樣的未檢測到異常)線程將終止這時線程的狀態是 dead當線程死亡時就不能通過再次調用它的 start() 方法來重新啟動它如果那麼做則會拋出 InvalidThreadStateException 異常

　　四個常見缺陷

　　正如我已經展示過的Java 語言中的多線程編程是通過語言支持的大量精心設計的構造實現的另外還設計了大量設計模式和指導原則來幫助人們了解這種復雜性帶來的許多缺陷除此之外多線程編程會很容易地在不經意間把細微的 bug 帶進多線程代碼而且更重要的是這類問題分析和調試起來非常困難接下來要介紹的是用 Java 語言進行多線程編程時將會遇到(或者可能已經遇到過)的最常見問題的一個列表

　　爭用條件

　　據說爭用條件存在於這樣的系統中多個線程之間存在對共享資源的競爭而勝出者決定系統的行為Allen Holub 在他撰寫的文章 programming Java threads in the real world 提供了一個帶有這樣 bug 的簡單的多線程程序示例在沖突的訪問請求之間進行不正確同步的另一個更可怕的後果是數據崩潰此時共享的數據結構有一部分由一個線程更新而另一部分由另一個線程更新在這種情況下系統的行為不是按照勝出線程的意圖進行系統根本不按照任何一個線程的意圖行動所以兩個線程最後都將以失敗告終

　　死鎖

　　死鎖的情況是指線程由於等候某種條件變成真(例如資源可以使用)但是它等候的條件無法變成真因為能夠讓條件變成真的線程在等候第一個線程做某件事這樣兩個線程都在等候對方先采取第一步所以都無法做事

　　活動鎖

　　活動鎖與死鎖不同它是在線程實際工作的時候發生的但這時還沒有完成工作這通常是在兩個線程交叉工作的時候發生所以第一個線程做的工作被另一個線程取消一個簡單的示例就是每個線程已經擁有了一個對象同時需要另外一個線程擁有的另外一個對象可以想像這樣的情況每個線程放下自己擁有的對象撿起另外一個線程放下的對象顯然這兩個線程會永遠都運行在上鎖這一步操作上結果是什麼都做不成(常見的真實示例就是兩個人在狹窄的走廊相遇每個人都禮貌地讓到另一邊讓對方先行但卻在相同的時間都讓到同一邊了所以兩個人還都沒法通過這種情況會持續一些時間然後兩個人都從這邊閃到那邊結果還是一點進展也沒有)

　　資源耗盡

　　資源耗盡又稱為線程耗盡是 Java 語言的 wait/notify 原語無法保證 liveness 的後果Java 強制這些方法要擁有它們等候或通知的對象的鎖在某個線程上調用的 wait() 方法在開始等候之前必須釋放監視器鎖然後在從方法返回並獲得通知之後必須再次重新獲得鎖因此Java 語言規范在鎖本身之外還描述了一套與每個對象相關的等候集(wait set)一旦線程釋放了對象上的鎖(在 wait 的調用之後)線程就會放在這個等候集上

　　多數 JVM 實現把等候線程放在隊列中所以如果在通知發生的時候還有其他線程在等候監視器那麼就會把一個新線程放在隊列尾部而它並不是下一個獲得鎖的線程所以等到被通知線程實際得到監視器的時候通知該線程的條件可能已經不再為真所以它不得不再次 wait這種情況可能無限持續下去從而造成運算工作上浪費(因為要反復把該線程放入等候集和從中取出)和線程耗盡

　　貪心哲學家的寓言

　　演示這種行為的原型示例是 Peter Welch 教授描述的聰明人沒有雞肉在這個場景中考慮的系統是一所由五位哲學家一位廚師和一個食堂組成的學院所有的哲學家(除了一位)都要想想(在代碼示例中考慮的時間是秒)之後才去食堂取飯而貪心的哲學家則不想把時間浪費在思考上 —— 相反他一次又一次地回到食堂企圖拿到雞肉來吃

　　廚師按照一批四份的定量准備雞肉每准備好一批就送到食堂貪心的哲學家不斷地去廚房但他總是錯過食物!事情是這樣的他第一次到的時候時間太早廚師還沒開火因此貪心的哲學家只好干等著(通過 wait() 方法調用)在開飯的時候(通過 notify() 方法調用)貪心的哲學家再一次回到食堂排隊等候但是這次在他前來等候的時候他的四位同事已經到了所以他在食堂隊列中的位置在他們後面他的同事們把廚房送來的一批四份雞肉全部拿走了所以貪心的哲學家又要在一邊等著了可憐(也可能是公平的) 他永遠處在這個循環之外

　　驗證的問題

　　一般來說很難按照普通的規范對 Java 編程的多線程程序進行驗證同樣開發自動化工具對於常見的並發問題(例如死鎖活動鎖和資源耗盡)進行完整而簡單的分析也不太容易——特別是在任意 Java 程序中或者在缺乏並發的正式模型的時候

　　更糟的是並發性問題出了名的變化多端難於跟蹤每個 Java 開發人員都曾經聽說過(或者親自編寫過)這樣的 Java 程序經過嚴格分析而且正常運行了相當一段時間沒有表現出潛在的死鎖然後突然有一天問題發生了結果弄得開發團隊經歷許多的不眠之夜來試圖發現並修補根本原因

　　一方面多線程 Java 程序容易發生的錯誤非常不明顯有可能在任意什麼時候發生另一方面完全有可能這些 bug 在程序中從不出現問題取決於一些不可知的因素多線程程序的復雜本質使得人們很難有效地對其進行驗證沒有一套現成的規則可以找出多線程代碼中的這類問題也無法確切地證明這些問題不存在這些導致許多 Java 開發人員完全避開多線程應用程序的設計和開發即使用並發和並行的方式對系統進行建模會非常棒他們也不使用多線程

　　確實想進行多線程編程的開發人員通常准備好了以下一個或兩個解決方案(至少是一部分)

　　長時間艱苦地測試代碼找出所有出現的並發性問題誠心地希望到應用程序真正運行地時候已經發現並修復了所有這類問題

　　大量運行設計模式和為多線程編程建立的指導原則但是這類指導原則只在整個系統都按照它們的規范設計的時候才有效沒有設計規則能夠覆蓋所有類型的系統

　　雖然知道的人不多但是對於編寫(然後驗證)正確的多線程應用程序這一問題還有第三個選項使用稱為通信順序進程( Communicating Sequential ProcessesCSP)的精確的線程同步的數學理論可以在設計時最好地處理死鎖和活動鎖之類的問題CSP 由 CAR Hoare 與世紀年代後期設計CSP 提供了有效的方法證明用它的構造和工具構建的系統可以免除並發的常見問題

　　結束語

　　在這份面向 Java 程序員的 CSP 全面介紹中我把重點放在克服多線程應用程序開發常見問題的第一步上即了解這些問題我介紹了 Java 平台上目前支持的多線程編程構造解釋了它們的起源討論了這類程序可能會有的問題我還解釋了用正式理論在任意的大型的和復雜的應用程序中清除這些問題(即競爭冒險死鎖活動鎖和資源耗盡)或者證明這些問題不存在的困難

From:http://tw.wingwit.com/Article/program/Java/gj/201311/27627.html