在單一的服務器上執行WEB應用程序有一些重大的問題當網站成功建成並開始接受大量請求時單一服務器終究無法滿足需要處理的負荷量所以就有點顯得有點力不從心了
另外一個常見的問題是會產生單點故障如果該服務器壞掉那麼網站就立刻無法運作了不論是因為要有較佳的擴充性還是容錯能力我們都會想在一台以上的服務器計算機上執行WEB應用程序所以這時候我們就需要用到集群這一門技術了
在進入集群系統架構探討之前先定義一些專門術語
集群(Cluster)是一組獨立的計算機系統構成一個松耦合的多處理器系統它們之間通過網絡實現進程間的通信應用程序可以通過網絡共享內存進行消息傳送實現分布式計算機
負載均衡(Load Balance)先得從集群講起集群就是一組連在一起的計算機從外部看它是一個系統各節點可以是不同的操作系統或不同硬件構成的計算機如一個提供Web服務的集群對外界來看是一個大Web服務器不過集群的節點也可以單獨提供服務
特點在現有網絡結構之上負載均衡提供了一種廉價有效的方法擴展服務器帶寬和增加吞吐量加強網絡數據處理能力提高網絡的靈活性和可用性集群系統(Cluster)主要解決下面幾個問題
高可靠性(HA)利用集群管理軟件當主服務器故障時備份服務器能夠自動接管主服務器的工作並及時切換過去以實現對用戶的不間斷服務
高性能計算(HP)即充分利用集群中的每一台計算機的資源實現復雜運算的並行處理通常用於科學計算領域比如基因分析化學分析等
負載平衡即把負載壓力根據某種算法合理分配到集群中的每一台計算機上以減輕主服務器的壓力降低對主服務器的硬件和軟件要求
目前比較常用的負載均衡技術主要有
基於DNS的負載均衡
通過DNS服務中的隨機名字解析來實現負載均衡在DNS服務器中可以為多個不同的地址配置同一個名字而最終查詢這個名字的客戶機將在解析這個名字時得到其中一個地址因此對於同一個名字不同的客戶機會得到不同的地址他們也就訪問不同地址上的Web服務器從而達到負載均衡的目的
反向代理負載均衡 (如Apache+JK+Tomcat這種組合)
使用代理服務器可以將請求轉發給內部的Web服務器讓代理服務器將請求均勻地轉發給多台內部Web服務器之一上從而達到負載均衡的目的這種代理方式與普通的代理方式有所不同標准代理方式是客戶使用代理訪問多個外部Web服務器而這種代理方式是多個客戶使用它訪問內部Web服務器因此也被稱為反向代理模式
基於NAT(Network Address Translation)的負載均衡技術 (如Linux Virtual Server簡稱LVS)
網絡地址轉換為在內部地址和外部地址之間進行轉換以便具備內部地址的計算機能訪問外部網絡而當外部網絡中的計算機訪問地址轉換網關擁有的某一外部地址時地址轉換網關能將其轉發到一個映射的內部地址上因此如果地址轉換網關能將每個連接均勻轉換為不同的內部服務器地址此後外部網絡中的計算機就各自與自己轉換得到的地址上服務器進行通信從而達到負載分擔的目的
介紹完上面的集群技術之後下面就基於Tomcat的集群架構方案進行說明
上面是采用了Apache httpd作為web服務器的即作為Tomcat的前端處理器根據具體情況而定有些情況下是不需要Apache httpd作為 web 服務器的如系統展現沒有靜態頁面那就不需要Apache httpd那時可以直接使用Tomcat作為web 服務器來使用使用Apache httpd主要是它在處理靜態頁面方面的能力比Tomcat強多了
用戶的網頁浏覽器做完本地 DNS和企業授權的DNS之的請求/響應後這時候企業授權的DNS(即cn BOSS DNS)會給用戶本地的DNS服務器提供一個NAT請求分配器(即網關)IP
NAT分配器它會根據特定的分配算法來決定要將連接交給哪一台內部 Apache httpd來處理請求大多數的NAT請求分配器提供了容錯能力根據偵測各種WEB服務器的失效狀況停止將請求分配給已經宕掉的服務器並且有些分配器還可以監測到WEB服務器機器的負載情況並將請求分配給負載最輕的服務器等等Linux Virtual Server是一個基於Linux操作系統上執行的VSNAT開源軟件套件而且它有豐富的功能和良好的說明文件商業硬件解決方案 Foundry Networks的ServerIron是目前業界公認最佳的請求分配器之一
Apache httpd + Mod_JK在這裡是作為負載均衡器那為什麼要做集群呢?如果集群系統要具備容錯能力以便在任何單一的硬件或軟件組件失效時還能%可用那麼集群系統必須沒有單點故障之憂所以不能只架設一台有mod_jk的Apache httpd因為如果 httpd或mod_jk失效了將不會再有請求被會送交到任何一個Tomcat 實例這種情況下Apache httpd就是瓶勁特別在訪問量大的網站
Mod_JK負載均衡與故障復原決定把Apache httpd當成web服務器而且使用mod_jk將請求傳送給Tomcat則可以使用mod_jk的負載均衡與容錯功能在集群系統中帶有mod_jk的Apache httpd可以做的事情包括
A 將請求分配至一或多個Tomcat實例上
你可以在mod_jk的workersproperties文件中設定許多Tomcat實例並賦於每個實例一個lb_factor值以作為請求分配的加權因子
B偵測Tomcat實例是否失敗
當Tomcat實例的連接器服務不再響應時mod_jk會及時偵測到並停止將請求送給它其他的Tomcat實例則會接受失效實例的負載
C偵測Tomcat實例在失效後的何時恢復
因連接器服務失效而停止將請求分配給Tomcat實例之後mod_jk會周期性地檢查是否已恢復使用性並自動將其加入現行的Tomcat實例池中
Tomcat中的集群原理是通過組播的方式進行節點的查找並使用TCP連接進行會話的復制這裡提示一下就是對每個請求的處理Tomcat都會進行會話復制復制後的會話將會慢慢變得龐大
Mod_jk同時支持會話親和和會話復制在tomcat 中如何實現會話親和和會話復制?把serverxml中的標簽去掉就實現會話親和把標簽加上就實現會話復制
會話親和就是表示來自同會話的所有請求都由相同的Tomcat 實例來處理這種情況下如果Tomcat實例或所執行的服務器機器失效也會喪失Servlet的會話數據即使在集群系統中執行更多的Tomcat實例也永遠不會復制會話數據這樣是提高集群性能的一種方案但不具備有容錯能力了
使用會話復制則當一個Tomcat實例宕掉時由於至少還有另一個Tomcat實例保有一份會話狀態數據因而數據不會喪失但性能會有所降低
From:http://tw.wingwit.com/Article/program/Java/ky/201311/27887.html