熱點推薦:
您现在的位置: 電腦知識網 >> 操作系統 >> Windows系統管理 >> 正文

NT平台雙機容錯熱備份系統的設計與實施

2013-11-11 21:51:48  來源: Windows系統管理 

  一 雙機容錯方案的比較
  
  在諸多備份手段中雙機容錯系統能夠提供在線數據備份在線容錯在線修復適時數據恢復等功能能夠保證關鍵業務的不間斷運行在 Windows NT Server的雙機熱備份軟件的選擇中目前比較常見的有以下幾種CA公司的SurviveIT (即ARCServeIT Replication For Windows NT的升級版)NCR公司的LifeKeepOctopus For Windows NTStandby Server For Windows NT和NT自帶的Cluster技術以上產品分析比較如下
  
  系統名稱 優 點 缺 點
  SurviveIT 對打開文件的備份最為完善和安全基本上能夠做到實時備份可以備份整個操作系統也可以備份單個文件或文件夾對網絡負荷影響較小操作簡單誤警率低
   不需要磁盤陣列等額外的投資 重新啟動服務器後軟件會重做數據復制時間較長
  
  
  LifeKeep 系統可靠性高不會對操作系統產生影響
   誤警率最低 系統對Windows NT操作系統的支持較弱不能備份Windows NT的操作系統
   只能備份硬盤卷
  Octopus 系統對Windows NT操作系統的支持強
   對打開文件備份較完善和安全
   切換速度快 網絡負荷大穩定性差誤警率高操作復雜
  Standby 對網絡負荷影響較小 服務器的CPU利用率高
  Cluster 與NT系統緊密集成 對備份機的要求較高要求使用磁盤陣列
  二 SurviveIT容錯軟件的介紹
  
  SurviveIT是Micrsoft Windows NT平台的服務器高可用性解決方案 它針對服務器和應用的故障提供第一級的保護使用字節級的復制技術實時地將選中的驅動器卷和/或目錄復制到一台從服務器上在關鍵服務器發生故障或者失去網絡連接時SurviveIT能在最短的延遲內立即將用戶轉移到指定的從服務器 使關鍵業務在主服務器故障恢復過程中仍可以繼續進行SurviveIT最大限度地提供了數據的可用性 從而大大減少了因服務器宕機引起的不便
  
  SurviveIT的工作原理一旦定義了某項任務SurviveIT 會將您需要保護的服務器(主服務器)和用於備用的服務器(從服務器)之間選中的驅動器卷和/或目錄同步此後的文件改動將在改動發生的同時進行復制如果主服務器出現故障不論由於何種原因SurviveIT將把客戶訪問轉移到從服務器的文件系統上 當故障排除後SurviveIT 用這些數據來恢復主服務器重新同步兩台服務器 繼續執行對主服務器的保護
  
  SurviveIT的優點SurviveIT 不是復制磁盤扇區而是文件和文件夾這使得同步和復制更加迅速和靈活使 SurviveIT 得以提供基於文件的事務完整性在線同步對用戶是透明的在建立服務器同步時通常的業務可以不受干擾地繼續進行提供對共享的透明的接管 不需要磁盤陣列等專用硬件設備SurviveIT還能夠極為迅速地同步服務器允許從服務器(在接管操作之前或之後)處理其他工作允許用單個服務器接管多台主服務器並且為裝有SurviveIT的整個網絡提供直觀的單點管理
  
  SurviveIT全面支持CA Unicenter TNGCA JasmineLotus NotesMicrosoft ExchangeMicrosoft SQL ServerMicrosoft Proxy ServerMicrosoft IISNetscape EnterpriseOracleSybase等應用程序在主從服務器接管/恢復時這些應用也能夠被自動接管/恢復從而保證了終端用戶對關鍵數據的不間斷存取
  三 SurviveIT雙機容錯方案的設計
  
  網絡服務器的現狀如下台NF服務器(NT+Oracle i)是MIS系統的心髒台NF服務器(NT+ARCserverIT)是的數據備份中心為了滿足客戶端業務對 Oracle數據庫的高可用性需求用NF作為SurviveIT的從服務器來保護 NF(作為SurviveIT的主服務器)
  
  下圖說明了使用從服務器NF保護單一主服務器 NF的配置(實際上一台從服務器可以保護多台主服務器) 要建立這樣的安裝結構系統管理員應在主從服務器上分別安裝SurviveIT(根據輸入的 licence number來確定 primary server/secondary server 的身份)並在網絡中任意一台工作站上(最好就在主/從服務器上)安裝 SurviveIT控制台組件雖然要求主從服務器的處理器內存和硬盤容量應大致相當但無需完全一致 顯然從服務器除在發生失效後接管主服務器的工作之外還必須具有足夠的能力運行其自身工作
  
  本方案中 使用一根交叉雙絞線進行備份數據的傳輸 不會影響到系統的網絡速度同時用一根串口線(null modem cable)做為檢測線檢查主用服務器是否正常工作在主用服務器出現故障時備用服務器在完成其自身任務的同時可以全面接管主用服務器的工作在主用服務器故障排除後可以方便的恢復主服務器的正常工作
  
  四 SurviveIT的安裝
  
   根據主從服務器各自獨立的功能需求分別安裝NF(NT+Oracle i)和NF(NT+ARCserverIT)服務器
   為了保護主服務器的Oracle(是被保護的關鍵應用)從服務器NF 必須有足夠的硬盤空間同時用與主服務器相同的安裝路徑和相關設置在從服務器上安裝Oracle i以便從服務器具有與主服務器Oracle一致的oracle servicesregistry和文件目錄結構
   在從服務器上把所有的oracle services的startup type都改為manual在主服務器上修改listenerora文件把其中主機名(如NF)改為相應的IP地址(如從服務器上要正確設置WINS名字解析
   在主從服務器上分別安裝 SurviveIT 的所有組件 包括Server componentConsole componentAlert componentUnicenter TNG Framework component注意輸入登錄服務器的用戶名和口令必須具有本地服務器管理員權限如果該服務器位於NT 域必須輸入同時具有登錄本地服務器和NT域的管理員權限的帳號
   接下來還需要安裝從CA網站下載的SurviveIT SP升級補丁安裝步驟同上
  
  五 SurviveIT的設置與使用
  
   創建復制任務
  完成安裝後系統管理員便可設置SurviveIT使用復制任務向導(SurviveIT控制台程序的一部分)創建復制任務復制任務將定義主從服務器失效條件各種復制設置和一項或多項工作(要復制到從服務器的主服務器文件系統的一部分)
  
  打開SurviveIT Console主窗口點擊新復制任務按鈕
  
  根據提示選擇Primary server(被保護服務器)即DA
  
  單擊下一步選擇Secondary server即NF
  
  選擇被保護服務器保護級別 Full Protection 當 SurviveIT 檢測到主服務器失效時從服務器將接管失效主服務器的地位Data Protection Only 如果SurviveIT檢測到通信故障或主服務器的磁盤失效僅僅停止數據復制主服務器將不被接管選擇Full Protection
  
  選擇主從服務器之間網絡連接速度
  
  選擇包含需要被復制文件的文件夾選擇C:\Oracle(注意被保護的文件夾在主服務器上必須設置共享有些系統文件和動態鏈接庫文件(如c:\oracle\ora\jdbc\libc:\oracle\ora\dbs和所有的dll文件)由於在主從服務器上都存在並且是自安裝後始終不變的文件所以沒有必要加入復制任務
  
  選擇上一步所選擇的C:\Oracle的共享名
  
  當任務設置一覽表界面出現後還需要通過高級選項設置當網絡通信失敗後執行完全保護因此單擊高級按鈕在任務編輯樹窗口展開Failure Detection圖標單擊Communication Failure圖標
  
  在Communication Failure窗口需要指明SurviveIT如何確定主服務器失效比較好的辦法是讓主從服務器去ping 一系列附加的設備或計算機這裡選擇 Obtain Failure Confirmation via alternate route 選項Confirmation選框中選擇 Use list of Machines/Devices to confirm server failureMachines/Devices 選框單擊增加按鈕顯示 confirmation Machines/Devices 對話框 輸入缺省網關的IP地址即並確定
  
  對於Oracle數據庫的應用保護還需要設置被復制文件的目的位置為主服務器提供備用的IP地址添加使主服務器停止Oracle服務和從服務器開始Oracle服務的script
  
  設置被復制文件的目的位置因為Netfinity所安裝的Oralce數據庫程序文件在C:\oracle用戶數據文件存放在D:\Oralce和D:\data因此還需要增加個workload對Workload選擇DestinationSelect Alternate DestinationC\Transactional Integrity對Workload選擇DestinationSelect Alternate DestinationD\Transactional Integrity對Workload選擇DestinationSelect Alternate DestinationD\Transactional Integrity
  
  為主服務器提供備用的IP地址當從服務器接管主服務器的應用後也同時接管主服務器的網絡信息(如主機名IP地址等)而此時主服務器使用備用的IP地址和加_fail後綴的主機名直到主服務器被恢復目的是為了避免IP地址從突 在復制任務編輯樹窗口選擇Failover ActionPrimaryDAServer Identification在此窗口中Server Name使用缺省的DA_FAIL同時在Server IP Address窗口中雙擊主服務器IP地址以允許IP接管輸入主服務器備用的IP地址
  
  添加使主服務器停止Oracle服務和從服務器開始Oracle服務的script共有處(pre_failover_primarypost_failover_pri
From:http://tw.wingwit.com/Article/os/xtgl/201311/9356.html
    Copyright © 2005-2013 電腦知識網 Computer Knowledge   All rights reserved.