由於現代企業對計算機系統的依賴性越來越強
計算機系統失效造成的影響往往是十分驚人的
在災難發生後
能夠快速
簡單
可靠地恢復一個立即可用的系統至關重要
有時甚至關系到企業的生死存亡!
系統失效的技術因素
導致系統失效的因素很多
大致可分為兩大類
一類是自然災害和人為破壞
另一類是計算機系統本身潛伏的一些破壞性因素
在導致計算機系統失效的各種因素中
軟件和硬件(包括磁盤)因素占
%以上
導致系統失效的主要因素依次是硬盤崩潰
計算機其它硬件損壞
系統軟件不兼容
病毒以及人為的操作失誤
●硬盤是機電設備
它的失效是遲早的事
硬盤的任何損壞都可能丟失數據甚至導致整個系統崩潰
●內存
網卡
電源乃至主板
任何一種硬件失效或遭到破壞都會使系統無法正常運轉
在這種情況下
雖然數據完好地保存在磁盤中
但是在一個失效的系統中
數據幾乎毫無用處
●今天的商業系統已經很少在大型主機單獨支持下運行
通常需要來自不同廠家的多種系統軟件協同支持
因此
軟件的升級
補丁文件甚至同一軟件小小的更新都可能導致整個系統失效
●在PC機使用初期
病毒的危害就已為大家所熟知
今天
一個信息系統如果未加任何保護即接入Internet
那麼受病毒侵襲的危險將比以往任何時候都大
更糟糕的是
病毒的危害一般不會立即表現出來
而一旦發作
往往令人措手不及
●與上述原因相比
人為操作失誤導致系統失效的可能性較小
但確實存在
典型錯誤是系統管理員誤刪系統文件
數據文件和系統目錄等
雖然計算機元器件的可靠性已經大大提高
軟硬件也提供了不同程度的容錯功能(如RAID技術
Cluster結構等)
但是面對可能導致系統失效的種種因素
系統整體抗災性一直是(並仍將是)企業主管們必須認真對待的問題
災難恢復的基本技術要求
據不完全統計
即使在歐美一些發達國家中
支持企業關鍵業務的應用系統也有一半左右以局域網方式運行
因此
災難恢復的重點也應在於此
局域網環境下的系統恢復
絕非備份數據和故障後恢復那麼簡單
一個 傅木鐘蛲幟鴉指醇蘋?應當對影響局域網正常運行的所有事件有相應的策略
從根本上說
這種恢復計劃應當包括三個重要部分
即數據保護
災難防備以及事後恢復
備份軟件
對保護數據來說
功能完善
使用靈活的備份軟件必不可少
合格的備份軟件應當具有以下功能:
保證備份數據的完整性
並具有對備份介質(如磁帶)的管理能力
數據完整性是保證系統恢復後立即可用的前提
因此
只有保證數據完整性
數據備份才有意義
超大系統的備份介質管理需要備份軟件的參與和支持
特別要求備份軟件具有
通知機制
可以提醒系統管理員何時更換備份介質
何時從備份設備中取出備份介質
為系統管理員建議介質輪換周期
備份策略等
●支持多種備份方式
可以定時自動備份
除了支持常規備份方式(完全式
增量式
差分式)以外
還可以設置備份自動啟動和停止的日期
記錄系統配置以供重用
處理備份中各種情況
等等
●支持多種校驗手段
以保證備份的正確性
備份軟件至少應當提供字節校驗
CRC (循環冗余校驗)和快速磁帶掃描等手段
還應該提供磁帶到磁帶的拷貝和比較功能
並對寫入磁帶的數據提供保護
●提供聯機數據備份功能
在聯機狀態下進行數據備份對許多系統都是一大挑戰
但是
合格的備份軟件必須具有這一功能
因為對依靠數據庫服務器管理數據的應用系統來說
這一功能必不可少
除了以上功能外
更完善的備份軟件還支持RAID容錯技術和圖像備份功能
前者保證在個別磁帶遭到破壞時
整個備份仍然可用
後者使用戶可以繞開系統
對圖像快速備份
恢復的選擇和實施
數據備份只是系統成功恢復的前提之一
恢復數據還需要備份軟件提供各種靈活的恢復選擇
如按介質
目錄樹
磁帶作業或查詢子集等不同方式做數據恢復
此外
還要認真完成一些管理工作:定期檢查
確保備份的正確性;將備份磁帶保存在異地一個安全的地方(如專門磁帶庫或銀行保險箱);按照數據增加和更新速度選擇恰當的備份周期
一般而言
部分備份周期不應該超過一個月
對客戶機/服務器環境而言
傳統的針對大型主機的恢復策略很少奏效
客戶機/服務器環境恢復的關鍵是保護好服務器管理的數據
而服務器磁盤的安全有效又是保護數據的關鍵
因此
配備高性能
具有容錯能力的磁盤存儲器
是保護服務器的有力措施之一
自啟動恢復
系統災難通常會使企業丟失數據或者無法使用數據
利用備份軟件可以恢復丟失的數據
但是
重新使用數據並非易事
很顯然
要想重新使用數據並恢復整個系統
首先必須將服務器恢復到正常運行狀態
為了提高恢復效率
減少服務停止時間
應當使用
自啟動恢復
軟件工具
通過執行一些必要的恢復功能
自啟動恢復軟件可以確定服務器需要的配置和驅動
因此
無須重新人工安裝
配置操作系統
也不需要重新安裝
配置磁帶恢復軟件及應用程序
此外
自啟動恢復軟件還可以生成備用服務器的數據集和配置信息
以簡化備用服務器的維護
病毒防護
如果系統中潛伏著病毒
那麼即使數據和系統配置沒有丟失
服務器中的數據也毫無價值
因此
病毒防護也是災難恢復的重要內容
在數據和程序進入網絡之前
要做清毒處理
更為重要的是
要對整個網絡自動監控
防止新病毒出現和傳播
這些功能只有在強大的防病毒軟件支持下才能實現
防病毒軟件應該與其它防災方案密切配合
同時互相透明
總而言之
一個完整的災難恢復方案必須包括很強的病毒防護策略和手段
From:http://tw.wingwit.com/Article/Network/201311/29951.html